Gene Information

Name : cagY (HPF57_0557)
Accession : YP_005777271.1
Strain : Helicobacter pylori F57
Genome accession: NC_017367
Putative virulence/resistance : Virulence
Product : cag pathogenicity island protein Y VirB10-like protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 569178 - 574571 bp
Length : 5394 bp
Strand : -
Note : -

DNA sequence :

ATGAATGAAGAAAACGATAAACTTGAAACTTCTAAAAAAACCCAACAACATTCACCCCAAGATTTATCCAATGAAGAAGC
AACAGAAGCCAATCACTTTGAAGATTCTTCAAAAGAATCCAAAGAAAGCTCAGATCATCATCTTGACAACCCCACAGAAA
CTAAAACCAATTTTGATGAATACGAATTAGAAGAAACCCAAACTCAAATGGATTCTGGAGGTAATGAAACTTCAGAATCT
AGCAATGGCAGTCTAGCAGACAAGTTATTCAAAAAAGCCAGAAAATTAGTTGATAATAAAAAACCTTTCACTCAGCAAAA
GAATTTAGATGAAGAAATCCAAGAACCGAATGAAGAAGACGATCAAGAAAATAATGGGTATCAAGAAGAAACTCAAATGG
ACTTAATTGATGATGAAACTTCTAAAAAAACCCAACAACATTCACCCCAAGATTTATCCAATGAAGAAGCAACAGAAGCC
AATCACTTTGAAGATTCTTCAAAAGAATCCAAAGAAAGCTCAGATCATCATCTTGACAACTACACAGAAGCTAAAACCAA
TTTTGATGAATACGAGTCAGAAGAAATAACTAACGATTCTAACGATCAAGAGATTATCAAAGGAAGCAAAAAGAAATACA
TTATTGGTGGCATTGTAGTCGCTGTTCTTATCGTGATTATTTTATTCTCTAGAAGCATTTTTCACTACTTCATACCTTTG
GAAGATAAAAGCTCTCGTTTTAGCAAAGACAGGAATCTTTATGTCAATGATGAAATCCAAATAAGGCAAGAGTATAACCG
ATTGCTGAAAGAACGGAATGAAAAAGGCAATATGATCGATAAGAATCTTTTCTTCAATGACGATCCCAATAGAACCTTAT
ACAACTATTTGAATATTGCAGAAATTGAGGACAAAAACCCATTGAGGGCCTTTTATGAATGTATTAGTAATGGTGGCAAC
TATGAAGAATGTTTGAAGCTTATCAAAGACAAAAAACTTCAAGATCAGATGAAAAAGACTCTAGAGGCTTATAAAGACTG
CATCAAAAATGCCAAAACTGAAGAAGAAAGGATCAAGTGTTTAGATTTAATCAAAGATGAAAACTTGAAAAAAAGCTTAC
TGAACCAACAAAAAGTTCAAGTGGCGCTAGATTGTTTGAAAAACGCTAAAACCGATGAAGAACGAAACGAGTGCCTAAAA
CTCATAAATGACCCTGAGATTAGAGAGAAATTCCGTAAGGAATTAGGGCTTCAAAAAGAGCTTCAAGAGTATAAGGATTG
TATCAAAAACGCCAAAACAGAAGCTGATAAAAACGAATGCTTGAAAGGCTTGTCTAAAGAAGCTATAGAAAGATTGAAAC
AGCAAGCGCTAGATTGTTTGAAAAACGCTAAAACCGATGAAGAACGAAACGAGTGTTTGAAAAATATTCCCCAAGACTTG
CAAAAAGAACTACTAGCTGATATGAGCGTCAAGGCTTACAAGGATTGCGTATCAAAAGCTAGGAATGAAAAAGAGAAAAA
AGAATGCGAGAAATTGCTCACGCCTGAAGCGAAAAAAAAGTTAGAACAACAGGTTCTAGATTGTTTGAAAAACGCTAAAA
CTGATGAAGAACGAAAAAAGTGTTTGAAAGATCTCCCTAAAGACTTACAAAGCGATATTTTAGCTAAAGAGAGTCTTAAA
GCTTATAAAGACTGCGTATCTCAAGCCAAAACTGAAGCTGAGAAACAAGAATGCGAGAAATTGCTCACGCCTGAAGCGAA
AAAACTTTTAGAAGAAGAAGCCAAAGAGAGCGTTAAGGCGTATTTGGATTGCGTATCTCAAGCCAAAACTGAAGCTGAGA
AAAAAGAATGCGAAAAATTACTCACGCCTGAAGCGAAAAAAAAGTTAGAAGAAGCTAAAAAAAGCGTTAAGGCGTATTTG
GATTGCGTATCTCAAGCCAAAACTGAAGCTGAGAAAAAAGAATGCGAGAAATTACTCACGCCTGAAGCGAAAAAGCTTTT
AGAGCAACAAGCGCTAGATTGTTTGAAAAACGCTAAAACCGAAGCTGAGAAAAAAAGGTGTGTCAAAGATCTTCCTAAAG
ACTTGCAGAAAAAGGTTTTAGCTAAAGAGAGTCTTAAAGCTTATAAAGACTGCGTTTCAAGAGCTAGGAATGAAAAAGAG
AAACAAGAATGCGAGAAATTGCTTACGCCTGAAGCGAAAAAACTTTTAGAAGAAGCTAAAAAGAGTCTTAAGGCTTATAA
AGACTGCGTTTCAAGAGCTAGGAATGAAAAAGAGAAACAAGAATGCGAGAAATTGCTCACGCCTGAAGCGAAAAAACTTT
TAGAAGAAGAAGCCAAAGAGAGCGTTAAGGCGTATTTGGATTGCGTATCTCAAGCCAAAACTGAAGCTGAGAAAAAAGAA
TGCGAAAAATTACTCACGCCTGAAGCGAAAAAAAAGTTAGAAGAAGCTAAAAAAAGCGTTAAGGCGTATTTGGATTGCGT
ATCTCAAGCCAAAACTGAAGCTGAGAAAAAAGAATGCGAGAAATTACTCACGCCTGAAGCGAAAAAGCTTTTAGAGCAAC
AAGCGCTAGATTGTTTGAAAAACGCTAAAACCGAAGCTGAGAAAAAAAGGTGTGTCAAAGATCTTCCTAAAGACTTGCAG
AAAAAGGTTTTAGCTAAAGAGAGTCTTAAAGCTTATAAAGACTGCGTTTCAAGAGCTAGGAATGAAAAAGAGAAACAAGA
ATGCGAGAAATTGCTTACGCCTGAAGCGAAAAAACTTTTAGAAGAAGCTAAAAAGAGTCTTAAGGCTTATAAAGACTGCG
TTTCAAGAGCTAGGAATGAAAAAGAGAAACAAGAATGCGAGAAATTGCTTACGCCTGAAGCGAAAAAACTTTTAGAAGAA
GCTAAAAAGAGTCTTAAGGCTTATAAAGACTGCGTTTCAAGAGCTAGGAATGAAAAAGAGAAACAAGAATGCGAGAAATT
GCTTACGCCTGAAGCGAAAAAACTTTTAGAGCAACAAGCGTTAGATTGTTTGAAAAACGCTAAAACCGAAGCTGAGAAAA
AAAGGTGCGTCAAAGATCTCCCTAAAGACTTGCAGAAAAAGGTTTTAGCCAAAGAGAGCGTTAAGGCTTATTTGGATTGC
GTTTCAAGAGCTAGGAATGAAAAAGAGAAACAAGAATGCGAGAAATTGCTCACGCCTGAAGCGAAAAAGCTTTTAGAAGA
AGCTAAAGAGAGTCTTAAAGCTTATAAAGACTGCCTCTCTCAAGCTAGAAATGAAGAAGAAAGGAGAGCTTGTGAGAAAT
TGCTCACCCCTGAAGCGAAAAAACTTTTAGAGCAAGAAGTTAAGAAGAGTGTTAAGGCTTATTTGGACTGCGTATCAAAA
GCTAGGAATGAAAGAGAGAAACAAGAATGCGAAAAATTACTCACCCCTGAAGCGAGAAAATTTTTAGCGAAGCAAGTGCT
AAGTTGTTTGGAAAAAGCTAGAAATGAAGAAGAAAGAAAAGCATGTCTTAAAAATATCCCTAAAGACTTACAGAAAAATG
TTTTAGCTAAAGAGAGTCTTAAAGCTTATAAAGACTGCCTCTCTCAAGCTAGAAATGAAGAAGAAAGGAGAGCTTGCGAG
AAATTACTCACCCCTGAAGCGAGAAAACTCTTAGAGCAAGAAGTTAAGAAGAGCGTTAAGGCTTATTTGGACTGCGTTTC
AAGAGCTAGGAATGAAAAAGAGAAACAAGAATGCGAGAAATTACTCACCCCTGAAGCGAGAAAATTTTTAGCGAAAGAAC
TCCAACAAAAAGATAAAGCGATCAAAGATTGCTTGAAAAACGCCGATCCTAACGACAGAGCGGCTATTATGAAGTGTTTG
GATGGTTTGAGCGATGAAGAGAAGCTCAAATACCTGCAAGAAGCTAGAGAAAAGGCTGTCTTGGATTGTTTGAAAACGGC
TAGGACCGATGAAGAAAAAAGGAAATGTCAAAACCTTTATAGCGATTTGATCCAAGAAATCCAAAATAAAAGGGCACAAA
GCAAACAAAATCAATTGAGTAAAACAGAAAGATTGCATCAAGCAAGCGAGTGCTTGGATAACTTAGATGACCCTACCGAT
CAAGAAGCCATAGAGCAATGTTTAGAGGGCTTGAGCGATAGTGAAAGGGCGCTAATTCTAGGAATTAAACGACAAGCTGA
TGAAGTGGATCTGATTTATAGCGATCTAAGAAACCGCAAAACCTTTGATAACATGGCGGCTAAAGGTTATCCATTATTGC
CAATGGATTTCAAAAATGGCGGCGATATTGCCACTATTAACGCCACTAATGTTGATGCGGACAAAATAGCTAGCGATAAT
CCTATTTATGCTTCCATAGAGCCTGACATTACCAAACAATACGAAACAGAAAAAACCATTAAGGATAAGAATTTAGAAGC
TAAATTAGCTAAGGCTTTAGGTGGCAATAAAAAAGATGACGATAAAGAAAAAAGTAAAAAATCCACAGCAGAAGCTAAAG
TAGAAAGCAATAAGATAGACAAAGATGTCGCAGAAACTGCCAAAAATATCAGTGAAATCGCTCTTAAGAACAAAAAAGAA
AAGAATGGGGAATTTGTAGATGAAAATGGTAATCCCATTGATGACAAAAAGAAAACAGAAACACAAGATGAAACAAGCCC
TGTCAAACAGGCCTTTATAGGCAAGAGTGATCCCACATTTGTTTTAGCGCAATACACCCCTATTGAAATCACTCTGACTT
CTAAAGTAGATGCCACTCTCACAGGTATAGTGAGTGGGGTTGTAGCCAAAGATGTATGGAACATGAACGGCACTATGATC
TTGCTAGACAAAGGCACTAAGGTGTATGGGAATTATCAAAGCGTGAAGGGTGGCACACCCATTATGACACGCTTAATGAT
AGTCTTTACTAAAGCCATTACGCCTGATGGTGTGATAATACCTCTAGCAAACGCTCAAGCAGCAGGCATGTTGGGTGAAG
CAGGGGTAGATGGCTATGTGAATAACCACTTCATGAAGCGCATAGGCTTTGCTGTGATAGCAAGCGTGGTTAATAGCTTC
TTGCAAACTGCGCCTATCATAGCTCTAGATAAACTCATAGGCCTTGGCAAAGGTAGAAGTGAAAGGACACCTGAATTTAA
TTACGCTTTGGGTCAAGCTATCAATGGTAGTATGCAAAGTTCAGCTCAGATGTCTAATCAAATTCTAGGGCAACTGATGA
ATATCCCCCCAAGTTTTTACAAAAATGAGGGCGATAGTATTAAGATTCTCACAATGGACGATATTGATTTTAGTGGCGTG
TATGATGTTAAAATCACCAACAAATCTGTGGTAGATGAAATTATCAAACAAAGCACTAAAACTTTGTCTAGAGAGCATGA
AGAAATCACCACAAGCCCCAAAGGTGGCAATTAA

Protein sequence :

MNEENDKLETSKKTQQHSPQDLSNEEATEANHFEDSSKESKESSDHHLDNPTETKTNFDEYELEETQTQMDSGGNETSES
SNGSLADKLFKKARKLVDNKKPFTQQKNLDEEIQEPNEEDDQENNGYQEETQMDLIDDETSKKTQQHSPQDLSNEEATEA
NHFEDSSKESKESSDHHLDNYTEAKTNFDEYESEEITNDSNDQEIIKGSKKKYIIGGIVVAVLIVIILFSRSIFHYFIPL
EDKSSRFSKDRNLYVNDEIQIRQEYNRLLKERNEKGNMIDKNLFFNDDPNRTLYNYLNIAEIEDKNPLRAFYECISNGGN
YEECLKLIKDKKLQDQMKKTLEAYKDCIKNAKTEEERIKCLDLIKDENLKKSLLNQQKVQVALDCLKNAKTDEERNECLK
LINDPEIREKFRKELGLQKELQEYKDCIKNAKTEADKNECLKGLSKEAIERLKQQALDCLKNAKTDEERNECLKNIPQDL
QKELLADMSVKAYKDCVSKARNEKEKKECEKLLTPEAKKKLEQQVLDCLKNAKTDEERKKCLKDLPKDLQSDILAKESLK
AYKDCVSQAKTEAEKQECEKLLTPEAKKLLEEEAKESVKAYLDCVSQAKTEAEKKECEKLLTPEAKKKLEEAKKSVKAYL
DCVSQAKTEAEKKECEKLLTPEAKKLLEQQALDCLKNAKTEAEKKRCVKDLPKDLQKKVLAKESLKAYKDCVSRARNEKE
KQECEKLLTPEAKKLLEEAKKSLKAYKDCVSRARNEKEKQECEKLLTPEAKKLLEEEAKESVKAYLDCVSQAKTEAEKKE
CEKLLTPEAKKKLEEAKKSVKAYLDCVSQAKTEAEKKECEKLLTPEAKKLLEQQALDCLKNAKTEAEKKRCVKDLPKDLQ
KKVLAKESLKAYKDCVSRARNEKEKQECEKLLTPEAKKLLEEAKKSLKAYKDCVSRARNEKEKQECEKLLTPEAKKLLEE
AKKSLKAYKDCVSRARNEKEKQECEKLLTPEAKKLLEQQALDCLKNAKTEAEKKRCVKDLPKDLQKKVLAKESVKAYLDC
VSRARNEKEKQECEKLLTPEAKKLLEEAKESLKAYKDCLSQARNEEERRACEKLLTPEAKKLLEQEVKKSVKAYLDCVSK
ARNEREKQECEKLLTPEARKFLAKQVLSCLEKARNEEERKACLKNIPKDLQKNVLAKESLKAYKDCLSQARNEEERRACE
KLLTPEARKLLEQEVKKSVKAYLDCVSRARNEKEKQECEKLLTPEARKFLAKELQQKDKAIKDCLKNADPNDRAAIMKCL
DGLSDEEKLKYLQEAREKAVLDCLKTARTDEEKRKCQNLYSDLIQEIQNKRAQSKQNQLSKTERLHQASECLDNLDDPTD
QEAIEQCLEGLSDSERALILGIKRQADEVDLIYSDLRNRKTFDNMAAKGYPLLPMDFKNGGDIATINATNVDADKIASDN
PIYASIEPDITKQYETEKTIKDKNLEAKLAKALGGNKKDDDKEKSKKSTAEAKVESNKIDKDVAETAKNISEIALKNKKE
KNGEFVDENGNPIDDKKKTETQDETSPVKQAFIGKSDPTFVLAQYTPIEITLTSKVDATLTGIVSGVVAKDVWNMNGTMI
LLDKGTKVYGNYQSVKGGTPIMTRLMIVFTKAITPDGVIIPLANAQAAGMLGEAGVDGYVNNHFMKRIGFAVIASVVNSF
LQTAPIIALDKLIGLGKGRSERTPEFNYALGQAINGSMQSSAQMSNQILGQLMNIPPSFYKNEGDSIKILTMDDIDFSGV
YDVKITNKSVVDEIIKQSTKTLSREHEEITTSPKGGN

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
cagY	YP_005777271.1	cag pathogenicity island protein Y VirB10-like protein	Virulence	cag PAI	Protein	0.0	100
HP0527	BAD13833.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	98
HP0527	BAD14052.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	98
cagY	YP_005774542.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	97
HP0527	BAD13970.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	96
cagY	AGC69792.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	96
HP0527	BAD14026.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	95
HP0527	NP_207323.1	cag pathogenicity island protein (cag7)	Virulence	cag PAI	Protein	0.0	95
HP0527	BAD13888.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	93
HP0527	BAD13998.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	92
HP0527	BAD13779.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	90
cagY	YP_005779063.1	cag island protein	Virulence	cag PAI	Protein	0.0	90
cagY	AGC69789.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	90
cagY	AGC69787.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	90
cagY	YP_005775730.1	cag pathogenicity island protein Y VirB10-like protein	Virulence	cag PAI	Protein	0.0	88
HP0527	BAD13860.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	88
HP0527	BAD13806.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	88
HP0527	BAD13915.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	87
cagY	AGC69786.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	87
orf13/14	NP_223194.1	cag island protein	Virulence	cag PAI	Protein	0.0	84
cagY	YP_003728737.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	84
HP0527	BAD13943.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	83
cagY	AGC69785.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	77
cagY	AGC69788.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	77

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
cagY	YP_005777271.1	cag pathogenicity island protein Y VirB10-like protein	VFG0287	Protein	0.0	95