Gene Information

Name : HPSH417_02515 (HPSH417_02515)
Accession : YP_006224150.1
Strain : Helicobacter pylori Shi417
Genome accession: NC_017739
Putative virulence/resistance : Virulence
Product : cag pathogenicity island protein CagY
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 502664 - 507844 bp
Length : 5181 bp
Strand : -
Note : COG2948 Type IV secretory pathway, VirB10 components

DNA sequence :

ATGAATGAAGAAAACGATAAACTTGAAACTTCTAAAAAAACCCAACAACATTCACCCCAAGATTTATCCAATGAAGAAAC
AATAAAAGCCAATCACTTTGAAGATTCTTCAAAAGAATCCAAAAAAAGCTCAGATCATCATCTTGACAACTCCACAGAAA
CTAAAACCAATTTTGATGAATACAAGTCAGAAGAAACCCAAACTCAAATGGATTCTGGAGGTAATGAAACTTCAGAATCT
AGCAATCTAGCAGACAAGTTATTCAAAAAAGCCAGAAAATTAGTTGATAATAAAAGACCTTTCACTCAGCAAAAGAATTT
AGATGAAGAAATCCAAGAACCAAACGAAGAAGACGATCAAGAAAATAATGGGTATCAAGAAGAAACTCAAATGGACTTAA
TTGATGATGAAACTTCTAAAAAAACCCAACAACATTCACCCCAAGATTTATCCAATGAAGAAACAATAAAAGCCAATCAC
TTTGAAGATTCTTCAAAAGAATCCAAAAAAAGCTCAGATCATCATCTTGACAACTACACAGAAACTAAAACCAATTTTGA
TGGAGAAAAGTCAGAAGAAATAACTAACGATTCTAACGATCAAGAGATTATCAAAGGAAGCAAAAAGAAATACATTATTG
GTGGCATTGTAGTCGCTGTCCTTATCGTGATTATTTTATTTTCTAGAAGCATTTTTCACTATTTCATACCTTTGGAAGAT
AAAAGCTCTCGTTTTAGCAAAGACAGGAATCTTTATGTCAATGATGAAATCCAAATAAGGCAAGAGTATAACCGATTACT
GAAAGAACGGAATGAAAAAGGCAATATGATCGATAAGAATCTTTTCTTCAATGACGATCCCAATAGAACCTTATACAACT
ATTTGAATATTGCAGAAATTGAGGACAAAAACCCATTGAGGGCCTTTTATGAATGTATTAGTAATGGTGGCAACTATGAA
GAATGTTTGAAACTTATCAAAGACAAAAAACTTCAAGATCAAATGAAAAAGACTTTAGAGGCTTATAATGACTGCATCAA
AAATGCCAAAACTGAAGAAGAAAGGATCAAGTGTTTAGATTTAATCAAAGATGAAAACCTGAAAAAAAGCTTACTGAACC
AACAAAAAGTTCAAGTGGCGCTAGATTGTTTGAAAAACGCTAAAACCGATGAAGAACGAAACGAGTGCCTAAAACTCATA
AATGACCCTGAGATTAGAGAGAAATTCCGTAAGGAATTAGAGCTTCAAAAAGAGCTTCAAGAGTATAAGGATTGTATCAA
AAACGCCAAAACAGAAGCTGAGAAAAACAAATGCTTGAAAGGCTTGTCTAAAGAAGCTATAGAAAGATTGAAACAGCAAG
CGCTAGATTGTTTGAAAAACGCTAAAACCGATGAAGAACGAAACGAGTGCTTGAAAAATATCCCCCAAGACTTGCAAAAA
GAACTACTAGCTGATATGAGCGTCAAGGCTTACAAGGATTGCGTATCAAAAGCTAGAAATGAAGAAGAAAGAAAAGCTTG
TGAGAAATTGCTCACCCCTGAAGCGAAAAAACTTTTAGAGCGACAAGCGCTAGATTGTTTGAAAAACGCTAAAACCGAAG
CTGAGAAAAAAAGGTGTGTCAAAGATCTCCCTAAAGACTTACAAAGCGATATTTTAGCTAAAGAGAGCGTTAAAGCTTAT
AGAGACTGCGTATCTCAAGCCAGAACTGAAGCTGAGAAAAAAGAATGTGAGAAATTACTCACGCCTGAAGCGAAAAAACT
TTTAGAAGAAGAAGCCAAAGAGAGCGTCAAAGCTTATTTGGATTGCGTATCTCAAGCCAAAACTGAAACTGAGAAAAAAG
AATGCGAGAAATTGCTCACCCCTGAAGCGAGAAAAAAGTTAGAAGAAGCTAAAAAAAGCGTTAAAGCTTATTTGGATTGC
GTATCTCAAGCCAAAACTGAAACTGAGAAAAAAGAATGCGAGAAATTGCTCACGCCTGAAGCGAAAAAACTTTTAGAGCA
ACAAGCGCTAGATTGTTTGAAAAACGCTAAAACCGAAGCTGAGAAAAAAAGGTGTGTCAAAGATCTCCCTAAAGACTTGC
AGAAAAAGGTTTTAGCCAAAGAGAGTCTTAAGGCTTATAAAGACTGCGTTTCAAGAGCTAGGAATGAAAAAGAGAAAAAA
GAATGCGAGAAATTGCTCACGCCTGAAGCGAAAAAACTTTTAGAAGAAGCCAAAGAGAGTCTTAAAGCTTATAAAGACTG
CGTATCTCAAGCTAGAACTGAAGCTGAGAAAAAAGAATGTGAGAAATTACTCACGCCTGAAGCGAAAAAACTTTTAGAAG
AAGAAGCCAAAGAGAGCGTCAAAGCTTATTTGGATTGCATATCTCAAGCCAAAACTGAAACTGAGAAAAAAGAATGCGAG
AAATTGCTCACCCCTGAAGCGAGAAAAAAGTTAGAAGAAGCTAAAAAAAGCGTTAAAGCTTATTTGGATTGCGTATCTCA
AGCCAAAACTGAAACTGAGAAAAAAGAATGCGAGAAATTGCTCACGCCTGAAGCGAAAAAACTTTTAGAGCAACAAGCGC
TAGATTGTTTGAAAAACGCTAAAACCGAAGCTGAGAAAAAAAGGTGTGTCAAAGATCTCCCTAAAGACTTGCAGAAAAAG
GTTTTAGCCAAAGAGAGTCTTAAGGCTTATAAAGACTGCGTTTCAAGAGCTAGGAATGAAAAAGAGAAAAAAGAATGCGA
GAAATTGCTCACGCCTGAAGCTAAAAAACTTTTAGAAGAAGCCAAAGAGAGTCTTAAAGCTTATAAAGACTGCGTATCTC
AAGCTAGAAATGAAGAAGAAAGAAAAGCTTGTGAGAAATTGCTCACCCCTGAAGCGAGAAAAAAGTTAGAAGAAGCTAAA
AAAAGCGTTAAGGCTTATTTGGACTGCGTTTCAAGAGCTAGGAATGAAAAAGAGAAAAAAGAATGCGAGAAATTACTCAC
GCCTGAAGCGAAAAAACTTTTAGAAGAAGCTAAAGAGAGTCTTAAAGCTTATAAAGACTGCCTCTCTCAAGCTAGAAATG
AAGAAGAAAGAAAAGCTTGTGAGAAATTACTCACCCCTGAAGCGAGAAAACTCTTAGAGCAAGAAGTTAAGAAGAGCGTT
AAGGCTTATTTGGACTGCGTTTCGAGAGCTAGGAATGAAAAAGAGAAACAAGAATGCGAGAAATTGCTCACCCCTGAAGC
GAGAAAATTTTTAGCGAAGCAAGCGCTAAGTTGTTTGGAAAAAGCTAGAAATGAAGAAGAAAGAAAAGCATGTCTTAAAA
ATATCCCTAAAGACTTGCAGAAAGATGTTTTAGCCAAAGAGAGTCTTAAAGCTTATAAAGACTGCCTCTCTCAAGCTAGA
AATGAAGAAGAAAGAAAAGCTTGTGAGAAATTACTCACCCCTGAAGCGAGAAAACTCTTAGAACAAGAAGTTAAGAAGAG
CGTTAAGGCTTATTTGGACTGCGTTTCAAGAGCTAGGAATGAAAAAGAGAAACAAGAATGCGAGAAATTGCTCACGCCTG
AAGCGAGAAAATTTTTAGCGAAAGAGCTCCAACAAAAAGATAAAGCGATCAAAGATTGCTTAAAAAACGCCGATCCTAAC
GACAGAGCAGCTATTATGAAGTGTTTGGATGGTTTGAGCGATGAAGAGAAGCTCAAATACCTGCAAGAAGCTAGAGAAAA
GGCTGTCTTGGATTGTTTGAAAACGGCTAGGACCGATGAAGAAAAAAGGAAATGTCAAAACCTTTATAGCGATTTGATCC
AAGAAATCCAAAATAAAAGGGCACAAAGCAAACAAAATCAATTGAGTAAAACAGAAAGATTGCATCAAGCAAGCGAGTGC
TTGGATAACTTAGATGACCCTACTGATCAAGAAGCCATAGAGCAATGTTTAGAAGGCTTGAGCGATAGTGAAAGGGCACT
AATTCTAGGAATTAAACGACAAGCTGATGAAGTGGATCTGATTTATAGCGATCTAAGAAACCGCAAAACCTTTGACAACA
TGGCGGCTAAAGGTTATCCATTGTTGCCAATGGATTTCAAAAATGGCGGCGATATTGCCACTATTAACGCCACCAATGTT
GATGCGGACAAAATAGCTAGCGATAATCCTATTTATGCTTCTATAGAGCCTGACATTACTAAGCAATACGAAACAGAAAA
AACCATTAAGGATAAGAATTTAGAAGCTAAATTAGCTAAGGCTTTAGGTGGCAATAAAAAAGATGACGATAAAGAAAAAA
GTAAAAAATCCACAGCAGAAGCTAGAGTAGAAAGCAATAAGATAGACAAAGATGTCGCAGAAACTGCCAAAAATATCAGT
GAAATCGCTCTTAAGAACAAAAAAGAAAAGAGTGGGGAATTTGTAGATGAAAATGGTAATCCCATTGATGACAAGAAGAA
AACAGAAAAGCAAGATGAAACAAGCCCTGTCAAACAAGCCTTTATAGGCAAGAGTGATCCCACATTTGTTTTAGCGCAAT
ACACCCCTATTGAAATCACTCTGACTTCTAAAGTAGATGCCACTCTCACAGGTATAGTGAGTGGGGTTGTGGCCAAAGAT
GTATGGAACATGAACGGCACTATGATCTTACTAGACAAAGGCACTAAGGTGTATGGGAATTATCAAAGCGTGAAAGGTGG
CACACCCATTATGACACGCTTAATGATAGTCTTTACTAAAGCCATTACGCCTGATGGTGTGATAATACCTCTAGCAAACG
CTCAAGCAGCAGGCATGCTAGGTGAAGCAGGGGTAGATGGCTATGTGAATAATCACTTTATGAAGCGCATAGGCTTTGCT
GTGATAGCAAGCGTGGTTAATAGCTTCTTGCAAACTGCGCCTATCATAGCTCTAGATAAACTCATAGGCCTTGGCAAAGG
TAGAAGTGAAAGGACACCTGAATTTAATTACGCTTTGGGTCAAGCTATCAATGGTAGTATGCAAAGTTCAGCTCAGATGT
CTAATCAAATTCTAGGGCAACTGATGAATATCCCCCCAAGTTTTTACAAAAATGAGGGCGATAGTATTAAGATTCTCACA
ATGGACGATATTGATTTTAGTGGCGTATATGATGTTAAAATTACCAACAAATCTGTGGTAGATGAAATTATCAAACAAAG
CACTAAAACTTTGTCTAGAGAGCATGAAGAAATCACCACAAGCCCCAAAGGTGGCAATTAA

Protein sequence :

MNEENDKLETSKKTQQHSPQDLSNEETIKANHFEDSSKESKKSSDHHLDNSTETKTNFDEYKSEETQTQMDSGGNETSES
SNLADKLFKKARKLVDNKRPFTQQKNLDEEIQEPNEEDDQENNGYQEETQMDLIDDETSKKTQQHSPQDLSNEETIKANH
FEDSSKESKKSSDHHLDNYTETKTNFDGEKSEEITNDSNDQEIIKGSKKKYIIGGIVVAVLIVIILFSRSIFHYFIPLED
KSSRFSKDRNLYVNDEIQIRQEYNRLLKERNEKGNMIDKNLFFNDDPNRTLYNYLNIAEIEDKNPLRAFYECISNGGNYE
ECLKLIKDKKLQDQMKKTLEAYNDCIKNAKTEEERIKCLDLIKDENLKKSLLNQQKVQVALDCLKNAKTDEERNECLKLI
NDPEIREKFRKELELQKELQEYKDCIKNAKTEAEKNKCLKGLSKEAIERLKQQALDCLKNAKTDEERNECLKNIPQDLQK
ELLADMSVKAYKDCVSKARNEEERKACEKLLTPEAKKLLERQALDCLKNAKTEAEKKRCVKDLPKDLQSDILAKESVKAY
RDCVSQARTEAEKKECEKLLTPEAKKLLEEEAKESVKAYLDCVSQAKTETEKKECEKLLTPEARKKLEEAKKSVKAYLDC
VSQAKTETEKKECEKLLTPEAKKLLEQQALDCLKNAKTEAEKKRCVKDLPKDLQKKVLAKESLKAYKDCVSRARNEKEKK
ECEKLLTPEAKKLLEEAKESLKAYKDCVSQARTEAEKKECEKLLTPEAKKLLEEEAKESVKAYLDCISQAKTETEKKECE
KLLTPEARKKLEEAKKSVKAYLDCVSQAKTETEKKECEKLLTPEAKKLLEQQALDCLKNAKTEAEKKRCVKDLPKDLQKK
VLAKESLKAYKDCVSRARNEKEKKECEKLLTPEAKKLLEEAKESLKAYKDCVSQARNEEERKACEKLLTPEARKKLEEAK
KSVKAYLDCVSRARNEKEKKECEKLLTPEAKKLLEEAKESLKAYKDCLSQARNEEERKACEKLLTPEARKLLEQEVKKSV
KAYLDCVSRARNEKEKQECEKLLTPEARKFLAKQALSCLEKARNEEERKACLKNIPKDLQKDVLAKESLKAYKDCLSQAR
NEEERKACEKLLTPEARKLLEQEVKKSVKAYLDCVSRARNEKEKQECEKLLTPEARKFLAKELQQKDKAIKDCLKNADPN
DRAAIMKCLDGLSDEEKLKYLQEAREKAVLDCLKTARTDEEKRKCQNLYSDLIQEIQNKRAQSKQNQLSKTERLHQASEC
LDNLDDPTDQEAIEQCLEGLSDSERALILGIKRQADEVDLIYSDLRNRKTFDNMAAKGYPLLPMDFKNGGDIATINATNV
DADKIASDNPIYASIEPDITKQYETEKTIKDKNLEAKLAKALGGNKKDDDKEKSKKSTAEARVESNKIDKDVAETAKNIS
EIALKNKKEKSGEFVDENGNPIDDKKKTEKQDETSPVKQAFIGKSDPTFVLAQYTPIEITLTSKVDATLTGIVSGVVAKD
VWNMNGTMILLDKGTKVYGNYQSVKGGTPIMTRLMIVFTKAITPDGVIIPLANAQAAGMLGEAGVDGYVNNHFMKRIGFA
VIASVVNSFLQTAPIIALDKLIGLGKGRSERTPEFNYALGQAINGSMQSSAQMSNQILGQLMNIPPSFYKNEGDSIKILT
MDDIDFSGVYDVKITNKSVVDEIIKQSTKTLSREHEEITTSPKGGN

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
cag-Y	AAF80198.1	Cag-Y	Virulence	cag PAI	Protein	0.0	93
cagY	YP_005777271.1	cag pathogenicity island protein Y VirB10-like protein	Virulence	cag PAI	Protein	0.0	93
HP0527	BAD14052.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	93
cagY	AGC69789.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	93
HP0527	BAD13833.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	92
cagY	YP_005774542.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	92
cagY	AGC69785.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	92
cagY	AGC69788.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	92
HP0527	BAD14026.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	91
HP0527	BAD13970.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	91
HP0527	BAD13998.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	90
cagY	AGC69792.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	88
HP0527	BAD13888.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	87
HP0527	NP_207323.1	cag pathogenicity island protein (cag7)	Virulence	cag PAI	Protein	0.0	87
cagY	YP_005779063.1	cag island protein	Virulence	cag PAI	Protein	0.0	85
HP0527	BAD13779.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	85
cagY	AGC69786.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	83
HP0527	BAD13806.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	83
HP0527	BAD13915.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	82
cagY	AGC69787.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	82
orf13/14	NP_223194.1	cag island protein	Virulence	cag PAI	Protein	0.0	80
cagY	YP_003728737.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	79
HP0527	BAD13943.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	79
HP0527	BAD13860.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	79
cagY	YP_005775730.1	cag pathogenicity island protein Y VirB10-like protein	Virulence	cag PAI	Protein	0.0	79

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
HPSH417_02515	YP_006224150.1	cag pathogenicity island protein CagY	VFG0287	Protein	0.0	87