Gene Information

Name : cagY (HPOK113_0548)
Accession : YP_007536662.1
Strain : Helicobacter pylori OK113
Genome accession: NC_020508
Putative virulence/resistance : Virulence
Product : cag pathogenicity island protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 571618 - 577185 bp
Length : 5568 bp
Strand : -
Note : -

DNA sequence :

ATGAATGAAGAAAACGATAAATTTGAAACTTCTAAAAAAACCCAACAACATTCACCCCAAGATTTATCCAATGAAGAAAC
AACAGAAGCCAATCACTTTGAAGATTCTTCAAAAGAATCCAAAGAAAGCTCAGATCATCTTGACAACTCCACAGAAACTA
AAACCAATTTTGATGAATACGAGTCAGAAGAAACCCAAACTCAAATGGATTTTGGAGGTAATGAAACTTCAGAATCTAGC
AATGGCAGTCTAGCAGACAAGTTATTCAAAAAAGCTAGAAAATTAGTTGATAATAAAAAACCTTTCACTCAGCAAAAGAA
TTTAGATGAAGAAACCCAAGAACCGAACGAAGAAGACGATCAAGAAAATAATGGGTATCAAGAAGAAACTCAAATGGACT
TAATTGATGATGAAACTTCTAAAAAAACCCAACAACATTCACCCCAAGATTTATCCAATGAAGAAACAACAGAAGCCAAT
CACTTTGAAGATTCTTCAAAAGAATCCAAAGAAAGCTCAGATCATCTTGACAACTCCACAGAAACTAAAACCAATTTTGA
TGAATACGAGTCAGAAGAAACCCAAACTCAAATGGATTTTGGAGGTAATGAAACTTCAGAATCTAGCAATGGCAGTCTAG
CAGACAAGTTATTCAAAAAAGCTAGAAAATTAGTTGATAATAAAAAACCTTTCACTCAGCAAAAGAATTTAGATGAAGAA
ACCCAAGAACCGAACGAAGAAGACGATCAAGAAAATAATGGGTATCAAGAAGAAACTCAAATGGACTTAATTGATGATGA
AACTTCTAAAAAAACCCAACAACATTCACCCCAAGATTTATCCAATGAAGAAACAACAGAAGCCAATCACTTTGAAGATT
CTTCAAAAGAATCCAAAGAAAGCTCAGATCATCTTGACAACTCCACAGAAACTAAAACCAATTTTGATGAATACAAGTCA
GAAGAAATAACTGATGATTCTAACGATCAAGAGATTATCAAAGGAAGCAAAAAGAAATACATTATTGGTGGCATTGTAGT
CGCTGTTCTTATCGTGATTATTTTATTTTCTAGAAGCATTTTTCACTACTTCATACCTTTGGAAGATAAAAGCTCTCGTT
TTAGCAAAGATAGGAATCTTTATGTCAATGATGAAATCCAAATAAGGCAAGAGTATAACCGATTGCTGAAAGAACGGAAT
GAAAAAGGCAATATGATCGATAAGAATCTTTTCTTCAATGACGATCCCAATAGAACCTTATACAACTATTTGAATATTGC
AGAAATTGAGGACAAAAACCCATTGAGGGCCTTTTATGAATGTATTAGTAATGGTGGCAACTATGAAGAATGTTTGAAGC
TTATCAAAGACAAAAAACTTCAAGATCAAATGAAAAAGACTTTAGAGGCTTATAATGACTGCATCAAAAATGCCAAAACT
GAAGAAGAAAGGATCAAGTGTTTAGATTTAATCAAAGATGAAAACCTGAAAAAAAGCTTACTGAACCAACAAAAAGTTCA
AGTGGCGCTAGATTGTTTGAAAAACGCTAAAACCGATGAAGAACGAAACGAGTGCCTAAAACTCATAAATGACCCTGAGA
TTAGAGAGAAATTCCGTAAGGAATTAGGGCTTCAAAAAGAGCTTCAAGAGTATAAGGATTGTATCAAAAACGCCAAAACA
GAAGCTGAGAAAAACGAATGTTTGAAAGGCTTGTCTAAAGAAGCTATAGAAAGATTGAAACAGCAAGCGCTAGATTGTTT
GAAAAACGCTAAAACCGATGAAGAACGAAACGAGTGCTTGAAAAATATTCCCCAAGACTTGCAAAAAGAACTACTAGCTG
ATATGAGCGTCAAGGCTTACAAGGATTGCGTATCAAAAGCTAGGAATGAAAAAGAGAAAAAAGAATGCGAGAAATTGCTC
ACGCCTGAAGCGAAAAAACTTTTAGAAGAAGCTAAAGAGAGTCTTAAAGCTTATAAAGACTGTGTATCTCAAGCCAAAAC
TGAAGCTGAGAAAAAAGAATGCGAGAAATTGCTCACGCCTGAAGCGAAAAAACTTTTAGAAGAAGAAGCCAAAGAGAGCG
TTAAGGCTTATTTGGATTGCGTATCTCAAGCCAAAACTGAAGCTGAGAAAAAAGAATGCGAGAAACTACTCACGCCTGAA
GCGAAAAAACTTTTAGAAGAAGCTAAAGAGAGCGTTAAGGCTTATAAAGACTGCGTATCAAGAGCTAGGAATGAAAAAGA
GAAAAAAGAATGCGAGAAATTGCTCACCCCTGAAGCGAAAAAACTTTTAGAGCAACAAGCGCTAGATTGTTTGAAAAACG
CTAAAACCGAAGCTGATAAAAAAAGGTGTGTCAAAGATCTCCCTAAAGACTTGCAGAAAAAGGTTTTAGCCAAAGAGAGC
GTTAAGGCTTATTTGGACTGCGTTTCAAAAGCTAGGAATGAAAAAGAGAAAAAAGAATGCGAGAAATTGCTCACGCCTGA
AGCGAAAAAACTTTTAGAAGAAGCTAAAGAGAGTCTTAAAGCTTATAAAGACTGTGTATCTCAAGCCAAAACTGAAGCTG
AGAAAAAAGAATGCGAGAAATTGCTCACGCCTGAAGCGAAAAAACTTTTAGAAGAAGAAGCCAAAGAGAGCGTTAAGGCT
TATTTGGATTGCGTATCTCAAGCCAAAACTGAAGCTGAGAAAAAAGAATGCGAGAAACTACTCACGCCTGAAGCGAAAAA
ACTTTTAGAAGAAGCTAAAGAGAGCGTTAAGGCTTATAAAGACTGCGTATCAAGAGCTAGGAATGAAAAAGAGAAAAAAG
AATGCGAGAAATTGCTCACCCCTGAAGCGAAAAAACTTTTAGAGCAGCAAGCGCTAGATTGTTTGAAAAACGCTAAAACC
GATGAAGAACGAAACGAGTGCTTGAAAAATATTCCCCAAGACTTGCAAAAAGAACTACTAGCTGATATGAGCGTCAAGGC
TTACAAGGATTGCGTATCAAAAGCTAGGAATGAAAAAGAGAAAAAAGAATGCGAGAAATTGCTCACGCCTGAAGCGAAAA
AACTTTTAGAAGAAGCTAAAGAGAGTCTTAAAGCTTATAAAGACTGTGTATCTCAAGCCAAAACTGAAGCTGAGAAAAAA
GAATGCGAGAAATTGCTCACGCCTGAAGCGAAAAAACTTTTAGAAGAAGAAGCCAAAGAGAGCGTTAAGGCTTATTTGGA
TTGCGTATCTCAAGCCAAAACTGAAGCTGAGAAAAAAGAATGCGAGAAACTACTCACGCCTGAAGCGAAAAAACTTTTAG
AAGAAGCTAAAGAGAGCGTTAAGGCTTATAAAGACTGCGTATCAAGAGCTAGGAATGAAAAAGAGAAAAAAGAATGCGAG
AAATTGCTCACCCCTGAAGCGAAAAAACTTTTAGAGCAACAAGCGCTAGATTGTTTGAAAAACGCTAAAACCGAAGCTGA
TAAAAAAAGGTGTGTCAAAGATCTCCCTAAAGACTTGCAGAAAAAGGTTTTAGCCAAAGAGAGCGTTAAGGCTTATTTGG
ACTGCGTTTCAAGAGCTAGGAATGAAAAAGAGAAAAAAGAATGCGAGAAATTACTCACCCCTGAAGCGAGAAAATTTTTA
GCGAAGCAAGTGCTAAATTGTTTGGAAAAAGCTAGAAATGAAGAAGAAAGAAAAGCATGTCTTAAAAATATCCCTAAAGA
CTTACAGAAAAATGTTTTAGCTAAAGAGAGTCTTAAAGCTTATAAAGACTGCCTCTCTCAAGCTAGAAATGAAGAAGAAA
GGAGAGCTTGCGAGAAATTACTCACCCCTGAAGCGAGAAAACTCTTAGAGCAAGAAGTTAAGAAGAGCGTTAAGGCTTAT
TTGGACTGCGTTTCAAGAGCTAGGAATGAAAAAGAGAAAAAAGAATGCGAGAAATTACTCACGCCTGAAGCGAGGAAATT
TTTAGCGAAAGAACTCCAACAAAAAGATAAAGCGATCAAAGATTGCTTGAAAAACGCCGATCCTAACGACAGAGCGGCTA
TTATGAAGTGTTTGGATGGTTTGAGCGATGAAGAGAAGCTCAAATACCTGCAAGAAGCTAGAGAAAAGGCTGTCTTGGAT
TGTTTGAAAACGGCTAGGACCGATGAAGAAAAAAGGAAATGCCAAAACCTTTATAGCGATTTGATCCAAGAAATCCAAAA
TAAAAGGACACAAAGCAAACAAAATCAATTGAGTAAAACAGAAAGATTGCATCAAGCAAGCGAGTGCTTGGATAACTTAG
ATGACCCTACTGATCAAGAAGCCATAGAGCAATGTTTAGAAGGCTTGAGCGATAGTGAAAGGGCGCTAATTCTAGGAATT
AAACGACAAGCTGATGAAGTGGATCTGATTTATAGCGATCTAAGAAACCGCAAAACCTTTGATAATATGGCGGCTAAAGG
TTATCCATTGTTGCCAATGGATTTCAAAAATGGTGGCGATATTGCCACTATTAACGCCACTAATGTTGATGCGGACAAAA
TAGCTAGCGATAATCCTATTTATGCTTCCATAGAGCCTGACATTACCAAGCAATACGAAACAGAAAAAACCATTAAGGAT
AAGAATTTAGAAGCTAAATTGGCTAAGGCTTTAGGTGGCAATAAAAAAGATGACGATAAAGAAAAAAGTAAAAAATCCAC
AGCAGAAGCTAGAGTAGAAAGCAATAAGATAGACAAAGATGTCGCAGAAACTGCCAAGAATATCAGTGAAATCGCTCTTA
AGAACAAAAAAGAAAAGAGTGGGGAATTTGTAGATGAAAATGGTAACCCCATTGATGACAAAAAGAAAACAGAAACACAA
GATGAAACAAGCCCTGTCAAACAAGCCTTTATAGGCAAGAGTGATCCCACATTTGTTTTAGCGCAATACACCCCTATTGA
AATCACTCTAACCTCTAAAGTAGATGCCACTCTCACAGGTATAGTGAGTGGGGTTGTAGCCAAAGATGTATGGAACATGA
ACGGCACTATGATCTTACTAGACAAAGGCACTAAGGTGTATGGGAATTATCAAAGCGTGAAAGGTGGCACACCCATTATG
ACACGCTTAATGATAGTCTTTACTAAAGCCATTACGCCTGATGGTGTGGTGATACCTCTAGCAAACGCTCAAGCAGCAGG
CATGCTGGGTGAAGCAGGGGTAGATGGCTATGTGAATAACCACTTCATGAAGCGCATAGGCTTTGCTGTGATAGCAAGCG
TGGTTAATAGCTTCTTGCAAACTGCGCCTATCATAGCTCTAGATAAACTCATAGGCCTTGGCAAAGGTAGAAGTGAAAGG
ACACCTGAATTTAATTACGCTTTGGGTCAAGCTATCAATGGTAGTATGCAAAGTTCAGCTCAGATGTCTAATCAAATTCT
AGGGCAACTGATGAATATCCCCCCAAGTTTTTACAAAAACGAGGGCGATAGTATTAAGATTCTCACAATGGACGATATTG
ATTTTAGTGGCGTGTATGATGTTAAAATTACCAACAAATCTGTGGTAGATGAAATTATCAAACAAAGCACTAAAACTTTG
TCTAGAGAGCATGAAGAAATCACCACAAGCCCCAAAGGTGGCAATTAA

Protein sequence :

MNEENDKFETSKKTQQHSPQDLSNEETTEANHFEDSSKESKESSDHLDNSTETKTNFDEYESEETQTQMDFGGNETSESS
NGSLADKLFKKARKLVDNKKPFTQQKNLDEETQEPNEEDDQENNGYQEETQMDLIDDETSKKTQQHSPQDLSNEETTEAN
HFEDSSKESKESSDHLDNSTETKTNFDEYESEETQTQMDFGGNETSESSNGSLADKLFKKARKLVDNKKPFTQQKNLDEE
TQEPNEEDDQENNGYQEETQMDLIDDETSKKTQQHSPQDLSNEETTEANHFEDSSKESKESSDHLDNSTETKTNFDEYKS
EEITDDSNDQEIIKGSKKKYIIGGIVVAVLIVIILFSRSIFHYFIPLEDKSSRFSKDRNLYVNDEIQIRQEYNRLLKERN
EKGNMIDKNLFFNDDPNRTLYNYLNIAEIEDKNPLRAFYECISNGGNYEECLKLIKDKKLQDQMKKTLEAYNDCIKNAKT
EEERIKCLDLIKDENLKKSLLNQQKVQVALDCLKNAKTDEERNECLKLINDPEIREKFRKELGLQKELQEYKDCIKNAKT
EAEKNECLKGLSKEAIERLKQQALDCLKNAKTDEERNECLKNIPQDLQKELLADMSVKAYKDCVSKARNEKEKKECEKLL
TPEAKKLLEEAKESLKAYKDCVSQAKTEAEKKECEKLLTPEAKKLLEEEAKESVKAYLDCVSQAKTEAEKKECEKLLTPE
AKKLLEEAKESVKAYKDCVSRARNEKEKKECEKLLTPEAKKLLEQQALDCLKNAKTEADKKRCVKDLPKDLQKKVLAKES
VKAYLDCVSKARNEKEKKECEKLLTPEAKKLLEEAKESLKAYKDCVSQAKTEAEKKECEKLLTPEAKKLLEEEAKESVKA
YLDCVSQAKTEAEKKECEKLLTPEAKKLLEEAKESVKAYKDCVSRARNEKEKKECEKLLTPEAKKLLEQQALDCLKNAKT
DEERNECLKNIPQDLQKELLADMSVKAYKDCVSKARNEKEKKECEKLLTPEAKKLLEEAKESLKAYKDCVSQAKTEAEKK
ECEKLLTPEAKKLLEEEAKESVKAYLDCVSQAKTEAEKKECEKLLTPEAKKLLEEAKESVKAYKDCVSRARNEKEKKECE
KLLTPEAKKLLEQQALDCLKNAKTEADKKRCVKDLPKDLQKKVLAKESVKAYLDCVSRARNEKEKKECEKLLTPEARKFL
AKQVLNCLEKARNEEERKACLKNIPKDLQKNVLAKESLKAYKDCLSQARNEEERRACEKLLTPEARKLLEQEVKKSVKAY
LDCVSRARNEKEKKECEKLLTPEARKFLAKELQQKDKAIKDCLKNADPNDRAAIMKCLDGLSDEEKLKYLQEAREKAVLD
CLKTARTDEEKRKCQNLYSDLIQEIQNKRTQSKQNQLSKTERLHQASECLDNLDDPTDQEAIEQCLEGLSDSERALILGI
KRQADEVDLIYSDLRNRKTFDNMAAKGYPLLPMDFKNGGDIATINATNVDADKIASDNPIYASIEPDITKQYETEKTIKD
KNLEAKLAKALGGNKKDDDKEKSKKSTAEARVESNKIDKDVAETAKNISEIALKNKKEKSGEFVDENGNPIDDKKKTETQ
DETSPVKQAFIGKSDPTFVLAQYTPIEITLTSKVDATLTGIVSGVVAKDVWNMNGTMILLDKGTKVYGNYQSVKGGTPIM
TRLMIVFTKAITPDGVVIPLANAQAAGMLGEAGVDGYVNNHFMKRIGFAVIASVVNSFLQTAPIIALDKLIGLGKGRSER
TPEFNYALGQAINGSMQSSAQMSNQILGQLMNIPPSFYKNEGDSIKILTMDDIDFSGVYDVKITNKSVVDEIIKQSTKTL
SREHEEITTSPKGGN

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
HP0527	BAD14052.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	84
cagY	YP_005777271.1	cag pathogenicity island protein Y VirB10-like protein	Virulence	cag PAI	Protein	0.0	83
HP0527	BAD13888.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	77
cagY	YP_003728737.1	cag pathogenicity island protein Y	Virulence	cag PAI	Protein	0.0	77