PAI Gene Information

Name : cag3 (HP0522)
Accession : AAR03945.1
PAI name : cag PAI
PAI accession : AY330643
Strain : Helicobacter pylori 2017
Virulence or Resistance: Virulence
Product : Cag3
Function : -
Note : cag-delta; jhp0471; orf8
Homologs in the searched genomes : 46 hits ( 46 protein-level )
Publication :

Comparative analysis of the complete cag pathogenicity island sequence in four Helicobacter pylori isolates

Gene 328, 85-93 (2004) PUBMED 15019987

Direct Submission

Submitted (26-JUN-2003) Biotechnology, Royal Institute of Technology, Alba Nova University Centre, Roslagstullsbacken 21, S-106 91 Stockholm, Sweden

DNA sequence :
ATGAGTCTTTTTACAGCTGTATCACTTATCTTAAATGCAAGGGAATTTTGTCTCTATATCAATCTGAAAAAAAGGAAACT AATGTTTAGAAAACTGGCAACCTCTGTATCGCTCATAGGCTTACTAACCTCTAACACTCTTTATGCTAAAGAAATAAGTG AAGCCGATAAGGTCATTAAGGCCACTAAAGAAACTAAAGAGACCAAGAAAGAAGCTAAACGACTCAAAAAAGAAGCTAGA CAGCGCCAACAGATCCCTGATCATAAGAAACCTCAATATGCCTCTGTTGATGACACAAAAACTCAAGCGCTTTTTGATAT ATACGACACCTTGAATGTGAATGACAAAAGCTTTGGGGATTGGTTTGGTAATAGCGCTTTGAAAGACAAAACCTATCTCT ACGCTATGGATCTATTGGATTACAACAACTATTTATCCATAGAAAACCCCATTATCAAAACAAGAGCGATGGGGACTTAT GCGGATCTCATCATCATCACAGGTTCGTTAGAACAAGTCAATGGGTATTACAACATTCTAAAAGCGCTCAACAAACGAAA CGCTAAGTTTGTTCTAAAAATCAATGAGAACATGCCTTATGCCCAAGCGACTTTTTTACGAGTGCCAAAAAGAAGCGATC CTAATGCCCACACGCTTGATAAGGGAGCGGCAATTGATGAGAACAAGCTTTTTGAACAACAAAAACGCGCGTATTTTAAC TACGCCAACGATGTGATCTGCAGACCCAATGATGAAGTGTGTTCGCCCCTAAGAGATGAGATGGTCGCTATGCCCACTAG CGATAGCGTTACTCAAAAACCCAATATCATTGCTCCTTATAGCTTGTATAGACTAAAAGAGACAAATAACGCCAATGAGG CCCAACCATCACCTTATGCCACTCAAACCGCTCCTGAAAACAGCAAAGAGAAGCTCATAGAAGAGCTAATCGCTAACTCC CAACTCATAGCCAATGAAGAAGAGAGGGAAAAGAAACTCTTAGCAGAAAAAGAAAAACAAGAGGCTGAATTGGCTAAATA CAAGCTCAAAGACTTAGAAAATCAAAAGAAACTAAAAGCTTTAGAAGCAGAGTTGAAAAAGAAAAATGCTAAGAAACCTA GAGTAGTGGAAGTGCCTGTTTCTCCTCAAACAAGTAATTCTGATGAAACAATGAGGGTTGTTAAAGAAAAAGAAAACTAC AATGGGTTGTTAGTGGATAAAGAAACCACGATCAAAAGAAGCTATGAGGGGACTTTGATCAGCGAAAATTCTTACAGCAA AAAAACACCTCTCAACCCTAATGACTTGAGGAGCTTAGAAGAAGAAATTAAGAGCTATTATATCAAGTCTAATGGCTTGT GTTATACTAATGGCATTAATCTCTATGTAAAAATCAAAAACGACCCCTATAAAGAGGGAATGCTGTGTGGTTATGAGAGC GTTCAAAATCTGCTCTCACCTTTAAAAGACAAGCTCAAATACGACAAGCAAAAGTTACAAAAAGCGTTATTGAAAGATTC AAAGTAA
Protein sequence :
MSLFTAVSLILNAREFCLYINLKKRKLMFRKLATSVSLIGLLTSNTLYAKEISEADKVIKATKETKETKKEAKRLKKEAR QRQQIPDHKKPQYASVDDTKTQALFDIYDTLNVNDKSFGDWFGNSALKDKTYLYAMDLLDYNNYLSIENPIIKTRAMGTY ADLIIITGSLEQVNGYYNILKALNKRNAKFVLKINENMPYAQATFLRVPKRSDPNAHTLDKGAAIDENKLFEQQKRAYFN YANDVICRPNDEVCSPLRDEMVAMPTSDSVTQKPNIIAPYSLYRLKETNNANEAQPSPYATQTAPENSKEKLIEELIANS QLIANEEEREKKLLAEKEKQEAELAKYKLKDLENQKKLKALEAELKKKNAKKPRVVEVPVSPQTSNSDETMRVVKEKENY NGLLVDKETTIKRSYEGTLISENSYSKKTPLNPNDLRSLEEEIKSYYIKSNGLCYTNGINLYVKIKNDPYKEGMLCGYES VQNLLSPLKDKLKYDKQKLQKALLKDSK