PAI Gene Information

Name : eae (ECO111_3743)
Accession : YP_003236079.1
PAI name : LEE
PAI accession : NC_013364_P1
Strain : Escherichia coli 042
Virulence or Resistance: Not determined
Product : theta intimin
Function : -
Note : Integrative element ECO111_IE05
Homologs in the searched genomes : 12 hits ( 12 protein-level )
Publication :

Direct Submission

Submitted (21-DEC-2008) Contact:Masahira Hattori University of Tokyo, Graduate School of Frontier Sciences; 5-1-5 Kashiwanoha, Kashiwa, Chiba 277-8562, Japan URL :http://www.cb.k.u-tokyo.ac.jp/hattorilab/

Comparative genomics reveal the mechanism of the parallel evolution of O157 and non-O157 enterohemorrhagic Escherichia coli

Proc. Natl. Acad. Sci. U.S.A. 106 (42), 17939-17944 (2009) PUBMED 19815525

Direct Submission

Submitted (07-OCT-2009) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

DNA sequence :
ATGATTACTCATGGTTTTTATGCCCGGACCCGGCACAAGCATAAGCTAAAAAAAACATTTATTATGCTTAGCGCTGGTTT AGGATTGTTTTTTTATGTTAACCAGAACTCATTTGCAAACGGTGAAAATTATTTTAAATTGAGTTCAGATTCAAAACTGT TAACTCAAAATGTTGCTCAGGATCGCCTTTTTTATACGTTGAAAACAGGTGAAACTGTTTCCAGTATTTCTAAATCACAA GGTATCAGTTTATCCGTAATTTGGTCACTGAATAAACATTTATACAGTTCCGAAAGCGAAATGCTGAAGGCTGCGCCTGG CCAGCAGATCATTTTGCCACTCAAAAAACTGTCTGTTGAATATGGTGCCTTACCTGTCTTAGGTTCGGCACCTGTTGTTG CTGCAGGTGGTGTCGCTGGGCATACAAATAAAATGACTAAAATGTCCCCGGACGCGACTCAAAGCAACATGACTGATGAC AAGGCTCTAAATTATACGGCACAACAGGCCGCGAGCCTTGGTAGCCAGCTTCAGTCGCGCTCTCTGCACGGCGATTACGC GAAAGATACCGCTCTTGGTATCGCGGGTAACCAGGCTTCGTCACAGTTGCAGGCCTGGTTACAACATTATGGAACGGCAG AGGTTAATCTGCAGAGTGGTAATAACTTTGACGGTAGTTCACTGGATTTCTTATTACCGTTCTATGATTCCGAAAAAATG CTGGCATTTGGTCAGGTCGGAGCGCGTTACATTGACTCCCGCTTTACGGCAAATTTAGGTGCGGGTCAGCGTTTTTTCCT TCCTGAAAACATGTTGGGCTATAACGTCTTCATTGATCAGGATTTTTCTGGTGATAATACCCGTTTAGGTATTGGTGGCG AATACTGGCGAGACTATTTCAAAAGTAGCGTTAACGGCTATTTCCGCATGAGCGGCTGGCATGAGTCATACAATAAGAAA GACTATGATGAGCGCCCAGCAAATGGCTTCGATATCCGCTTTAATGGCTATCTACCATCATACCCGGCATTAGGCGCCAA GCTGATGTATGAGCAGTATTATGGTGATAATGTTGCTTTGTTTAATTCCGATAAGCTGCAGTCGAATCCTGGTGCGGCGA CCGTTGGTGTAAACTATACTCCGATTCCTCTGGTGACGATGGGGATCGATTACCGTCATGGTACGGGTAATGAAAATGAT CTTCTTTACTCAATGCAGCTTCGTTATCAGTTTGATAAACCGTGGTCTCAGCAAATTGAGCCACAGTATGTTAACGAGTT AAGAACATTATCAGGCAGCCGTTACGATCTGGTTCAGCGTAATAACAATATTATTCTGGAGTACAAGAAGCAGGATATTC TTTCTCTGAATATTCCGCATGATATTAATGGTACTGAACACAGTACGCAGAAGATTCAATTGATCGTTAAGAGCAAATAC GGTCTGGATCGTATCGTCTGGGATGATAGTGCATTACGTAGCCAGGGCGGTCAGATTCAGCATAGCGGAAGCCAAAGCGC ACAAGATTACCAGGCTATTTTGCCGGCTTATGTGCAAGGCGGTAGCAATATTTATAAAGTGACGGCTCGTGCCTATGACC GTAATGGCAATAGCTCTAACAATGTACAGCTCACTATTACCGTTCTGTCGAATGGTCAGGTGGTCGACCAGGTTGGGGTA ACGGACTTTACGGCTGATAAGACTTCGGCTAAAGCGGATGGCACCGAGGCGATTACTTATACCGCGACGGTGAAAAAGAA TGGGGTAACTCAGGCTAATGTCCCTGTTTCATTTAATATTGTTTCAGGAACTGCAACTCTTGGGGCAAATAGTGCCACAA CGGATGCTAACGGTAAGGCAACTGTAACGTTGAAGTCGAGTACGCCAGGGCAGGTAGTCGTGTCTGCTAAAACCGCGGAG ATGACTTCAGCACTTAATGCCAGTGCGGTTATATTTGTTGAGCAAACCAAGGCCAGTATTACTGAGATTAAGGCTGATAA GACAACTGCAGTAGCAAATGGTAATGATGCTGTTACATACACTGTTAAAGTGATGAAAGAGGGTCAGCCAGTGCAGGGAC ACTCCGTTGCATTCACAACAAACTTTGGGATGTTCAACGGTAAGTCTCAGACGCAAAATGCGACCACGGGAAGTGATGGT CGTGCGACGATAACACTGACTTCCAGTTCCGCAGGTAAAGCGACTGTTAGTGCGACTGTTAGTGGTGGGAATGATGTTAA AGCACCTGAGGTTACATTTTTTGATGGACTGAAAATTGACAACAAGGTTGATATTCTTGGTAAGAACGTTACTGGTGACT TACCTAATATCTGGTTGCAATATGGTCAGTTTAAACTGAAGGTAAGCGGTGGTAATGGTACATATTCATGGCATTCAGAG AATACCAATATTGCGACTGTTGATGAATCAGGGAAAGTAACCTTGAAAGGAAAAGGTACTGCAGTAATTAATGTTACATC TGGTGATAAGCAAACAGTAAGCTACACTATTAAAGCTCCGAATTATATGATAAGAGTGGGTAATAAAGCCAGTTATGCAA ATGCTATGTCCTTTTGTGGAAATTTATTACCATCCTCACAGACGGTATTATCAAACGTTTATAATTCATGGGGGCCTGCA AACGGATATGACCATTATCGTTCTATGCAGTCAATAACAGCTTGGATTACACAAACTGAAGCTGATAAAATATCAGGAGT ATCAACTACTTATGACTTAATAACACAAAACCCTCATAAGGATGTTACGCTAAACGCTCCAAATGTCTATGCAGTTTGTG TAGAATAA
Protein sequence :
MITHGFYARTRHKHKLKKTFIMLSAGLGLFFYVNQNSFANGENYFKLSSDSKLLTQNVAQDRLFYTLKTGETVSSISKSQ GISLSVIWSLNKHLYSSESEMLKAAPGQQIILPLKKLSVEYGALPVLGSAPVVAAGGVAGHTNKMTKMSPDATQSNMTDD KALNYTAQQAASLGSQLQSRSLHGDYAKDTALGIAGNQASSQLQAWLQHYGTAEVNLQSGNNFDGSSLDFLLPFYDSEKM LAFGQVGARYIDSRFTANLGAGQRFFLPENMLGYNVFIDQDFSGDNTRLGIGGEYWRDYFKSSVNGYFRMSGWHESYNKK DYDERPANGFDIRFNGYLPSYPALGAKLMYEQYYGDNVALFNSDKLQSNPGAATVGVNYTPIPLVTMGIDYRHGTGNEND LLYSMQLRYQFDKPWSQQIEPQYVNELRTLSGSRYDLVQRNNNIILEYKKQDILSLNIPHDINGTEHSTQKIQLIVKSKY GLDRIVWDDSALRSQGGQIQHSGSQSAQDYQAILPAYVQGGSNIYKVTARAYDRNGNSSNNVQLTITVLSNGQVVDQVGV TDFTADKTSAKADGTEAITYTATVKKNGVTQANVPVSFNIVSGTATLGANSATTDANGKATVTLKSSTPGQVVVSAKTAE MTSALNASAVIFVEQTKASITEIKADKTTAVANGNDAVTYTVKVMKEGQPVQGHSVAFTTNFGMFNGKSQTQNATTGSDG RATITLTSSSAGKATVSATVSGGNDVKAPEVTFFDGLKIDNKVDILGKNVTGDLPNIWLQYGQFKLKVSGGNGTYSWHSE NTNIATVDESGKVTLKGKGTAVINVTSGDKQTVSYTIKAPNYMIRVGNKASYANAMSFCGNLLPSSQTVLSNVYNSWGPA NGYDHYRSMQSITAWITQTEADKISGVSTTYDLITQNPHKDVTLNAPNVYAVCVE