PAI Gene Information

Name : ECUMN_3356 (ECUMN_3356)
Accession : YP_002414032.1
PAI name : Not named
PAI accession : NC_011751_P1
Strain : Escherichia coli 042
Virulence or Resistance: Virulence
Product : bifunctional enterobactin receptor/adhesin protein
Function : -
Note : IrgA-homologue adhesin (Iha); TonB-dependent; acts as a specific receptor of enterobactin; fur-regulated; urovirulence factor
Homologs in the searched genomes : 60 hits ( 60 protein-level )
Publication :

Direct Submission

Submitted (14-DEC-2008) Genoscope - Centre National de Sequencage : BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr - Web : www.genoscope.cns.fr)

Organised genome dynamics in the Escherichia coli species results in highly diverse adaptive paths

PLoS Genet. 5 (1), E1000344 (2009) PUBMED 19165319

Direct Submission

Submitted (18-DEC-2008) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

DNA sequence :
ATGCGAATAACCACTCTGGCTTCCGTAGTCATTCCCTGTCTCGGATTTTCAGCCAGCAGCATAGCTGCTGCAGAGGATGT GATGATTGTCTCGGCATCCGGCTATGAGAAAAAGCTGACTAACGCAGCCGCCAGTGTTTCTGTGATTAGCCAGGAGGAAT TGCAGTCCAGCCAGTACCACGATCTGGCGGAGGCTCTGAGATCAGTAGAGGGTGTGGATGTTGAAAGTGGTACGGGTAAA ACCGGTGGGCTGGAAATCAGCATCCGAGGAATGCCAGCCAGTTACACGCTGATACTGATTGATGGTGTTCGTCAGGGCGG AAGCAGTGACGTGACTCCCAACGGTTTTTCTGCCATGAATACCGGGTTCATGCCCCCTCTGGCCGCCATTGAGCGTATTG AGGTTATCAGGGGGCCGATGTCCACACTGTATGGCTCTGATGCGATGGGCGGTGTGGTGAATATCATTACCAGAAAGAAT GCAGACAAATGGCTCTCTTCCGTCAATGCAGGGCTGAATCTGCAGGAAAGCAACAAATGGGGTAACAGCAGCCAGTTTAA TTTCTGGAGCAGTGGTCCCCTTGTGGATGATTCTGTCAGCCTGCAGGTACGCGGTAGCACACAACAGCGTCAGGGCTCAT CGGTCACATCACTGAGCGATACAGCAGCCACGCGTATTCCTTATCCCACGGAGTCACAGAATTATAATCTTGGTGCACGT CTTGACTGGAAGGCGTCGGAGCAGGATGTGCTCTGGTTTGATATGGATACCACCCGGCAGCGTTATGATAACCGGGATGG GCAACTGGGGAGTCTGACGGGGGGATATGACCGGACCCTGCGCTATGAGCGAAACAAAATTTCAGCTGGCTATGATCATA CTTTCACCTTCGGAACATGGAAATCGTATCTGAACTGGAACGAGACAGAAAATAAAGGTCGTGAGCTCGTACGCAGTGTA CTGAAGCGCGACAAATGGGGGCTTGCCGGTCAGCCGCGGGAGCTTAAGGAATCGAACCTTATCCTGAATTCATTACTGCT TACCCCTCTGGGAGAATCTCATCTGGTTACGGTGGGGGGCGAGTTTCAGAGCTCGTCCATGAAAGACGGAGTTGTCCTTG CCAGCACAGGTGAAACTTTCCGGCAGAAAAGCTGGTCGGTATTTGCTGAGGATGAGTGGCATCTCACGGATGCACTTGCG CTGACTGCGGGCAGCCGCTATGAACATCATGAGCAATTCGGGGGACACTTCAGTCCGCGTGCATATCTGGTCTGGGATGT GGCAGATGCCTGGACGCTGAAAGGCGGTGTGACCACGGGATATAAGGCACCCAGAATGGGGCAGCTACATAAAGGGATTA GTGGTGTATCCGGGCAGGGAAAAACAAATCTACTTGGTAACCCCAACCTGAAGCCGGAAGAGAGCGTCAGTTATGAGGCT GGGGTGTATTACGATAACCCCGCCGGTCTGAATGCCAATGTCACAGGTTTTATGACTGACTTCTCCAACAAGATTGTCTC TTATTCCATAAATGATAACACCAATAGCTATGTAAACAGCGGAAAGGCCCGGTTGCATGGTGTGGAATTTGCCGGCACAT TGCCGCTGTGGTCAGAGGATGTCACGCTGTCACTGAATTACACCTGGACCCGAAGTGAACAACGTGATGGTGATAACAAA GGTGCGCCGCTGAGTTATACCCCTGAACACATGGTGAATGCGAAACTGAACTGGCAGATCACCGAAGAGGTGGCATCATG GCTGGGTGCCCGTTATCGCGGGAAAACACCACGTTTCACCCAGAATTATTCGTCACTGAGCGCTGTACAGAAGAAAGTGT ATGATGAGAAAGGAGAATACCTGAAAGCCTGGACGGTGGTGGATGCAGGTCTGTCGTGGAAGATGACGGATGCCCTGACG CTGAATGCTGCGGTGAATAACCTGCTCAACAAGGATTACAGTGACGTGAGCCTGTACAGTGCCGGTAAGAGTACGCTGTA TGCCGGTGATTACTTCCAGACGGGATCATCAACAACAGGATATGTGATACCTGAGCGAAATTACTGGATGTCGCTGAACT ATCAGTTCTGA
Protein sequence :
MRITTLASVVIPCLGFSASSIAAAEDVMIVSASGYEKKLTNAAASVSVISQEELQSSQYHDLAEALRSVEGVDVESGTGK TGGLEISIRGMPASYTLILIDGVRQGGSSDVTPNGFSAMNTGFMPPLAAIERIEVIRGPMSTLYGSDAMGGVVNIITRKN ADKWLSSVNAGLNLQESNKWGNSSQFNFWSSGPLVDDSVSLQVRGSTQQRQGSSVTSLSDTAATRIPYPTESQNYNLGAR LDWKASEQDVLWFDMDTTRQRYDNRDGQLGSLTGGYDRTLRYERNKISAGYDHTFTFGTWKSYLNWNETENKGRELVRSV LKRDKWGLAGQPRELKESNLILNSLLLTPLGESHLVTVGGEFQSSSMKDGVVLASTGETFRQKSWSVFAEDEWHLTDALA LTAGSRYEHHEQFGGHFSPRAYLVWDVADAWTLKGGVTTGYKAPRMGQLHKGISGVSGQGKTNLLGNPNLKPEESVSYEA GVYYDNPAGLNANVTGFMTDFSNKIVSYSINDNTNSYVNSGKARLHGVEFAGTLPLWSEDVTLSLNYTWTRSEQRDGDNK GAPLSYTPEHMVNAKLNWQITEEVASWLGARYRGKTPRFTQNYSSLSAVQKKVYDEKGEYLKAWTVVDAGLSWKMTDALT LNAAVNNLLNKDYSDVSLYSAGKSTLYAGDYFQTGSSTTGYVIPERNYWMSLNYQF