PAI Gene Information

Name : c3610 (c3610)
Accession : NP_755485.1
PAI name : PAI I CFT073
PAI accession : NC_004431_P1
Strain : Escherichia coli 042
Virulence or Resistance: Not determined
Product : bifunctional enterobactin receptor/adhesin protein
Function : -
Note : IrgA-homologue adhesin (Iha); TonB-dependent; acts as a specific receptor of enterobactin; fur-regulated; urovirulence factor
Homologs in the searched genomes : 60 hits ( 60 protein-level )
Publication :

Extensive mosaic structure revealed by the complete genome sequence of uropathogenic Escherichia coli

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 17020-17024 (2002) PUBMED 12471157

Direct Submission

Submitted (10-SEP-2004) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

Direct Submission

Submitted (20-JUN-2002) Genetics Laboratory, University of Wisconsin - Madison, 445 Henry Mall, Madison, WI 53706, USA

DNA sequence :
ATGCGAATAACCACTCTGGCTTCCGTAGTCATTCCCTGTCTCGGATTTTCAGCCAGCAGCATAGCTGCTGCAGAGGATGT GATGATTGTCTCGGCATCCGGCTATGAGAAAAAGCTGACTAACGCAGCCGCCAGTGTTTCTGTGATTAGCCAGGAGGAAT TGCAGTCCAGCCAGTACCACGATCTGGCGGAGGCTCTGAGATCAGTAGAGGGTGTGGATGTTGAAAGTGGTACGGGTAAA ACCGGTGGGCTGGAAATCAGCATCCGAGGAATGCCAGCCAGTTACACGCTGATACTGATTGATGGTGTTCGTCAGGGCGG AAGCAGTGACGTGACTCCCAACGGTTTTTCTGCCATGAATACCGGGTTCATGCCCCCTCTGGCCGCCATTGAGCGTATTG AGGTTATCAGGGGGCCGATGTCCACACTGTATGGCTCTGATGCGATGGGCGGTGTGGTGAATATCATTACCAGAAAGAAT GCAGACAAATGGCTCTCTTCCGTCAATGCAGGGCTGAATCTGCAGGAAAGCAACAAATGGGGTAACAGCAGCCAGTTTAA TTTCTGGAGCAGTGGTCCCCTTGTGGATGATTCTGTCAGCCTGCAGGTACGCGGTAGCACACAACAGCGTCAGGGCTCAT CGGTCACATCACTGAGCGATACAGCAGCCACGCGTATTCCTTATCCCACGGAGTCACAGAATTATAATCTTGGTGCACGT CTTGACTGGAAGGCGTCGGAGCAGGATGTGCTCTGGTTTGATATGGATACCACCCGGCAGCGTTATGATAACCGGGATGG GCAACTGGGGAGTCTGACGGGGGGATATGACCGGACCCTGCGCTATGAGCGAAACAAAATTTCAGCTGGCTATGATCATA CTTTCACCTTCGGAACATGGAAATCGTATCTGAACTGGAACGAGACAGAAAATAAAGGTCGTGAGCTCGTACGCAGTGTA CTGAAGCGCGACAAATGGGGGCTTGCCGGTCAGCCGCGGGAGCTTAAGGAATCGAACCTTATCCTGAATTCATTACTGCT TACCCCTCTGGGAGAATCTCATCTGGTTACGGTGGGGGGCGAGTTTCAGAGCTCGTCCATGAAAGACGGAGTTGTCCTTG CCAGCACAGGTGAAACTTTCCGGCAGAAAAGCTGGTCGGTATTTGCTGAGGATGAGTGGCATCTCACGGATGCACTTGCG CTGACTGCGGGCAGCCGCTATGAACATCATGAGCAATTCGGGGGACACTTCAGTCCGCGTGCATATCTGGTCTGGGATGT GGCAGATGCCTGGACGCTGAAAGGCGGTGTGACCACGGGATATAAGGCACCCAGAATGGGGCAGCTACATAAAGGGATTA GTGGTGTATCCGGGCAGGGAAAAACAAATCTACTTGGTAACCCCAACCTGAAGCCGGAAGAGAGCGTCAGTTATGAGGCT GGGGTGTATTACGATAACCCCGCCGGTCTGAATGCCAATGTCACAGGTTTTATGACTGACTTCTCCAACAAGATTGTCTC TTATTCCATAAATGATAACACCAATAGCTATGTAAACAGCGGAAAGGCCCGGTTGCATGGTGTGGAATTTGCCGGCACAT TGCCGCTGTGGTCAGAGGATGTCACGCTGTCACTGAATTACACCTGGACCCGAAGTGAACAACGTGATGGTGATAACAAA GGTGCGCCGCTGAGTTATACCCCTGAACACATGGTGAATGCGAAACTGAACTGGCAGATCACCGAAGAGGTGGCATCATG GCTGGGTGCCCGTTATCGCGGGAAAACACCACGTTTCACCCAGAATTATTCGTCACTGAGCGCTGTACAGAAGAAAGTGT ATGATGAGAAAGGAGAATACCTGAAAGCCTGGACGGTGGTGGATGCAGGTCTGTCGTGGAAGATGACGGATGCCCTGACG CTGAATGCTGCGGTGAATAACCTGCTCAACAAGGATTACAGTGACGTGAGCCTGTACAGTGCCGGTAAGAGTACGCTGTA TGCCGGTGATTACTTCCAGACGGGATCATCAACAACAGGATATGTGATACCTGAGCGAAATTACTGGATGTCGCTGAACT ATCAGTTCTGA
Protein sequence :
MRITTLASVVIPCLGFSASSIAAAEDVMIVSASGYEKKLTNAAASVSVISQEELQSSQYHDLAEALRSVEGVDVESGTGK TGGLEISIRGMPASYTLILIDGVRQGGSSDVTPNGFSAMNTGFMPPLAAIERIEVIRGPMSTLYGSDAMGGVVNIITRKN ADKWLSSVNAGLNLQESNKWGNSSQFNFWSSGPLVDDSVSLQVRGSTQQRQGSSVTSLSDTAATRIPYPTESQNYNLGAR LDWKASEQDVLWFDMDTTRQRYDNRDGQLGSLTGGYDRTLRYERNKISAGYDHTFTFGTWKSYLNWNETENKGRELVRSV LKRDKWGLAGQPRELKESNLILNSLLLTPLGESHLVTVGGEFQSSSMKDGVVLASTGETFRQKSWSVFAEDEWHLTDALA LTAGSRYEHHEQFGGHFSPRAYLVWDVADAWTLKGGVTTGYKAPRMGQLHKGISGVSGQGKTNLLGNPNLKPEESVSYEA GVYYDNPAGLNANVTGFMTDFSNKIVSYSINDNTNSYVNSGKARLHGVEFAGTLPLWSEDVTLSLNYTWTRSEQRDGDNK GAPLSYTPEHMVNAKLNWQITEEVASWLGARYRGKTPRFTQNYSSLSAVQKKVYDEKGEYLKAWTVVDAGLSWKMTDALT LNAAVNNLLNKDYSDVSLYSAGKSTLYAGDYFQTGSSTTGYVIPERNYWMSLNYQF