PAI Gene Information

Name : papC_2 (c5186)
Accession : NP_757034.1
PAI name : PAI II CFT073
PAI accession : NC_004431_P2
Strain : Escherichia coli 042
Virulence or Resistance: Virulence
Product : PapC protein
Function : -
Note : Residues 8 to 839 of 843 are 43.20 pct identical to residues 1 to 842 of 879 from EDL933 : z3600
Homologs in the searched genomes : 271 hits ( 271 protein-level )
Publication :

Extensive mosaic structure revealed by the complete genome sequence of uropathogenic Escherichia coli

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 17020-17024 (2002) PUBMED 12471157

Direct Submission

Submitted (10-SEP-2004) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

Direct Submission

Submitted (20-JUN-2002) Genetics Laboratory, University of Wisconsin - Madison, 445 Henry Mall, Madison, WI 53706, USA

DNA sequence :
GTGAATCTGGTGATGCGTGGAATGAAAGACAGAATACCTTTTGCAGTCAACAATATTACCTGTGTGATATTGTTGTCTCT GTTTTGTAACGCAGCCAGTGCCGTTGAGTTTAATACAGATGTACTTGACGCGGCGGACAAGAAAAATATTGACTTCACCC GTTTTTCAGAAGCCGGCTATGTTCTGCCGGGGCAATATCTTCTGGATGTGATTGTTAACGGGCAAAGTATTTCTCCCGCA TCGTTACAGATTTCATTTGTTGAACCTCAGTCGTCAGGAGATAAGGCAGAAAAAAAATTGCCGCAGGCCTGCCTGACATC AGATATGGTCAGACTGATGGGGTTAACAGCAGAATCTCTGGATAAAGTTGTTTACTGGCATGATGGTCAGTGTGCGGATT TTCATGGGTTGCCGGGAGTGGATATTCGTCCTGATACCGGAGCGGGCGTATTACGCATCAATATGCCGCAGGCCTGGCTT GAGTATTCTGATGCCACCTGGCTGCCTCCCTCACGCTGGGACGACGGCATTCCCGGACTGATGCTGGATTATAACCTCAA CGGGACGGTTTCCCGTAATTATCAGGGAGGAGACTCTCATCAGTTCAGTTATAACGGGACTGTGGGGGGGAATCTGGGGC CCTGGCGCCTGCGGGCTGACTATCAGGGAAGCCAGGAGCAGAGCCGCTACAACGGGGAAAAAACGACAAACAGAAATTTC ACATGGAGTCGCTTTTATCTGTTCCGTGCCATTCCACGATGGCGGGCAAACCTGACGCTGGGCGAGAATAATATCAACTC AGATATATTCCGGTCATGGAGTTATACGGGAGCCAGCCTGGAAAGCGATGACCGGATGCTGCCACCCAGACTGCGAGGCT ATGCACCGCAGATTACCGGGATTGCGGAGACTAATGCCCGTGTTGTGGTGTCGCAGCAGGGACGGGTGCTGTACGACTCG ATGGTCCCCGCAGGGCCATTCAGTATTCAGGACCTGGACAGTTCAGTTCGCGGACGTCTTGATGTTGAGGTTATTGAACA GAACGGACGGAAGAAAACCTTTCAGGTCGATACGGCCTCGGTTCCTTATCTGACGCGTCCGGGACAGGTCCGGTACAAAC TTGTCTCCGGTCGCTCCCGCGGATACGGGCATGAGACCGAAGGGCCTGTATTTGCAACCGGAGAGGCGTCCTGGGGGCTC AGTAACCAGTGGTCGCTGTATGGCGGGGCTGTGCTTGCCGGTGATTATAATGCACTGGCAGCCGGTGCCGGCTGGGACCT GGGTGTGCCGGGGACCCTTTCCGCTGATATCACGCAGTCAGTAGCCCGTATTGAGGGAGAGAGAACGTTTCAGGGAAAAT CCTGGCGTCTTAGCTACTCCAAACGGTTTGATAATGCGGATGCCGACATTACGTTCGCCGGGTATCGTTTCTCAGAGCGA AACTATATGACCATGGAGCAGTACCTGAACGCCCGCTACCGTAATGATTACAGCAGTCGGGAAAAAGAGATGTATACCGT TACGCTGAATAAAAACGTGGCGGACTGGAACACCTCTTTTAACCTGCAGTACAGCCGTCAGACATACTGGGACATACGGA AAACGGACTATTATACGGTGAGCGTCAACCGCTACTTTAATGTTTTCGGACTGCAGGGTGTGGCGGTTGGATTGTCAGCC TCAAGGTCTAAATATCTGGGGCGTGATAACGATTCTGCTTACCTGCGTATATCCGTGCCGCTGGGGACGGGGACAGCGAG CTACAGTGGCAGTATGAGTAATGACCGTTATGTGAATATGGCCGGCTACACTGACATGTTCAATGACGGTCTGGACAGCT ACAGCCTGAACGCCGGCCTTAACAGTGGCGGTGGACTGACATCGCAACGTCAGATTAATGCCTATTACAGTCATCGTAGT CCGCTGGCAAATTTGTCCGCGAATATTGCATCCCTGCAGAAAGGATATACGTCTTTCGGCGTCAGTGCTTCCGGTGGGGC AACAATTACCGGAAAAGGTGCGGCGTTACATGCAGGGGGAATGTCCGGTGGAACACGTCTTCTTGTTGACACGGATGGTG TGGGAGGTGTACCGGTTGATGGCGGGCAGGTGGTGACAAATCGCTGGGGAACGGGCGTGGTGACTGACATCAGCAGTTAT TACCGGAATACAACCTCTGTTGACCTGAAGCGCTTACCGGATGATGTGGAAGCAACCCGTTCTGTTGTGGAATCGGCGCT GACAGAAGGTGCCATTGGTTACCGGAAATTCAGCGTGCTTAAAGGGAAACGTCTGTTTGCAATACTGCGTCTTGCTGATG GCTCTCAGCCCCCGTTTGGTGCCAGTGTAACCAGTGAAAAAGGCCGGGAGCTGGGCATGGTGGCCGACGAAGGCCTTGCC TGGCTGAGTGGCGTGACGCCGGGGGAAACCCTGTCGGTAAACTGGGATGGAAAAATACAGTGTCAGGTAAATGTACCGGA GACAGCAATATCTGACCAGCAGTTATTGCTTCCCTGTACGCCTCAGAAATAA
Protein sequence :
MNLVMRGMKDRIPFAVNNITCVILLSLFCNAASAVEFNTDVLDAADKKNIDFTRFSEAGYVLPGQYLLDVIVNGQSISPA SLQISFVEPQSSGDKAEKKLPQACLTSDMVRLMGLTAESLDKVVYWHDGQCADFHGLPGVDIRPDTGAGVLRINMPQAWL EYSDATWLPPSRWDDGIPGLMLDYNLNGTVSRNYQGGDSHQFSYNGTVGGNLGPWRLRADYQGSQEQSRYNGEKTTNRNF TWSRFYLFRAIPRWRANLTLGENNINSDIFRSWSYTGASLESDDRMLPPRLRGYAPQITGIAETNARVVVSQQGRVLYDS MVPAGPFSIQDLDSSVRGRLDVEVIEQNGRKKTFQVDTASVPYLTRPGQVRYKLVSGRSRGYGHETEGPVFATGEASWGL SNQWSLYGGAVLAGDYNALAAGAGWDLGVPGTLSADITQSVARIEGERTFQGKSWRLSYSKRFDNADADITFAGYRFSER NYMTMEQYLNARYRNDYSSREKEMYTVTLNKNVADWNTSFNLQYSRQTYWDIRKTDYYTVSVNRYFNVFGLQGVAVGLSA SRSKYLGRDNDSAYLRISVPLGTGTASYSGSMSNDRYVNMAGYTDMFNDGLDSYSLNAGLNSGGGLTSQRQINAYYSHRS PLANLSANIASLQKGYTSFGVSASGGATITGKGAALHAGGMSGGTRLLVDTDGVGGVPVDGGQVVTNRWGTGVVTDISSY YRNTTSVDLKRLPDDVEATRSVVESALTEGAIGYRKFSVLKGKRLFAILRLADGSQPPFGASVTSEKGRELGMVADEGLA WLSGVTPGETLSVNWDGKIQCQVNVPETAISDQQLLLPCTPQK