PAI Gene Information

Name : cadC (c5142)
Accession : NP_756990.1
PAI name : PAI II CFT073
PAI accession : NC_004431_P2
Strain : Escherichia coli 042
Virulence or Resistance: Not determined
Product : DNA-binding transcriptional activator CadC
Function : -
Note : regulates the cadBA operon
Homologs in the searched genomes : 121 hits ( 119 protein-level, 2 DNA-level )
Publication :

Extensive mosaic structure revealed by the complete genome sequence of uropathogenic Escherichia coli

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 17020-17024 (2002) PUBMED 12471157

Direct Submission

Submitted (10-SEP-2004) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

Direct Submission

Submitted (20-JUN-2002) Genetics Laboratory, University of Wisconsin - Madison, 445 Henry Mall, Madison, WI 53706, USA

DNA sequence :
ATGCAACAACCTGTAGTTCGCGTTGGCGAATGGCTTGTTACTCCGTCCATAAACCAAATTAGCCGCAATGGGCGTCAACT TACCCTTGAGCCGAGATTAATCGATCTTCTGGTTTTCTTTGCTCAACACAGTGGCGAAGTACTTAGCAGGGATGAACTTA TCGATAATGTCTGGAAGAGAAGTATTGTCACCAATCACGTTGTGACGCAGAGTATCTCAGAACTACGTAAGTCATTAAAA GATAATGATGAAGATAGTCCTGTCTATATCGCTACTGTACCAAAGCGCGGCTATAAATTAATGGTGCCGGTTATCTGGTA CAGCGAAGAAGAGGGAGAGGAAATAATGCTATCTTCGCCTCCCCCTATACCAGAGGCGGTTCCTGCCACAGATTCTCCCT CCCACAGTCTTAACATTCAAAACACCACAACGCCACCTGAACAATCCCCAGTTAAAAGCAAACGATTCACTACCTTTTGG GTATGGTTTTTTTTCCTGTTGTCGTTAGGTATCTGTGTCGCACTGGTAGCGTTTTCAAGTCTTGAAACACGTCTTCCTAT GAGTAAATCGCGCATTTTGCTCAATCCACGCGATATTGACATTAATATGGTTAATAAGAGTTGTAACAGCTGGAGTTCTC CGTATCAGCTCTCTTACGCGATAGGCGTGGGTGATTTGGTGGCGACATCACTTAACACCTTCTCCACCTTTATGGTGCAT GACAAAATCAACTACAACATTGATGAACCGAGCAGTTCCGGTAAAACATTATCTATTGCGTTTGTTAATCAGCGCCAATA CCGTGCTCAACAATGCTTTATTTCGGTAAAATTGGTAGACAATGCAGATGGTTCAACCATGCTGGATAAACGTTATGTCA TCACTAACGGTAATCAGCTGGCGATTCAAAATGATTTGCTCCAGAGTTTATCAAAAGCGTTAAACCAACCGTGGCCACAA CGAATGCAGGAGATGCTCCAGCAAATTTTGCCGCATCGTGGTGCGTTATTAACTAATTTTTATCAGGCACATGATTATTT ACTGCATGGTGATGATAAATCATTGGATCGTGCCAGTGAATTATTAGGTGAGATTGTTCAATCATCCCCAGAATTTACCT ACGCGAGAGCAGAAAAAGCATTAGTTGATATCGTGCGCCATTCTCAACATCCTTTAGACGAAAAACAATTAGCAGCACTG AACACAGAAATAGATAACATTGTTACACTGCCGGAATTGAACAACCTGTCCATTATATATCAAATAAAAGCGGTCAGTGC CCTGGTAAAAGGTAAAACAGATGAGTCTTATCAGGCGATAAATACCGGCATTGATCTTGAAATGTCCTGGCTAAATTATG TGTTGCTTGGCAAGGTTTATGAAATGAAGGGGATGAACCGGGAAGCAGCTGATGCATATCTCACCGCCTTTAATTTACGC CCAGGGGCAAACACCCTTTACTGGATTGAAAATGGTATATTCCAGACTTCTGTTCCTTATGTTGTACCTTATCTCGACAA ATTTCTCGCTTCAGAATAA
Protein sequence :
MQQPVVRVGEWLVTPSINQISRNGRQLTLEPRLIDLLVFFAQHSGEVLSRDELIDNVWKRSIVTNHVVTQSISELRKSLK DNDEDSPVYIATVPKRGYKLMVPVIWYSEEEGEEIMLSSPPPIPEAVPATDSPSHSLNIQNTTTPPEQSPVKSKRFTTFW VWFFFLLSLGICVALVAFSSLETRLPMSKSRILLNPRDIDINMVNKSCNSWSSPYQLSYAIGVGDLVATSLNTFSTFMVH DKINYNIDEPSSSGKTLSIAFVNQRQYRAQQCFISVKLVDNADGSTMLDKRYVITNGNQLAIQNDLLQSLSKALNQPWPQ RMQEMLQQILPHRGALLTNFYQAHDYLLHGDDKSLDRASELLGEIVQSSPEFTYARAEKALVDIVRHSQHPLDEKQLAAL NTEIDNIVTLPELNNLSIIYQIKAVSALVKGKTDESYQAINTGIDLEMSWLNYVLLGKVYEMKGMNREAADAYLTAFNLR PGANTLYWIENGIFQTSVPYVVPYLDKFLASE