PAI Gene Information

Name : c5216 (c5216)
Accession : NP_757064.1
PAI name : PAI II CFT073
PAI accession : NC_004431_P2
Strain : Escherichia coli 042
Virulence or Resistance: Not determined
Product : prophage P4 integrase
Function : -
Note : Int(P4); Escherichia coli K-12 ortholog: b4271; Escherichia coli O157:H7 ortholog: z4313
Homologs in the searched genomes : 515 hits ( 514 protein-level, 1 DNA-level )
Publication :

Extensive mosaic structure revealed by the complete genome sequence of uropathogenic Escherichia coli

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 17020-17024 (2002) PUBMED 12471157

Direct Submission

Submitted (10-SEP-2004) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

Direct Submission

Submitted (20-JUN-2002) Genetics Laboratory, University of Wisconsin - Madison, 445 Henry Mall, Madison, WI 53706, USA

DNA sequence :
ATGGCACTGACTGACGCAAAAATCCGGGCTGCAAAGCCCACTGACAAGGCTTATAAACTCACTGACGGGGCTGGCATGTT CCTGCTGGTACATCCTAATGGCTCCCGTTACTGGCGTCTCCGTTATCGTATTCTGGGTAAGGAGAAGACTCTGGCACTTG GTGTGTATCCAGAAGTTTCTCTCTCCGAAGCTCGTACAAAACGGGATGAGGCCCGAAAACTGATTTCGGAGGGGGTTGAC CCTTGCGAACAGAAAAGAGCTAAAAAAGTAGTCCCTGATTTACAGCTCTCTTTTGAACATATTGCGCGACGCTGGCATGC CAGTAATAAACAATGGGCACAATCACACAGCGATAAAGTACTCAAAAGCCTCGAGACTCACGTTTTCCCCTTTATCGGCA ACCGGGATATCACAACACTCAATACCCCGGATCTGCTTATCCCTGTTCGTGCTGCAGAAGCTAAACAAATTTATGAAATC GCCAGTCGTCTGCAGCAAAGAATATCTGCCGTAATGCGTTATGCCGTACAGTCTGGCATCATCAGATATAATCCTGCTCT GGATATGGCTGGCGCATTGACCACGGTAAAACGCCAGCATCGCCCCGCTCTTGATCTTTCTCGCCTGCCTGAACTTTTGT CGCGTATTAGCAGTTACAAGGGGCAACCTGTCACCCAGCTTGCCGTTATGCTGAATTTACTGGTTTTTATTCGTTCCAGT GAACTCAGATACGCCCGGTGGTCTGAAATTGATATTGACAATGCCATGTGGACTATTCCAGCCGAACGCGAACCTCTGCC CGGCGTAAAATTCTCACACCGGGGCTCCAAGATGCGAACACCACATCTTGTGCCACTCAGCAAACAGGCTGTAGCCATAC TGACAGAACTTCAGACATGGGCTGGTGAAAATGGTCTGATATTTACGGGTGCACATGACCCGCGTAAACCAATCAGTGAA AATACTGTAAATAAGGCCCTGAGGGTGATGGGGTATGACACAACCCAGGAAGTCTGTGGCCATGGATTCCGGGCGATGGC GTGCAGTGCATTGATTGAATCAGGTTTGTGGTCCCGCGATGCTGTGGAACGTCAGATGAGCCATCAGGAGCGTAATGGTG TACGTGCTGCGTATATCCATAAAGCAGAACATCTGGAAGAACGGCGACTGATGTTGCAATGGTGGGCCGATTTTCTGGAT GCGAACCGGGAGAAGGGTATCAGTCCGTTTGAATATGCAAAGATTAACAATCCATTAAAATAG
Protein sequence :
MALTDAKIRAAKPTDKAYKLTDGAGMFLLVHPNGSRYWRLRYRILGKEKTLALGVYPEVSLSEARTKRDEARKLISEGVD PCEQKRAKKVVPDLQLSFEHIARRWHASNKQWAQSHSDKVLKSLETHVFPFIGNRDITTLNTPDLLIPVRAAEAKQIYEI ASRLQQRISAVMRYAVQSGIIRYNPALDMAGALTTVKRQHRPALDLSRLPELLSRISSYKGQPVTQLAVMLNLLVFIRSS ELRYARWSEIDIDNAMWTIPAEREPLPGVKFSHRGSKMRTPHLVPLSKQAVAILTELQTWAGENGLIFTGAHDPRKPISE NTVNKALRVMGYDTTQEVCGHGFRAMACSALIESGLWSRDAVERQMSHQERNGVRAAYIHKAEHLEERRLMLQWWADFLD ANREKGISPFEYAKINNPLK