PAI Gene Information

Name : unnamed
Accession : CAD42018.1
PAI name : PAI II 536
PAI accession : AJ494981
Strain : Escherichia coli 042
Virulence or Resistance: Not determined
Product : hypothetical protein
Function : -
Note : ORF2; putative superfamily I DNA helicase
Homologs in the searched genomes : 42 hits ( 41 protein-level, 1 DNA-level )
Publication :

Direct Submission

Submitted (11-JUL-2002) Dobrindt U., Inst. f. Molekulare Infektionsbiologie, Universitaet Wuerzburg, Roentgenring 11, 97070 Wuerzburg, GERMANY

Genetic structure and distribution of four pathogenicity islands (PAI I(536) to PAI IV(536)) of uropathogenic Escherichia coli strain 536

Infect. Immun. 70 (11), 6365-6372 (2002) PUBMED 12379716

DNA sequence :
ATGGATAAAAATGCTTTAGGGTTTGCCTCATACTGGCGCAACTCGCTTGCGGATGCTGAGTCAGGAAAGGGCAGTTTTAA ACGGAAAGACGCCCAAAATTTCACTCACTGGCATGGGATAGCGGCGGGACGTCTTGACGAAGCGATTGTCAGTAAATTTT TTGAGGGAGAAAAAGACGATGTCGAAACGGTCGATGTCATCTTGCGCCCAAAAGTTTATTTCCGGTTACTGCAGCATGGT AAGGACCGTTCCGCAGGCGCGCCTGATATTGTTACCCCGATAGTGACGCCAGCCTTGCTAAGCCGTGAGGGTTTTTTATA TCCGACGCCAGCGACATCCATTCCCAGAGACCTGCTTGAACCTTTGCCAAAAGGAGCATTTTCGATTGGTGAGATTGGGC AGTATGACAAATACAAGACAATCCATACCTCATTCTCTATCAACTTTGATGACGGCATTGATAAGACTGCCGAAACGGAT GAAGAACGGGAAGCACGATATGCAGCCTTGCAGCAGGAGTGGCGTCAATATCTGGATGATTCAGAGAGGCTACTGAAGAA CGTTGCCGGCGACTGGATTAAAAATCCTGAGCAATATGAACTCGCTGAGCACGGTTATATTGTTAAAACGGCGCAATCTG GCGGTGCCAGTTTCCATATCCTTTCTCTTTATGAACACCTGCTTGTTTGCAAGAAGGATGTGCCGCTCTTCAATCGCTTC GCCTCGCGAGAGGTTCATGCTGCAGAGTCTTTGCTGGCCCCAGGCGCAAAATTCAGCGACAGGCTTGGACACTCCGGAGA TAAGTTTCCGCTGGCAAAGGCTCAGCGCGATGCCTTAAGCCATTTTCTGGATGCAAGACATGGCGATATCCTTGCTGTTA ATGGCCCTCCGGGAACCGGAAAAACCACGCTGGTGCTTTCTATCATCGCCACGCAGTGGGCCAGAGCAGCTCTCGAAAAA TCTGAGCCTCCGGTTATTATCGCGACTTCAACGAATAACCAGGCTGTAACGAACATTATTGAGGCATTCGGGAAAGACTT TTCGCAAGGTTCAGGTGCGATGGCCGGGCGATGGTTGCCAGAGCTGAAAAGTTTCGGCGCTTATTTTCCCTCAAGCAGCC GTAAAGCTGAAGCAGCCAAAAAATATCAAACTGAAGATTTCTTCAACCAGGTTGAGTCAAAAGAGTATGTAGAAGATGCA CTGCTGTTTTATCTCGAGAAAGCTAAGGCAGCTTTTCCTGAAAAAGAGTGTTCATCCCCTGAAAAGGTCATTGAACTCCT GCATGGTCAGTTGGCAGCAAAATCCGAGCAACTGATAAGACTGAACGCAACATGGCAAACGTTAAGCCAGGTACGGGCTG CGCGTGAGCTTATTGCTAACGACATTGAGCAATATCTCGATAATTTAAATAAATTACTTTCCGGACAAGAACAAAAAATC ACTCTACTGAAAAGTGCTAAAACGGAATGGAAAAAATATCGCGCCGGTGAATCACTGATCTATTCATTATTTTCCTGGCT CCCGGCGGTTCGCAGTAAGCGACAGTACCAAATACAACTGTTTCTCGAAGATAAATTAGGTGCGCTGATTGCAGGAAATC AGTGGTCTGATCCTGAAACTATCGAACGTAATATTGATGGGCTGCTCAATTCCGCTGAGCGCGAGCAAACAACATACCGG CAGCAGATTGACTCCGCCCATGAAATCATTCTTAAAGAACAGCAGGCGGTTCAGGAGTGGCAGAGACTGGCTCTTGATTT AGGGTATGAGGGCGACGAGGAACTGAGCTTCTCACTGGCCGATGAACTGGCTGATACGCAGATTCGCTTCCCTGCATTTT TACTGACGACTCACTACTGGGAAGGTCGTTGGCTGATGGATATGGCCAGCATTGATGATCTGCAGGAAGAGAAGAAGAAA AAAGGCGCTAAAGGGGTAACCGCCCGTTGGCAACGTCGAATGAAACTCACTCCATGTGTGGTGATGACATGCTATATGCT GCCCGGCAATATGCAGATAAGTGAGCACAAAGGACAGCGTAAATTCGAGAAAAGTTATTTGTATGATTTTGCCGATTTAC TCATTGTCGATGAAGCCGGGCAGGTGCTTCCTGAAGTGGCTGCTGCCTCGTTTGCATTAGCTAAGAAGGCATTAGTGATT GGCGATACGGAGCAGCTCCCGCCAATATGGAGTATTGCTCCTGCGATTGATGTCGGTAACATGCTGGCGGAAAAAATTCT GTCTGGCAGTACGCAAGAAGAGATTACCGAGAAATATACGGCAATCGCAGACCTTGGTAAAAGTGCCGCATCTGGCAGCG TTATGAAAATAGCGCAGTTTGCTTCACGCTATCAATATGATCCCGAACTGGCTCGTGGTATGTACCTATATGAACACCGC CGGTGCTACGACAATATTATTGGATACTGTAATACGCTCTGCTATCACGGTAAGTTGTTGCCTAAAAGAGGGCGTGAAGA GAGCAATTTAATGCCCGAAATGGGGTATCTCCATATTGATGGTAAAGGTGAGCTGGCAAGTAGTGGAAGTCGATATAATT TGCTTGAGGCTGAAACGATAGCGGTCTGGTTGGCAGAGAACCAGCAAAATATTGAAGCGCATTACGGTAAATCGCTTCAT GAAGTTGTCGGTATCGTGACGCCTTTTAGCGCTCAGGTATCCACTATCAAACAGGTGCTGGGCAAACAAGGTATCAGTAC AGGCGCGAATGAAAAATCGCTCACAGTGGGCACCGTGCACTCTCTTCAGGGAGCGGAAAGAGCGATTGTGATATTCTCGC CAGTCTATTCAAAACATGAAGACGGCGGGTTTATTGATAGCGATAACAGCATGCTGAATGTTGCAGTCTCCCGTGCGAAG GACAGTTTTCTGGTCTTCGGCGATATGGACCTGTTTGAGGTCCAGCCAGCCTCATCTCCACGGGGATTACTGGCAAAATA CCTCTTTGAGTCAGAGAAGAATGCGCTCTCTTTTGATTATAAAGAGCGTAAGGATTTAAAAACCGCCGGGACCAAAATCT ACACACTTCATGGTGTGGAGCAACATGATAATTTCCTGAATCAGACATTTGAAAATACCAGTAAACACATCACGATAGTT TCTCCATGGCTGACCTGGCAAAGGCTGGAGCAAACCGGTTTTCTTGATTCCATGATTGCGGCGTGTTCACGTGGAATTAA CGTCACGATAGTCACTGACAGAAGCTACAACACTGAACATAATGATTTTGAGATGCGAAAAGAGAAGCAGCAAAACTTTA AAGCGGCGCTGGAGAAACTGAATGCGCTGGGTATTGCTACAAAGCTGGTAAACCGTGTTCATAGCAAAATTGTTATTGGT GATGATGGTTTGCTGTGCGTGGGATCGTTCAACTGGTTTAGTGCGACACGGGAAGCGCGATATGAACGATACGATACCTC AATGGTTTATTGCGGTGATAACCTGAAGGGTGAGATTGAGGCTATTTATAATAGTCTTGAGAGGCGTCAGGTTTAG
Protein sequence :
MDKNALGFASYWRNSLADAESGKGSFKRKDAQNFTHWHGIAAGRLDEAIVSKFFEGEKDDVETVDVILRPKVYFRLLQHG KDRSAGAPDIVTPIVTPALLSREGFLYPTPATSIPRDLLEPLPKGAFSIGEIGQYDKYKTIHTSFSINFDDGIDKTAETD EEREARYAALQQEWRQYLDDSERLLKNVAGDWIKNPEQYELAEHGYIVKTAQSGGASFHILSLYEHLLVCKKDVPLFNRF ASREVHAAESLLAPGAKFSDRLGHSGDKFPLAKAQRDALSHFLDARHGDILAVNGPPGTGKTTLVLSIIATQWARAALEK SEPPVIIATSTNNQAVTNIIEAFGKDFSQGSGAMAGRWLPELKSFGAYFPSSSRKAEAAKKYQTEDFFNQVESKEYVEDA LLFYLEKAKAAFPEKECSSPEKVIELLHGQLAAKSEQLIRLNATWQTLSQVRAARELIANDIEQYLDNLNKLLSGQEQKI TLLKSAKTEWKKYRAGESLIYSLFSWLPAVRSKRQYQIQLFLEDKLGALIAGNQWSDPETIERNIDGLLNSAEREQTTYR QQIDSAHEIILKEQQAVQEWQRLALDLGYEGDEELSFSLADELADTQIRFPAFLLTTHYWEGRWLMDMASIDDLQEEKKK KGAKGVTARWQRRMKLTPCVVMTCYMLPGNMQISEHKGQRKFEKSYLYDFADLLIVDEAGQVLPEVAAASFALAKKALVI GDTEQLPPIWSIAPAIDVGNMLAEKILSGSTQEEITEKYTAIADLGKSAASGSVMKIAQFASRYQYDPELARGMYLYEHR RCYDNIIGYCNTLCYHGKLLPKRGREESNLMPEMGYLHIDGKGELASSGSRYNLLEAETIAVWLAENQQNIEAHYGKSLH EVVGIVTPFSAQVSTIKQVLGKQGISTGANEKSLTVGTVHSLQGAERAIVIFSPVYSKHEDGGFIDSDNSMLNVAVSRAK DSFLVFGDMDLFEVQPASSPRGLLAKYLFESEKNALSFDYKERKDLKTAGTKIYTLHGVEQHDNFLNQTFENTSKHITIV SPWLTWQRLEQTGFLDSMIAACSRGINVTIVTDRSYNTEHNDFEMRKEKQQNFKAALEKLNALGIATKLVNRVHSKIVIG DDGLLCVGSFNWFSATREARYERYDTSMVYCGDNLKGEIEAIYNSLERRQV