PAI Gene Information

Name : DIP0752 (DIP0752)
Accession : NP_939125.1
PAI name : Not named
PAI accession : NC_002935_R2
Strain : Corynebacterium diphtheriae 241
Virulence or Resistance: Not determined
Product : IS element transposase
Function : -
Note : Similar to Escherichia coli possible transposase of IS1353 YahA TR:Q9WTH9 (EMBL:AP000342) (514 aa) fasta scores: E(): 2.6e-62, 41.595% id in 464 aa, and to Escherichia coli transposase InsK for insertion sequence element IS150 or B3558 SW:INSK_ECOLI (P197
Homologs in the searched genomes : 67 hits ( 67 protein-level )
Publication :

Direct Submission

Submitted (03-OCT-2003) Cerdeno-Tarraga A.M., submitted on behalf of the Pathogen Sequencing Unit, Sanger Institute, Wellcome Trust Genome Campus, Hinxton, Cambridge CB10 1SA E-mail: amct@sanger.ac.uk

Direct Submission

Submitted (08-APR-2002) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

The complete genome sequence and analysis of Corynebacterium diphtheriae NCTC13129

Nucleic Acids Res. 31 (22), 6516-6523 (2003) PUBMED 14602910

DNA sequence :
ATGAACCGTTCCTACACCAACACGCAGAAGCGCACAGCACTGCGGGTCTACAAACGCACACAATCAGTGACTAAAACAGT CCGCGAACTCGGCTACCCAGGCAGATGGACCCTGTATAAATGGCTACGCGAGCCCAAAACCCCACCACAACCACGTAAAC AAGCCAAAACCCTGACCCACTACCCATACGAAGTCAAACTTCGCGCAGTAGAACTTTTCCACAATGGTTGGCGACCAGCT GATATTGCCCAGGAATGCTGCCTGCACACTCACGCCAGCGTCTATGCTTGGGCGCAACGCTACCGTGAGGAAGGACAATG GGGCTTGATGTCGAAAAAAGAACGCGCAGGCCATGGCCGCATCCCTACTAAAGCAGCACTAGAAAAATCATTGCCGGATA ATCCAACACAGTTAAAACAGCAGATGGCCACGCTGCTGGTAGAAAAAGCCGTGTTGGAAAAGGAGCTGGAAATTATAAAA AAAGACGTAAGCGTCATCCCCGGTCAGCTGAGTAATAAGCACAAAACCGACGTGGTTGACGCTTTGCGTAGCACGTTTCC ATTAGCAATGCTGCTCGCTGCTAGTGGTCTTGCTGCATCCAGTTTCTATTACCACCTGAAAAAACGACGCATGCCTGATA AGCACGCAGCTATTCGCAGCATGGTGCACCGCATCAGTTCTGATTCACATAATACCTATGGTTATCGCCGTATCTGGTGG CAATTACGACATTTAGGCATAACTATCAGTGAAAAAGTAGTTCGCAGGCTCATGCGCGAAGAAGCAATTACGGTGCGGTT TCCGAAGCGGAAGGTGAAATATTCCAGTTATCAAGGAGAAATTTCTCCGGCTCCGCCGAACCTGGTCAACCGTTGTTTTC ATGCCACTGCTGCGAATACGTTGTGGCTGACTGATATTAGTGTTTTCGCTGCGAATGAGGGGCGGGTGTATTTGTCTGTG ATTATTGATTGTTTCGATGGCAAAGTCGTTGCTGCTAAGACGAGTGTGAATCCCACTATGGAGTTAGCAGAATCTACGCT GCAGGCCGCTATTGATGCTGAGGGTCTTCCACCGGATGGTTCATTAGTGATTCATTCAGATCGTGGTGTGCATTACCGTG GTCGGAGTTGGCATAGTCTGACTGCGAAATATGGCATCGTTCGTTCGATGTCGAAAAAGGGGTGTAGTCCTGACAATGCG GCATGCGAGGGGTTTTTCGGGCGGATGAAAAATGAGATGTATTACGGCAAGAGGTGGCAGACAATCCAAGAGCTTGACGA TGCCATTGCTGCTTATATCGAGTTTTATAACAATCATCGCATTAAAGTTAGTCTCAATGGTATGAGTATCGCGCGTTATC GCATGGCTGCGGTAGCGTGA
Protein sequence :
MNRSYTNTQKRTALRVYKRTQSVTKTVRELGYPGRWTLYKWLREPKTPPQPRKQAKTLTHYPYEVKLRAVELFHNGWRPA DIAQECCLHTHASVYAWAQRYREEGQWGLMSKKERAGHGRIPTKAALEKSLPDNPTQLKQQMATLLVEKAVLEKELEIIK KDVSVIPGQLSNKHKTDVVDALRSTFPLAMLLAASGLAASSFYYHLKKRRMPDKHAAIRSMVHRISSDSHNTYGYRRIWW QLRHLGITISEKVVRRLMREEAITVRFPKRKVKYSSYQGEISPAPPNLVNRCFHATAANTLWLTDISVFAANEGRVYLSV IIDCFDGKVVAAKTSVNPTMELAESTLQAAIDAEGLPPDGSLVIHSDRGVHYRGRSWHSLTAKYGIVRSMSKKGCSPDNA ACEGFFGRMKNEMYYGKRWQTIQELDDAIAAYIEFYNNHRIKVSLNGMSIARYRMAAVA