PAI Gene Information

Name : DIP0233 (DIP0233)
Accession : NP_938624.1
PAI name : Not named
PAI accession : NC_002935_P3
Strain : Corynebacterium diphtheriae 241
Virulence or Resistance: Not determined
Product : fimbrial associated sortase-like protein
Function : -
Note : Similar to Actinomyces naeslundii fimbrial associated protein TR:O05996 (EMBL:U85709) (280 aa) fasta scores: E(): 4.5e-16, 40.000% id in 215 aa, and to Staphylococcus aureus sortase SrtA TR:Q9S446 (EMBL:AF162687) (206 aa) fasta scores: E(): 1.2, 26.923% i
Homologs in the searched genomes : 90 hits ( 90 protein-level )
Publication :

Direct Submission

Submitted (03-OCT-2003) Cerdeno-Tarraga A.M., submitted on behalf of the Pathogen Sequencing Unit, Sanger Institute, Wellcome Trust Genome Campus, Hinxton, Cambridge CB10 1SA E-mail: amct@sanger.ac.uk

Direct Submission

Submitted (08-APR-2002) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

The complete genome sequence and analysis of Corynebacterium diphtheriae NCTC13129

Nucleic Acids Res. 31 (22), 6516-6523 (2003) PUBMED 14602910

DNA sequence :
ATGACAGACCAACCCCCAACGCCGAACACGGCGGACGCAACCCCGCCCCGCCAAGACAAGAAGCTGAACACCAACGCGAT CATTGCCGTCGTCCTCATCCTCGCCGGCCTGGGCGTACTGCTATACCCAGTGCTCGCCACCCAGTGGAATAACTACCAGC AGTCCCGCGCCGCCGAGGCCTACTCGCAGCTGGAAAAGGGCGTGCCCCCAGAGGTCCTCAATAAGGCCTGGGAGGAGGCG CAGCAATACAACGCCAATCTCGGGGATATCGACCCCGGCGATGCGTGGACCAGCTCCGACGACGAGAGCTCCTCGGCGTA TCAGCGCTACCTGAATTACCTCTCCGCCCTGAACGAGACTGAGGCCATGGGCCGCATTGTGCTGCCCTCCATCAAATCCG ATCTGCCAATCTTCCACGGCACCTCCGACCGCGTGCTGGCCCGCGGGGTCGGCCACCTTTACGGCACGGACCTGCCTGTT GGCGCACCCGGCGAGCTCGGCGAGGATGGCGTTATCCCGCCCGCCCCACCAGAGGGCCGACTCTCCGCGCTTTCTGCCCA TACCGGCCTGCAGAACGCCACCCTGTGGGACAACCTCATCCAGATCAAGAAGGGCGACCCGGTCTACGTCGCCGCGGCGG GCGAGAAGCTTAAGTACGAGGTCCGGAACATCGAGGTCGTCACCCCGGATAAGACCAGCCTGCTGCGCCGCACGTCGAAT AAGGACCAGGTCACGCTCATCACCTGCACCCCCTATGGCATCAACACCCACCGGCTGATCATCACCGCCGAGCGCGTGCC GATGGATCCGCAGGGAGAGTCCGCCTTCGACGGGCAGGGCACTACCTGGCAGTGGTGGATGTGGGCCATCCTCGCTGCCG CGGCGATCATCGTGCTGCTGCTGATCCGCTGGTGGTGGAAGAACTTCCGCAAGCAGGAAGGCGAGGAGGGCCCCACAACC TCCGGCGCTGGGGGCACCACGGAGAGTTAA
Protein sequence :
MTDQPPTPNTADATPPRQDKKLNTNAIIAVVLILAGLGVLLYPVLATQWNNYQQSRAAEAYSQLEKGVPPEVLNKAWEEA QQYNANLGDIDPGDAWTSSDDESSSAYQRYLNYLSALNETEAMGRIVLPSIKSDLPIFHGTSDRVLARGVGHLYGTDLPV GAPGELGEDGVIPPAPPEGRLSALSAHTGLQNATLWDNLIQIKKGDPVYVAAAGEKLKYEVRNIEVVTPDKTSLLRRTSN KDQVTLITCTPYGINTHRLIITAERVPMDPQGESAFDGQGTTWQWWMWAILAAAAIIVLLLIRWWWKNFRKQEGEEGPTT SGAGGTTES