Gene Information

Name : DIP2010 (DIP2010)
Accession : NP_940341.1
Strain : Corynebacterium diphtheriae NCTC13129
Genome accession: NC_002935
Putative virulence/resistance : Virulence
Product : surface-anchored membrane protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 2059672 - 2065290 bp
Length : 5619 bp
Strand : -
Note : Similar to Actinomyces viscosus usher-like protein precursor TR:Q9AJ93 (EMBL:AF106034) (1411 aa) fasta scores: E(): 0.034, 22.657% id in 843 aa, and to Actinomyces naeslundii fimbrial associated protein TR:O05995 (EMBL:U85708) (375 aa) fasta scores: E():

DNA sequence :

GTGAGTAACCTACGCACCATCAAGAAACGAGCGTCTATCCCCGCAGCACTCGTCGCCATCCTCGCAATGGTCATGAGCAT
TGTTCTTGTGCCGTTAATTGCAGCGCCATCAGCGAATGCGGAGCCACTGCCGAAAAAAGAGTTTGAAACCTGTGGCGGTT
CTGTTGCGATTTCCTTTGACTTGTCCAATTCCCTGAGCGCTTCGGACGTGGAAAAATCTAAGCAAGCAGCGTTGGAGCTG
GTCAAGAGCTTGAAAGGATCTCCCTATCGTTTTGGTATTTATACCTTTGCTTCACACTCGCCTGCTGCTGGAAACAAAAA
TTTCACGCCAGTAAGTCTTGCTAATGATGACGGATACAACAAAGTTGTTGCCGCTATCAATGACATCCAGATGCCAGCGA
TCCGAGAGAACAAAAAGGGTTCTCCCAACGGTGGTACCAACTGGGAGGGCGGGCTCCAAGCAATCGCGAATGACATAGAC
AGAGGCATCAAGTATGACGCCGTTTACTTCATCACTGATGGTCAACCAACTTGGGATAACAATGGGAGAAATTGGTTGGG
AACCACCACCGAGGTTGTGGAATTAGAAAATGCCGTTACCCAAGCCAAACTTATTTCTGATAAAGGCGCAAAACTTATTC
CGGTGGGTATTGGCCAGCTTTCTGATGATAAGCCGTTTGATCTCTATAAACCGATTCTTCCTTCCGAAGACGATTACTAT
TGGTCGCGTTATCCATGGAAAATAGATCGTTCCCTGACCGGCAAACAAATGCTGGAGAAGATAACCTCACCGGGCCTAGA
GCCAATTATTTTGCCCGACTATTCCACATTGCCGCAGCGAATGGGACAACAGATTTTTACCGGATGTTTCCAAATCGCTA
AAAACATTATTGATGCAGACGGAAACGTGATAGAAAATCCAGCTGGCTGGAATTTCGATATTACAGCGGCTGGTGTGCAA
GGCATTCCTCCGTCGATCGAGACAGATAAAAATGGCCAAGACACCTTTGCTATGAAGTCGATTAATAAGGAATCCTTTAA
GATCACTATCACTGAGCGACCTACCGGAGATCAAAAACAAAACTTCCGGTTTAAAAACGCACGCTGCCAGCGCTACTCCT
ATGGGCAAGCACCTACTGATATTCCGATCAAAACTAGCGATACTTCAATTACTTTGACTGCAGACACCAAAAGCTTGATT
TCTTGCGGTTTTAACAATCTGCCAGTTGTACCAGTCTCGGTTTCGAAAAAAGTAAACGTAAATACGCCACAACTTTTAGA
AGAGCTCAACAATCAAACCTTTGATTTCACCTATAGCTGTGAAAAAGGAGCTAATGAAAAAGAAATCAAGGGAGAAATTA
AGGGCGTCCACAACGGAGAATCCAAAGAAATCGGAAAAGTTGCTGTTGGAACTCAGTGCGAAATCAAGGAAGTTACCCCC
AAAGTCGACGATTCTCGGATGAAGCTTTCCACCACTTGGAGCAGTGAAAACACCACTGCAGATGCTAATCAGGATAACGG
TACATACCGCTTTAAAGCCGACACCGATGCGTTTAAAAACAAGAAAACAGTTCTAGCTACAGCAGAAAATAACTATGAGG
CTCAAACAGCCACTATTAAGCTGACCAAGACCATCATTAACCGTGACAAAATTCCAGCAACAAAACTGCCCGAGAAGTTT
CCTGTCACTTACACCTGTCGTTACGTACCACATCCTAATGCTCGCCCCGAACATGGTGGGCTCCCAGAAACCAATCCGTA
TTTTGTAGACTCTAAAACCGTTGTCGTTCCTCGTGATGGAAGTATAGAAATCGGACCTTTTCCAGTGGGAACACAGTGCA
GTTTTGAAGAAACTGCACGACTCGATCCGAATGTTCAAGCAGACGCTAAAATTCCTGGTTTTAGTTTGAAAACTGAGTGG
AATTCCAACATCTGTTTTGGAAACACTATCGATAATAATTCTCAAGATTGTTCTACTAACTCAGTATGGATTCCCAAACC
AGGTCAATATTCGCTCAACGTAGAAAATACATACACGCGTGAGCTTGCGAGCGTGGAGATCGAAAAGACGGTGAGCGGCG
ATGCCTCTGATCTCACGAATTCACACGAGTTTTCATTCAATCTTCGATGTGAAGATTCCGGAGTAGAAGTCTATTCGCAA
GACAATATCGTGGTGAAGAAGGACGGACGGCAAGTCATCGAAAACATTCCTGTCGATGCCAATTGTACGTTGAGCGAAAA
ACAGCCTGAACAAAAAGGCGTGGATTTTGTGGTCCCCGCGCCGTTCCATCTTCGTGCTTCAACTGCCGGCGACATTGTCA
AAGTGGTTGTAGATAACACCGCAAAACGTCAGGTAGCTCCTATTTCAATACAGAAAAAAGTTCATAAAAAAGACACATTT
TCTCCTGAAATTTCTGCATCAATCGATGCATTAACATACAGTGTGGTGGCAGAATGTACGGTTCCTGGTGTAGAAACGCC
TCGAAAAGTTCTAAAAACAGTAAGTGATAATCAAACTGTTGAATTTGGAAACTTTCCAGTGGGAACTACTTGTAGCTTTA
GCGAGCTCACCGAAGCCCCTGCCGGAACCGAAATGAGTTATAAATTCGCGGATGGTCCAGAGGTGACAATTGAGGACTCC
ACTCCTATAAATAAGGTGCTGACGAATACGTTTGAAAATGCACGTGGCGAGCTAAAAGTAACCAAAAAAGTACTCGATGG
TGATATGCCTCAAGCATTAGTAGACCAGATTCCATCGAGTTTTACAGTCAACGTCGCATGCTCAATCACCGGTAATCATT
CCATCACTTTGCAAAAAGATGAGCAGAAAGCCGTACCTGGGGTTGTTGCAGGTGAAAGCTGCACATTAAGTGAGGAAGTA
ACTCCTATAACTGGGGCTACCCATCACAAGCACTGGATTAAAGGCGAGCTGCTTGAAGTTGCAGATTCTACGGACATCAC
GATTAACCCTAATGGTAGTAACGCAATTCGATTGGAAAACCATTACGAAACCGATGCTGTATCTTTGGAACTTACCAAAC
GTGTTCGGGTCATTGACCAAGTTGGAAATGACGTTAACTCGGAACTAAAAAATGCAGTTGTCCGTCCAGAACAACCCTTC
CTATTCCGATACCGTTGTGAAATCAATGGTCAAGTAGTTGCAGAAAATACCTTAAGCGCCGATGCGATTAACACTGGTGC
CACTAAGGTGCCACGGGGATCTATTTGTACGGTTGAAGAAGATTCCTCTTCAGTGGAGTTGTCTAATGCAACGTTATCTC
ACGTTGAGTTCTTCGTTCACGGAACAAAAACGAATGATAAGGCATCGGTAGCGATAAACTCGGATCATAACCGACTAGAT
GCTACTAATACTTTCACGTTGAAGACTGGCTCATTTAACCTTAAAAAGAAAGTCGATGGTGAAGGAGTATCTACCATCCA
TGAGGATCGACGCTTTGAAATTTCGTATCGTTGTACCTTAGGCGACTGGAAGAAAAACGGCACCATTACGCTGGGACGTT
TTGATAGTGCCGAATCGCATTCTGTTAAAGACATTCCCGTGGGTGCATCATGTGAGATTATTGAGGACTCTGAGAAAGCC
CAAGAGCCAAACGCACAAGTGACAGCTCGTTGGACTCATACAGACAGCACGAATGGCTGGGGCGATACCGAAGCAGCATG
CGAAAATCATGCAGCGTGCGAAGTGGATCCAAAAAATGAGTTTGCAACCACAGTGGTTATTGCTGGAAATGAGAAAGAGA
ATTTCCAAGGAACCTTTATCGTATGGAACACCTACACTTACGATAAAACAAAGGTAGAGATCAACAAGGTGTTGACGAAT
GATGGTCCAGAACTTGCTGGTAAAGATAACTTTGCCTTCACCTTGAAATGTACTGATCCTCGTTTTGCAGGAAGTGATTT
GGCAGATAAGCATTCCATTCCAGACCCCACAATTACAGTTGCATTAAATGCTAAAGGCCAAAGCCGAGCGTCGTACCAAG
TTGCAGACGAACGGCACGATAGCGTTGAGGTTCCTGTTGGGTATAACTGCACTGTGACCGAAAACCCGATTGCACTTTAT
GATGCCAAAGCGACGACCCAATTCAGTGGTCCGGCAGTGGTGGAAAATACGGCTGTGCAACGCACATCATCAAACTCCGC
CTCGGCTCGTTTTGTCACGGAGAAACAAGAAAATAATGGCACTCAAAAAATTCAGGTAACTAATGATTACATTCGTCCGC
GCGCCGATGTCATGGTGCATAAGACAATCGCAAAACCAGAACACTCGGTAGATCCTTGGTTGCTTAACACTACATACAGC
ATCACTTATAAGTGCGACGATCCATACATCAAGGATCGTTCCTATTCAAACGACGTAGATATACAAGCTGATGCAGAAAA
ACCAACGCCAATTTTCGCTGATCCTACGGCTCACGTAAAAATTCCTGCGTCGGCAGTATGTACTTTCAGTGAAAACACCG
AAGGGCATTTACCAGGAGAGGTAAAAGGCGTAGTGGATGAAACGAATAAAGTTGCTGAATTCGCTGGGGAACATGAAAAG
CGCTCCTATTTCACCCCAGAAATTAAAGATGTTGTTTTGTCGGAATCTGAACCAACACGAATTGAATTCACCAATTCATA
CGTGATGCCTCAACGAATTTTGAGCCTACAAAAATATGTTGAGGGCGACCCCGGCCATGCTGTGATTGCTCCAGAAGAAA
CATTTGAATTCTCCTACACCTGCACCATGCCGCATCTATTCCCAAATCAACCCAATCCTATGTCGCAAGAAGTAGGAAAC
AAGGTTGCACGTGGCGTCATTAAGATTCGAGAAGGTGAGACATGGCGATCTCCTGAAGTCCCTATTGGTACGTCCTGCAC
GATCAAGGAAGAAGACGACCCCGCCTTGCGCACCAAGTTGGAAAACAATGCGCTGCGCATGGTGCCTACCTACTTGTTCC
CCACGGAGCGTGCAGGAGCTGCTAGTGCGCCAGTGATTCCGCCGTTGACAGACCGTCCGATTTATAACGGCACGGAGCCT
CGCCTCCAGATGCCAGAATCAGGCATTGAGCTTAACGACGCCCACTCGCACACCGTGGTGATCAACAACGTGTACACCAC
TGACGCTGAGATCAACATTGCCAAGGTGAACGCCGATAACTCTCCGCTGCCCGGCGCGCACTTCGCCATCTATGGGATAG
GGGAGAATGGCCAGCGTAAAGAGTTGCCTGAGGTTGCGGATGCGCCGGCGAAGTCGGCGAAGTCGGTGGAGCAGGCGTTG
TTTGCAGTGCGCTTGCGCCCTGGTAGTTACGAGTTGGTGGAGACTCAGGCTCCTCAGGGTGGGCAGTTGCTGCCTAAGCC
GTGGCGTTTTGATGTCAAGGCTGCGAATGCGGGTGCGATAGGTGATCTTGAGGTGACCTTGGATAACTATGATGCTGATT
CGGGGTTGATCACGGTGGAGCACCCGCAGGGTAAGCCGTGGTTGATCAAGGTGGCTAATGTGTCGGCATCCACACTGCCG
TTGACTGGTTCGAATGGTTACTTGCGGTGGCTGTTGGCCGGTGCTGCGGGCCTGTTGGTGGCTGCAGCATTGTGGTTAGT
GGCGCGTCGTAAGCGTTAG

Protein sequence :

MSNLRTIKKRASIPAALVAILAMVMSIVLVPLIAAPSANAEPLPKKEFETCGGSVAISFDLSNSLSASDVEKSKQAALEL
VKSLKGSPYRFGIYTFASHSPAAGNKNFTPVSLANDDGYNKVVAAINDIQMPAIRENKKGSPNGGTNWEGGLQAIANDID
RGIKYDAVYFITDGQPTWDNNGRNWLGTTTEVVELENAVTQAKLISDKGAKLIPVGIGQLSDDKPFDLYKPILPSEDDYY
WSRYPWKIDRSLTGKQMLEKITSPGLEPIILPDYSTLPQRMGQQIFTGCFQIAKNIIDADGNVIENPAGWNFDITAAGVQ
GIPPSIETDKNGQDTFAMKSINKESFKITITERPTGDQKQNFRFKNARCQRYSYGQAPTDIPIKTSDTSITLTADTKSLI
SCGFNNLPVVPVSVSKKVNVNTPQLLEELNNQTFDFTYSCEKGANEKEIKGEIKGVHNGESKEIGKVAVGTQCEIKEVTP
KVDDSRMKLSTTWSSENTTADANQDNGTYRFKADTDAFKNKKTVLATAENNYEAQTATIKLTKTIINRDKIPATKLPEKF
PVTYTCRYVPHPNARPEHGGLPETNPYFVDSKTVVVPRDGSIEIGPFPVGTQCSFEETARLDPNVQADAKIPGFSLKTEW
NSNICFGNTIDNNSQDCSTNSVWIPKPGQYSLNVENTYTRELASVEIEKTVSGDASDLTNSHEFSFNLRCEDSGVEVYSQ
DNIVVKKDGRQVIENIPVDANCTLSEKQPEQKGVDFVVPAPFHLRASTAGDIVKVVVDNTAKRQVAPISIQKKVHKKDTF
SPEISASIDALTYSVVAECTVPGVETPRKVLKTVSDNQTVEFGNFPVGTTCSFSELTEAPAGTEMSYKFADGPEVTIEDS
TPINKVLTNTFENARGELKVTKKVLDGDMPQALVDQIPSSFTVNVACSITGNHSITLQKDEQKAVPGVVAGESCTLSEEV
TPITGATHHKHWIKGELLEVADSTDITINPNGSNAIRLENHYETDAVSLELTKRVRVIDQVGNDVNSELKNAVVRPEQPF
LFRYRCEINGQVVAENTLSADAINTGATKVPRGSICTVEEDSSSVELSNATLSHVEFFVHGTKTNDKASVAINSDHNRLD
ATNTFTLKTGSFNLKKKVDGEGVSTIHEDRRFEISYRCTLGDWKKNGTITLGRFDSAESHSVKDIPVGASCEIIEDSEKA
QEPNAQVTARWTHTDSTNGWGDTEAACENHAACEVDPKNEFATTVVIAGNEKENFQGTFIVWNTYTYDKTKVEINKVLTN
DGPELAGKDNFAFTLKCTDPRFAGSDLADKHSIPDPTITVALNAKGQSRASYQVADERHDSVEVPVGYNCTVTENPIALY
DAKATTQFSGPAVVENTAVQRTSSNSASARFVTEKQENNGTQKIQVTNDYIRPRADVMVHKTIAKPEHSVDPWLLNTTYS
ITYKCDDPYIKDRSYSNDVDIQADAEKPTPIFADPTAHVKIPASAVCTFSENTEGHLPGEVKGVVDETNKVAEFAGEHEK
RSYFTPEIKDVVLSESEPTRIEFTNSYVMPQRILSLQKYVEGDPGHAVIAPEETFEFSYTCTMPHLFPNQPNPMSQEVGN
KVARGVIKIREGETWRSPEVPIGTSCTIKEEDDPALRTKLENNALRMVPTYLFPTERAGAASAPVIPPLTDRPIYNGTEP
RLQMPESGIELNDAHSHTVVINNVYTTDAEINIAKVNADNSPLPGAHFAIYGIGENGQRKELPEVADAPAKSAKSVEQAL
FAVRLRPGSYELVETQAPQGGQLLPKPWRFDVKAANAGAIGDLEVTLDNYDADSGLITVEHPQGKPWLIKVANVSASTLP
LTGSNGYLRWLLAGAAGLLVAAALWLVARRKR

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
DIP2010	NP_940341.1	surface-anchored membrane protein	Not tested	Not named	Protein	0.0	100

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
DIP2010	NP_940341.1	surface-anchored membrane protein	VFG2199	Protein	0.0	100