Gene Information

Name : tcdB (CD196_0600)
Accession : YP_003213639.1
Strain : Clostridium difficile CD196
Genome accession: NC_013315
Putative virulence/resistance : Virulence
Product : toxin B
Function : -
COG functional category : R : General function prediction only
COG ID : COG5263
EC number : -
Position : 710024 - 717124 bp
Length : 7101 bp
Strand : +
Note : -

DNA sequence :

ATGAGTTTAGTTAATAGAAAACAGTTAGAAAAAATGGCAAATGTAAGATTTCGTGTTCAGGAAGATGAATATGTAGCAAT
ATTGGATGCTTTAGAAGAATATCATAATATGTCAGAGAATACTGTAGTCGAAAAATATTTAAAATTAAAAGATATAAATA
GTTTAACAGATATTTATATAGATACATATAAAAAGTCTGGTAGAAATAAAGCCTTAAAAAAATTTAAGGAATACCTAGTT
ACAGAAGTATTAGAGCTAAAGAATAATAATTTAACTCCAGTTGAGAAAAATTTACATTTTGTTTGGATTGGAGGTCAAAT
AAATGACACTGCTATTAATTATATAAATCAATGGAAAGATGTAAATAGTGATTATAATGTTAATGTTTTTTATGATAGTA
ATGCATTTTTGATAAACACATTGAAAAAAACTATAGTAGAATCAGCAACAAATGATACACTTGAATCATTTAGAGAAAAC
TTAAATGACCCTAGATTTGACTATAATAAATTTTACAGAAAACGTATGGAGATAATCTATGATAAGCAGAAAAATTTCAT
AAATTACTATAAAACTCAAAGAGAAGAAAATCCTGACCTTATAATTGATGATATTGTAAAGATATATCTTTCAAACGAGT
ATTCAAAGGATATAGATGAACTTAATTCCTATATTGAAGAGTCATTAAATAAAGTTACAGAAAATAGTGGGAATGATGTT
AGAAACTTTGAAGAATTTAAAGGTGGAGAGTCATTCAAATTATATGAACAAGAGTTGGTAGAAAGATGGAATTTGGCAGC
TGCTTCTGACATATTAAGAATATCTGCCTTAAAAGAAGTTGGTGGTGTATATTTAGATGTTGATATGTTACCAGGAATAC
AACCAGACCTATTTGAGTCTATAGAGAAACCTAGTTCAGTAACAGTGGATTTTTGGGAAATGGTAAAATTAGAAGCTATA
ATGAAATACAAAGAATACATACCAGGATATACTTCAGAGCATTTTGATATGTTGGATGAAGAAGTTCAAAGTAGTTTTGA
ATCTGTTCTAGCTTCTAAGTCAGATAAGTCAGAAATATTCTCATCACTTGGCGATATGGAGGCATCACCACTAGAAGTTA
AAATTGCATTTAATAGTAAAGGTATTATAAATCAAGGACTAATTTCTGTGAAAGACTCATATTGTAGCAATTTAATAGTA
AAACAAATCGAGAACAGATATAAGATATTGAATAATAGTTTAAATCCAGCTATTAGCGAGGATAACGATTTCAATACTAC
AACGAATGCTTTTATTGATAGTATAATGGCTGAAGCTAATGCAGATAATGGTAGATTTATGATGGAACTAGGAAAGTATT
TAAGAGTTGGTTTCTTCCCAGATGTTAAAACTACTATTAACTTAAGTGGCCCTGAAGCATATGCGGCAGCTTATCAAGAT
TTATTAATGTTTAAAGAAGGTAGTATGAATATCCATTTGATAGAAGCTGACTTAAGAAACTTTGAAATCTCTAAAACTAA
TATTTCTCAATCAACTGAACAAGAAATGGCTAGCTTATGGTCATTTGACGATGCAAGAGCTAAAGCTCAATTTGAAGAAT
ACAAAAAAAATTACTTTGAAGGTTCTCTTGGAGAAGATGACAATCTTGACTTTTCTCAAAATACAGTAGTTGACAAGGAG
TATCTTTTAGAAAAAATATCTTCATTAGCAAGAAGTTCAGAGAGAGGATATATACACTATATTGTTCAGTTACAAGGAGA
TAAAATTAGTTATGAAGCAGCATGTAACTTATTTGCAAAGACTCCTTATGATAGTGTACTGTTTCAGAAAAATATAGAAG
ATTCAGAAATTGCATATTATTATAATCCTGGAGATGGTGAAATACAAGAAATAGACAAGTATAAAATTCCAAGTATAATT
TCTGATAGACCTAAGATTAAATTAACATTTATTGGTCATGGTAAAGATGAATTTAATACTGATATATTTGCAGGTCTTGA
TGTAGATTCATTATCCACAGAAATAGAAACAGCAATAGATTTAGCTAAAGAGGATATTTCTCCTAAGTCAATAGAAATAA
ACTTACTGGGATGTAACATGTTTAGCTATTCTGTAAATGTAGAGGAGACTTATCCTGGGAAATTATTACTTAGAGTTAAA
GATAAAGTATCAGAATTAATGCCATCTATAAGTCAAGACTCTATTATAGTAAGTGCAAATCAATATGAAGTTAGAATAAA
TAGTGAAGGAAGAAGAGAATTATTGGATCATTCTGGTGAATGGATAAATAAAGAAGAAAGTATTATAAAGGATATTTCAT
CAAAAGAATATATATCATTTAATCCTAAAGAAAATAAAATTATAGTAAAATCTAAAAATTTACCTGAATTATCTACATTA
TTACAAGAAATTAGAAACAATTCTAATTCAAGTGATATTGAACTAGAAGAAAAAGTAATGTTAGCAGAATGTGAGATAAA
TGTTATTTCAAATATAGATACACAAGTGGTAGAAGGAAGGATTGAAGAAGCTAAAAGCTTAACTTCTGACTCTATTAATT
ATATAAAGAATGAATTTAAACTAATAGAATCTATTTCTGATGCACTATACGATTTAAAACAACAGAATGAATTAGAAGAG
TCTCATTTTATATCTTTTGAGGATATATTGGAGACTGATGAAGGCTTTAGTATAAGATTTATTGATAAAGAAACTGGAGA
ATCTATATTTGTAGAAACTGAAAAGGCAATATTCTCTGAATATGCTAATCATATAACTGAAGAGATTTCTAAGATAAAAG
GTACTATATTTGATACTGTAAATGGTAAGTTAGTAAAAAAAGTAAATTTAGATGCTACACATGAAGTGAATACTTTAAAT
GCTGCATTTTTTATACAATCATTAATAGAATATAATAGTTCTAAAGAATCTCTTAGTAATTTAAGTGTAGCAATGAAAGT
TCAAGTTTATGCTCAATTATTTAGTACTGGTTTAAATACTATTACAGATGCAGCCAAAGTTGTTGAATTAGTATCAACTG
CATTAGATGAAACTATAGATTTACTTCCTACATTATCTGAAGGATTACCTGTAATTGCAACTATCATAGATGGTGTAAGT
TTAGGTGCAGCAATCAAAGAGCTAAGTGAAACAAGTGACCCATTATTAAGACAAGAAATAGAAGCTAAGATAGGTATAAT
GGCAGTAAATTTAACAGCAGCTACAACTGCAATCATTACTTCATCTTTAGGAATAGCTAGTGGATTTAGTATACTTTTAG
TTCCTTTAGCAGGAATTTCAGCAGGTATACCAAGTTTAGTAAACAATGAGCTTATCCTAAGAGATAAAGCAACAAAAGTT
GTAGATTATTTTAGTCATATATCATTAGCTGAGTCTGAAGGAGCATTTACTTCATTAGATGATAAAATAATGATGCCACA
AGATGATTTAGTAATATCTGAGATAGACTTTAATAACAATTCAATAACTTTAGGTAAATGTGAAATCTGGAGAATGGAAG
GTGGCTCAGGTCATACTGTAACTGATGATATAGATCACTTCTTTTCAGCACCATCAATAACATATAGAGAGCCACACTTA
TCTATATATGACGTATTGGAAGTACAAAAAGAAGAACTTGATTTGTCAAAAGATTTAATGGTATTACCTAATGCTCCAAA
TAGAGTATTTGCTTGGGAAACAGGATGGACACCAGGTTTAAGAAGCTTAGAAAATGATGGCACAAAACTGTTAGACCGTA
TAAGAGATAACTATGAAGGTGAGTTTTATTGGAGATATTTTGCTTTTATAGCTGATGCTTTAATAACAACATTAAAACCA
AGATATGAAGATACTAATATAAGAATAAATTTAGATAGTAATACTAGAAGCTTTATAGTCCCAGTGATAACTACAGAATA
TATAAGAGAGAAATTATCATATTCTTTTTATGGTTCTGGAGGAACTTATGCATTATCTCTTTCTCAATACAATATGAATA
TAAACATAGAATTAAATGAAAATGATACTTGGGTTATAGATGTCGACAATGTCGTAAGAGATGTCACTATAGAATCTGAT
AAAATTAAAAAAGGAGATTTAATAGAGAATATTTTATCTAAATTAAGTATTGAAGACAATAAAATTATTTTAGATAATCA
TGAAATTAATTTCTCTGGAACATTAAATGGAGGTAATGGATTTGTATCTTTAACATTCTCAATCTTAGAAGGAATAAATG
CAGTTATAGAAGTTGATTTATTATCTAAATCATATAAAGTTCTTATTTCTGGTGAACTAAAAACATTGATGGCAAATTCA
AATTCTGTTCAACAGAAAATAGATTATATAGGATTGAACAGCGAATTACAAAAAAATATACCTTATAGTTTTATGGATGA
TAAAGGAAAAGAAAATGGATTTATTAATTGTTCTACAAAAGAAGGTTTATTTGTATCTGAATTATCTGATGTAGTTCTTA
TAAGTAAAGTTTATATGGACAATAGTAAACCTCTATTTGGATATTGTAGTAATGATTTGAAAGATGTTAAAGTCATAACT
AAAGATGACGTTATTATATTAACAGGATATTATTTAAAAGATGATATAAAAATCTCTCTTTCTTTTACTATACAAGATGA
AAATACTATAAAATTAAATGGAGTATATTTAGATGAAAATGGAGTAGCTGAAATATTGAAATTTATGAATAAAAAAGGTA
GTACAAATACTTCAGATTCTTTAATGAGCTTTTTAGAAAGTATGAATATAAAAAGTATTTTCATAAATTCCTTACAATCT
AATACTAAGCTTATATTAGATACTAATTTTATAATAAGTGGTACTACTTCTATTGGTCAATTTGAGTTTATTTGTGATAA
AGATAATAATATACAACCATATTTCATTAAGTTTAATACACTAGAAACTAAATATACTCTATATGTAGGTAATAGACAAA
ATATGATAGTAGAACCAAATTATGATTTAGATGATTCTGGAGATATATCTTCAACTGTCATTAATTTTTCTCAGAAATAC
CTTTATGGAATAGACAGTTGTGTTAATAAAGTTATAATTTCGCCAAATATATATACAGATGAAATAAACATAACACCTAT
ATATGAAGCAAATAATACTTATCCAGAAGTGATTGTATTAGATACAAATTATATAAGTGAAAAAATCAATATTAATATCA
ATGATTTATCTATACGATATGTATGGAGTAATGATGGAAGTGATTTTATTCTTATGTCAACTGATGAAGAGAACAAGGTA
TCACAAGTTAAAATAAGATTTACTAATGTTTTTAAAGGTAATACTATATCAGATAAGATATCTTTTAATTTTAGTGATAA
GCAAGATGTATCTATAAATAAAGTTATTTCAACATTTACACCTTCATATTATGTGGAAGGATTACTTAATTATGATTTAG
GTCTGATTTCTTTATACAATGAGAAATTTTATATTAATAACTTTGGAATGATGGTGTCTGGATTAGTATATATTAATGAT
TCATTATATTATTTCAAGCCACCAATAAAGAACTTGATAACTGGATTTACAACTATAGGTGATGATAAATACTACTTTAA
TCCAGATAATGGTGGAGCTGCTTCAGTCGGAGAAACAATAATTGATGGCAAAAACTACTACTTCAGCCAAAATGGAGTGT
TACAAACAGGTGTATTTAGTACAGAAGATGGATTTAAATATTTTGCTCCAGCAGATACACTTGATGAAAATCTAGAGGGG
GAAGCAATTGATTTTACTGGCAAACTAACTATTGATGAAAATGTTTATTATTTTGGAGATAATTATAGAGCAGCTATAGA
ATGGCAAACATTAGATGATGAAGTGTACTATTTTAGTACAGATACAGGTAGAGCTTTTAAAGGGCTAAATCAAATAGGTG
ATGATAAATTCTATTTCAACTCTGATGGTATTATGCAAAAAGGATTTGTTAATATAAATGATAAGACATTCTATTTTGAT
GATTCTGGTGTGATGAAGTCAGGATATACTGAAATAGATGGAAAATATTTTTACTTTGCTGAGAATGGAGAAATGCAAAT
AGGAGTATTTAATACAGCAGATGGATTTAAATATTTTGCTCATCATGATGAAGATTTAGGAAATGAAGAAGGTGAAGCAC
TTTCATATTCTGGTATACTTAATTTTAACAATAAGATTTATTATTTTGATGATTCATTTACAGCAGTAGTTGGATGGAAG
GATTTAGAAGATGGTTCAAAATATTACTTTGATGAAGATACAGCAGAAGCATATATAGGTATCTCAATAATTAATGATGG
TAAATATTATTTTAATGATTCTGGAATCATGCAAATTGGATTTGTCACAATAAATAATGAAGTATTTTATTTCTCTGATT
CTGGAATAGTAGAATCTGGAATGCAAAATATAGATGATAATTATTTCTATATAGACGAAAATGGTCTAGTTCAAATTGGT
GTATTTGACACTTCAGATGGATATAAATACTTTGCACCAGCTAATACTGTAAATGATAATATCTATGGACAAGCAGTTGA
ATATAGTGGTTTAGTTAGAGTTGGTGAAGATGTATATTATTTTGGAGAAACATATACAATTGAGACTGGTTGGATATATG
ATATGGAAAATGAAAGTGATAAATATTATTTCGATCCAGAAACTAAAAAAGCATATAAAGGTATTAATGTAATTGATGAT
ATAAAATACTATTTTGATGAGAATGGAATAATGAGAACAGGTCTTATAACATTTGAAGATAATCATTACTATTTTAATGA
AGATGGTATTATGCAATATGGTTATCTAAATATAGAAGATAAGACGTTCTACTTTAGTGAAGATGGTATTATGCAGATTG
GAGTATTTAATACACCAGATGGATTTAAATATTTTGCACATCAAAATACTTTAGATGAGAATTTTGAGGGAGAATCAATA
AACTATACTGGTTGGTTAGATTTAGATGAAAAGAGATATTATTTTACAGATGAATATATTGCAGCAACTGGTTCAGTTAT
TATTGATGGTGAGGAGTATTATTTTGATCCTGATACAGCTCAATTAGTGATTAGTGAATAG

Protein sequence :

MSLVNRKQLEKMANVRFRVQEDEYVAILDALEEYHNMSENTVVEKYLKLKDINSLTDIYIDTYKKSGRNKALKKFKEYLV
TEVLELKNNNLTPVEKNLHFVWIGGQINDTAINYINQWKDVNSDYNVNVFYDSNAFLINTLKKTIVESATNDTLESFREN
LNDPRFDYNKFYRKRMEIIYDKQKNFINYYKTQREENPDLIIDDIVKIYLSNEYSKDIDELNSYIEESLNKVTENSGNDV
RNFEEFKGGESFKLYEQELVERWNLAAASDILRISALKEVGGVYLDVDMLPGIQPDLFESIEKPSSVTVDFWEMVKLEAI
MKYKEYIPGYTSEHFDMLDEEVQSSFESVLASKSDKSEIFSSLGDMEASPLEVKIAFNSKGIINQGLISVKDSYCSNLIV
KQIENRYKILNNSLNPAISEDNDFNTTTNAFIDSIMAEANADNGRFMMELGKYLRVGFFPDVKTTINLSGPEAYAAAYQD
LLMFKEGSMNIHLIEADLRNFEISKTNISQSTEQEMASLWSFDDARAKAQFEEYKKNYFEGSLGEDDNLDFSQNTVVDKE
YLLEKISSLARSSERGYIHYIVQLQGDKISYEAACNLFAKTPYDSVLFQKNIEDSEIAYYYNPGDGEIQEIDKYKIPSII
SDRPKIKLTFIGHGKDEFNTDIFAGLDVDSLSTEIETAIDLAKEDISPKSIEINLLGCNMFSYSVNVEETYPGKLLLRVK
DKVSELMPSISQDSIIVSANQYEVRINSEGRRELLDHSGEWINKEESIIKDISSKEYISFNPKENKIIVKSKNLPELSTL
LQEIRNNSNSSDIELEEKVMLAECEINVISNIDTQVVEGRIEEAKSLTSDSINYIKNEFKLIESISDALYDLKQQNELEE
SHFISFEDILETDEGFSIRFIDKETGESIFVETEKAIFSEYANHITEEISKIKGTIFDTVNGKLVKKVNLDATHEVNTLN
AAFFIQSLIEYNSSKESLSNLSVAMKVQVYAQLFSTGLNTITDAAKVVELVSTALDETIDLLPTLSEGLPVIATIIDGVS
LGAAIKELSETSDPLLRQEIEAKIGIMAVNLTAATTAIITSSLGIASGFSILLVPLAGISAGIPSLVNNELILRDKATKV
VDYFSHISLAESEGAFTSLDDKIMMPQDDLVISEIDFNNNSITLGKCEIWRMEGGSGHTVTDDIDHFFSAPSITYREPHL
SIYDVLEVQKEELDLSKDLMVLPNAPNRVFAWETGWTPGLRSLENDGTKLLDRIRDNYEGEFYWRYFAFIADALITTLKP
RYEDTNIRINLDSNTRSFIVPVITTEYIREKLSYSFYGSGGTYALSLSQYNMNINIELNENDTWVIDVDNVVRDVTIESD
KIKKGDLIENILSKLSIEDNKIILDNHEINFSGTLNGGNGFVSLTFSILEGINAVIEVDLLSKSYKVLISGELKTLMANS
NSVQQKIDYIGLNSELQKNIPYSFMDDKGKENGFINCSTKEGLFVSELSDVVLISKVYMDNSKPLFGYCSNDLKDVKVIT
KDDVIILTGYYLKDDIKISLSFTIQDENTIKLNGVYLDENGVAEILKFMNKKGSTNTSDSLMSFLESMNIKSIFINSLQS
NTKLILDTNFIISGTTSIGQFEFICDKDNNIQPYFIKFNTLETKYTLYVGNRQNMIVEPNYDLDDSGDISSTVINFSQKY
LYGIDSCVNKVIISPNIYTDEINITPIYEANNTYPEVIVLDTNYISEKINININDLSIRYVWSNDGSDFILMSTDEENKV
SQVKIRFTNVFKGNTISDKISFNFSDKQDVSINKVISTFTPSYYVEGLLNYDLGLISLYNEKFYINNFGMMVSGLVYIND
SLYYFKPPIKNLITGFTTIGDDKYYFNPDNGGAASVGETIIDGKNYYFSQNGVLQTGVFSTEDGFKYFAPADTLDENLEG
EAIDFTGKLTIDENVYYFGDNYRAAIEWQTLDDEVYYFSTDTGRAFKGLNQIGDDKFYFNSDGIMQKGFVNINDKTFYFD
DSGVMKSGYTEIDGKYFYFAENGEMQIGVFNTADGFKYFAHHDEDLGNEEGEALSYSGILNFNNKIYYFDDSFTAVVGWK
DLEDGSKYYFDEDTAEAYIGISIINDGKYYFNDSGIMQIGFVTINNEVFYFSDSGIVESGMQNIDDNYFYIDENGLVQIG
VFDTSDGYKYFAPANTVNDNIYGQAVEYSGLVRVGEDVYYFGETYTIETGWIYDMENESDKYYFDPETKKAYKGINVIDD
IKYYFDENGIMRTGLITFEDNHYYFNEDGIMQYGYLNIEDKTFYFSEDGIMQIGVFNTPDGFKYFAHQNTLDENFEGESI
NYTGWLDLDEKRYYFTDEYIAATGSVIIDGEEYYFDPDTAQLVISE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
tcdB	CAA63562.1	-	Virulence	PaLoc	Protein	0.0	93
tcdA	CAA63564.1	-	Virulence	PaLoc	Protein	0.0	47

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
tcdB	YP_003213639.1	toxin B	VFG2288	Protein	0.0	93
tcdB	YP_003213639.1	toxin B	VFG2287	Protein	0.0	47