Gene Information

Name : tcdB (CDR20291_0582)
Accession : YP_003217086.1
Strain : Clostridium difficile R20291
Genome accession: NC_013316
Putative virulence/resistance : Virulence
Product : toxin B
Function : -
COG functional category : R : General function prediction only
COG ID : COG5263
EC number : -
Position : 707545 - 714645 bp
Length : 7101 bp
Strand : +
Note : -

DNA sequence :
ATGAGTTTAGTTAATAGAAAACAGTTAGAAAAAATGGCAAATGTAAGATTTCGTGTTCAGGAAGATGAATATGTAGCAAT
ATTGGATGCTTTAGAAGAATATCATAATATGTCAGAGAATACTGTAGTCGAAAAATATTTAAAATTAAAAGATATAAATA
GTTTAACAGATATTTATATAGATACATATAAAAAGTCTGGTAGAAATAAAGCCTTAAAAAAATTTAAGGAATACCTAGTT
ACAGAAGTATTAGAGCTAAAGAATAATAATTTAACTCCAGTTGAGAAAAATTTACATTTTGTTTGGATTGGAGGTCAAAT
AAATGACACTGCTATTAATTATATAAATCAATGGAAAGATGTAAATAGTGATTATAATGTTAATGTTTTTTATGATAGTA
ATGCATTTTTGATAAACACATTGAAAAAAACTATAGTAGAATCAGCAACAAATGATACACTTGAATCATTTAGAGAAAAC
TTAAATGACCCTAGATTTGACTATAATAAATTTTACAGAAAACGTATGGAGATAATCTATGATAAGCAGAAAAATTTCAT
AAATTACTATAAAACTCAAAGAGAAGAAAATCCTGACCTTATAATTGATGATATTGTAAAGATATATCTTTCAAACGAGT
ATTCAAAGGATATAGATGAACTTAATTCCTATATTGAAGAGTCATTAAATAAAGTTACAGAAAATAGTGGGAATGATGTT
AGAAACTTTGAAGAATTTAAAGGTGGAGAGTCATTCAAATTATATGAACAAGAGTTGGTAGAAAGATGGAATTTGGCAGC
TGCTTCTGACATATTAAGAATATCTGCCTTAAAAGAAGTTGGTGGTGTATATTTAGATGTTGATATGTTACCAGGAATAC
AACCAGACCTATTTGAGTCTATAGAGAAACCTAGTTCAGTAACAGTGGATTTTTGGGAAATGGTAAAATTAGAAGCTATA
ATGAAATACAAAGAATACATACCAGGATATACTTCAGAGCATTTTGATATGTTGGATGAAGAAGTTCAAAGTAGTTTTGA
ATCTGTTCTAGCTTCTAAGTCAGATAAGTCAGAAATATTCTCATCACTTGGCGATATGGAGGCATCACCACTAGAAGTTA
AAATTGCATTTAATAGTAAAGGTATTATAAATCAAGGACTAATTTCTGTGAAAGACTCATATTGTAGCAATTTAATAGTA
AAACAAATCGAGAACAGATATAAGATATTGAATAATAGTTTAAATCCAGCTATTAGCGAGGATAACGATTTCAATACTAC
AACGAATGCTTTTATTGATAGTATAATGGCTGAAGCTAATGCAGATAATGGTAGATTTATGATGGAACTAGGAAAGTATT
TAAGAGTTGGTTTCTTCCCAGATGTTAAAACTACTATTAACTTAAGTGGCCCTGAAGCATATGCGGCAGCTTATCAAGAT
TTATTAATGTTTAAAGAAGGTAGTATGAATATCCATTTGATAGAAGCTGACTTAAGAAACTTTGAAATCTCTAAAACTAA
TATTTCTCAATCAACTGAACAAGAAATGGCTAGCTTATGGTCATTTGACGATGCAAGAGCTAAAGCTCAATTTGAAGAAT
ACAAAAAAAATTACTTTGAAGGTTCTCTTGGAGAAGATGACAATCTTGACTTTTCTCAAAATACAGTAGTTGACAAGGAG
TATCTTTTAGAAAAAATATCTTCATTAGCAAGAAGTTCAGAGAGAGGATATATACACTATATTGTTCAGTTACAAGGAGA
TAAAATTAGTTATGAAGCAGCATGTAACTTATTTGCAAAGACTCCTTATGATAGTGTACTGTTTCAGAAAAATATAGAAG
ATTCAGAAATTGCATATTATTATAATCCTGGAGATGGTGAAATACAAGAAATAGACAAGTATAAAATTCCAAGTATAATT
TCTGATAGACCTAAGATTAAATTAACATTTATTGGTCATGGTAAAGATGAATTTAATACTGATATATTTGCAGGTCTTGA
TGTAGATTCATTATCCACAGAAATAGAAACAGCAATAGATTTAGCTAAAGAGGATATTTCTCCTAAGTCAATAGAAATAA
ACTTACTGGGATGTAACATGTTTAGCTATTCTGTAAATGTAGAGGAGACTTATCCTGGGAAATTATTACTTAGAGTTAAA
GATAAAGTATCAGAATTAATGCCATCTATAAGTCAAGACTCTATTATAGTAAGTGCAAATCAATATGAAGTTAGAATAAA
TAGTGAAGGAAGAAGAGAATTATTGGATCATTCTGGTGAATGGATAAATAAAGAAGAAAGTATTATAAAGGATATTTCAT
CAAAAGAATATATATCATTTAATCCTAAAGAAAATAAAATTATAGTAAAATCTAAAAATTTACCTGAATTATCTACATTA
TTACAAGAAATTAGAAACAATTCTAATTCAAGTGATATTGAACTAGAAGAAAAAGTAATGTTAGCAGAATGTGAGATAAA
TGTTATTTCAAATATAGATACACAAGTGGTAGAAGGAAGGATTGAAGAAGCTAAAAGCTTAACTTCTGACTCTATTAATT
ATATAAAGAATGAATTTAAACTAATAGAATCTATTTCTGATGCACTATACGATTTAAAACAACAGAATGAATTAGAAGAG
TCTCATTTTATATCTTTTGAGGATATATTGGAGACTGATGAAGGCTTTAGTATAAGATTTATTGATAAAGAAACTGGAGA
ATCTATATTTGTAGAAACTGAAAAGGCAATATTCTCTGAATATGCTAATCATATAACTGAAGAGATTTCTAAGATAAAAG
GTACTATATTTGATACTGTAAATGGTAAGTTAGTAAAAAAAGTAAATTTAGATGCTACACATGAAGTGAATACTTTAAAT
GCTGCATTTTTTATACAATCATTAATAGAATATAATAGTTCTAAAGAATCTCTTAGTAATTTAAGTGTAGCAATGAAAGT
TCAAGTTTATGCTCAATTATTTAGTACTGGTTTAAATACTATTACAGATGCAGCCAAAGTTGTTGAATTAGTATCAACTG
CATTAGATGAAACTATAGATTTACTTCCTACATTATCTGAAGGATTACCTGTAATTGCAACTATCATAGATGGTGTAAGT
TTAGGTGCAGCAATCAAAGAGCTAAGTGAAACAAGTGACCCATTATTAAGACAAGAAATAGAAGCTAAGATAGGTATAAT
GGCAGTAAATTTAACAGCAGCTACAACTGCAATCATTACTTCATCTTTAGGAATAGCTAGTGGATTTAGTATACTTTTAG
TTCCTTTAGCAGGAATTTCAGCAGGTATACCAAGTTTAGTAAACAATGAGCTTATCCTAAGAGATAAAGCAACAAAAGTT
GTAGATTATTTTAGTCATATATCATTAGCTGAGTCTGAAGGAGCATTTACTTCATTAGATGATAAAATAATGATGCCACA
AGATGATTTAGTAATATCTGAGATAGACTTTAATAACAATTCAATAACTTTAGGTAAATGTGAAATCTGGAGAATGGAAG
GTGGCTCAGGTCATACTGTAACTGATGATATAGATCACTTCTTTTCAGCACCATCAATAACATATAGAGAGCCACACTTA
TCTATATATGACGTATTGGAAGTACAAAAAGAAGAACTTGATTTGTCAAAAGATTTAATGGTATTACCTAATGCTCCAAA
TAGAGTATTTGCTTGGGAAACAGGATGGACACCAGGTTTAAGAAGCTTAGAAAATGATGGCACAAAACTGTTAGACCGTA
TAAGAGATAACTATGAAGGTGAGTTTTATTGGAGATATTTTGCTTTTATAGCTGATGCTTTAATAACAACATTAAAACCA
AGATATGAAGATACTAATATAAGAATAAATTTAGATAGTAATACTAGAAGCTTTATAGTCCCAGTGATAACTACAGAATA
TATAAGAGAGAAATTATCATATTCTTTTTATGGTTCTGGAGGAACTTATGCATTATCTCTTTCTCAATACAATATGAATA
TAAACATAGAATTAAATGAAAATGATACTTGGGTTATAGATGTCGACAATGTCGTAAGAGATGTCACTATAGAATCTGAT
AAAATTAAAAAAGGAGATTTAATAGAGAATATTTTATCTAAATTAAGTATTGAAGACAATAAAATTATTTTAGATAATCA
TGAAATTAATTTCTCTGGAACATTAAATGGAGGTAATGGATTTGTATCTTTAACATTCTCAATCTTAGAAGGAATAAATG
CAGTTATAGAAGTTGATTTATTATCTAAATCATATAAAGTTCTTATTTCTGGTGAACTAAAAACATTGATGGCAAATTCA
AATTCTGTTCAACAGAAAATAGATTATATAGGATTGAACAGCGAATTACAAAAAAATATACCTTATAGTTTTATGGATGA
TAAAGGAAAAGAAAATGGATTTATTAATTGTTCTACAAAAGAAGGTTTATTTGTATCTGAATTATCTGATGTAGTTCTTA
TAAGTAAAGTTTATATGGACAATAGTAAACCTCTATTTGGATATTGTAGTAATGATTTGAAAGATGTTAAAGTCATAACT
AAAGATGACGTTATTATATTAACAGGATATTATTTAAAAGATGATATAAAAATCTCTCTTTCTTTTACTATACAAGATGA
AAATACTATAAAATTAAATGGAGTATATTTAGATGAAAATGGAGTAGCTGAAATATTGAAATTTATGAATAAAAAAGGTA
GTACAAATACTTCAGATTCTTTAATGAGCTTTTTAGAAAGTATGAATATAAAAAGTATTTTCATAAATTCCTTACAATCT
AATACTAAGCTTATATTAGATACTAATTTTATAATAAGTGGTACTACTTCTATTGGTCAATTTGAGTTTATTTGTGATAA
AGATAATAATATACAACCATATTTCATTAAGTTTAATACACTAGAAACTAAATATACTCTATATGTAGGTAATAGACAAA
ATATGATAGTAGAACCAAATTATGATTTAGATGATTCTGGAGATATATCTTCAACTGTCATTAATTTTTCTCAGAAATAC
CTTTATGGAATAGACAGTTGTGTTAATAAAGTTATAATTTCGCCAAATATATATACAGATGAAATAAACATAACACCTAT
ATATGAAGCAAATAATACTTATCCAGAAGTGATTGTATTAGATACAAATTATATAAGTGAAAAAATCAATATTAATATCA
ATGATTTATCTATACGATATGTATGGAGTAATGATGGAAGTGATTTTATTCTTATGTCAACTGATGAAGAGAACAAGGTA
TCACAAGTTAAAATAAGATTTACTAATGTTTTTAAAGGTAATACTATATCAGATAAGATATCTTTTAATTTTAGTGATAA
GCAAGATGTATCTATAAATAAAGTTATTTCAACATTTACACCTTCATATTATGTGGAAGGATTACTTAATTATGATTTAG
GTCTGATTTCTTTATACAATGAGAAATTTTATATTAATAACTTTGGAATGATGGTGTCTGGATTAGTATATATTAATGAT
TCATTATATTATTTCAAGCCACCAATAAAGAACTTGATAACTGGATTTACAACTATAGGTGATGATAAATACTACTTTAA
TCCAGATAATGGTGGAGCTGCTTCAGTCGGAGAAACAATAATTGATGGCAAAAACTACTACTTCAGCCAAAATGGAGTGT
TACAAACAGGTGTATTTAGTACAGAAGATGGATTTAAATATTTTGCTCCAGCAGATACACTTGATGAAAATCTAGAGGGG
GAAGCAATTGATTTTACTGGCAAACTAACTATTGATGAAAATGTTTATTATTTTGGAGATAATTATAGAGCAGCTATAGA
ATGGCAAACATTAGATGATGAAGTGTACTATTTTAGTACAGATACAGGTAGAGCTTTTAAAGGGCTAAATCAAATAGGTG
ATGATAAATTCTATTTCAACTCTGATGGTATTATGCAAAAAGGATTTGTTAATATAAATGATAAGACATTCTATTTTGAT
GATTCTGGTGTGATGAAGTCAGGATATACTGAAATAGATGGAAAATATTTTTACTTTGCTGAGAATGGAGAAATGCAAAT
AGGAGTATTTAATACAGCAGATGGATTTAAATATTTTGCTCATCATGATGAAGATTTAGGAAATGAAGAAGGTGAAGCAC
TTTCATATTCTGGTATACTTAATTTTAACAATAAGATTTATTATTTTGATGATTCATTTACAGCAGTAGTTGGATGGAAG
GATTTAGAAGATGGTTCAAAATATTACTTTGATGAAGATACAGCAGAAGCATATATAGGTATCTCAATAATTAATGATGG
TAAATATTATTTTAATGATTCTGGAATCATGCAAATTGGATTTGTCACAATAAATAATGAAGTATTTTATTTCTCTGATT
CTGGAATAGTAGAATCTGGAATGCAAAATATAGATGATAATTATTTCTATATAGACGAAAATGGTCTAGTTCAAATTGGT
GTATTTGACACTTCAGATGGATATAAATACTTTGCACCAGCTAATACTGTAAATGATAATATCTATGGACAAGCAGTTGA
ATATAGTGGTTTAGTTAGAGTTGGTGAAGATGTATATTATTTTGGAGAAACATATACAATTGAGACTGGTTGGATATATG
ATATGGAAAATGAAAGTGATAAATATTATTTCGATCCAGAAACTAAAAAAGCATATAAAGGTATTAATGTAATTGATGAT
ATAAAATACTATTTTGATGAGAATGGAATAATGAGAACAGGTCTTATAACATTTGAAGATAATCATTACTATTTTAATGA
AGATGGTATTATGCAATATGGTTATCTAAATATAGAAGATAAGACGTTCTACTTTAGTGAAGATGGTATTATGCAGATTG
GAGTATTTAATACACCAGATGGATTTAAATATTTTGCACATCAAAATACTTTAGATGAGAATTTTGAGGGAGAATCAATA
AACTATACTGGTTGGTTAGATTTAGATGAAAAGAGATATTATTTTACAGATGAATATATTGCAGCAACTGGTTCAGTTAT
TATTGATGGTGAGGAGTATTATTTTGATCCTGATACAGCTCAATTAGTGATTAGTGAATAG

Protein sequence :
MSLVNRKQLEKMANVRFRVQEDEYVAILDALEEYHNMSENTVVEKYLKLKDINSLTDIYIDTYKKSGRNKALKKFKEYLV
TEVLELKNNNLTPVEKNLHFVWIGGQINDTAINYINQWKDVNSDYNVNVFYDSNAFLINTLKKTIVESATNDTLESFREN
LNDPRFDYNKFYRKRMEIIYDKQKNFINYYKTQREENPDLIIDDIVKIYLSNEYSKDIDELNSYIEESLNKVTENSGNDV
RNFEEFKGGESFKLYEQELVERWNLAAASDILRISALKEVGGVYLDVDMLPGIQPDLFESIEKPSSVTVDFWEMVKLEAI
MKYKEYIPGYTSEHFDMLDEEVQSSFESVLASKSDKSEIFSSLGDMEASPLEVKIAFNSKGIINQGLISVKDSYCSNLIV
KQIENRYKILNNSLNPAISEDNDFNTTTNAFIDSIMAEANADNGRFMMELGKYLRVGFFPDVKTTINLSGPEAYAAAYQD
LLMFKEGSMNIHLIEADLRNFEISKTNISQSTEQEMASLWSFDDARAKAQFEEYKKNYFEGSLGEDDNLDFSQNTVVDKE
YLLEKISSLARSSERGYIHYIVQLQGDKISYEAACNLFAKTPYDSVLFQKNIEDSEIAYYYNPGDGEIQEIDKYKIPSII
SDRPKIKLTFIGHGKDEFNTDIFAGLDVDSLSTEIETAIDLAKEDISPKSIEINLLGCNMFSYSVNVEETYPGKLLLRVK
DKVSELMPSISQDSIIVSANQYEVRINSEGRRELLDHSGEWINKEESIIKDISSKEYISFNPKENKIIVKSKNLPELSTL
LQEIRNNSNSSDIELEEKVMLAECEINVISNIDTQVVEGRIEEAKSLTSDSINYIKNEFKLIESISDALYDLKQQNELEE
SHFISFEDILETDEGFSIRFIDKETGESIFVETEKAIFSEYANHITEEISKIKGTIFDTVNGKLVKKVNLDATHEVNTLN
AAFFIQSLIEYNSSKESLSNLSVAMKVQVYAQLFSTGLNTITDAAKVVELVSTALDETIDLLPTLSEGLPVIATIIDGVS
LGAAIKELSETSDPLLRQEIEAKIGIMAVNLTAATTAIITSSLGIASGFSILLVPLAGISAGIPSLVNNELILRDKATKV
VDYFSHISLAESEGAFTSLDDKIMMPQDDLVISEIDFNNNSITLGKCEIWRMEGGSGHTVTDDIDHFFSAPSITYREPHL
SIYDVLEVQKEELDLSKDLMVLPNAPNRVFAWETGWTPGLRSLENDGTKLLDRIRDNYEGEFYWRYFAFIADALITTLKP
RYEDTNIRINLDSNTRSFIVPVITTEYIREKLSYSFYGSGGTYALSLSQYNMNINIELNENDTWVIDVDNVVRDVTIESD
KIKKGDLIENILSKLSIEDNKIILDNHEINFSGTLNGGNGFVSLTFSILEGINAVIEVDLLSKSYKVLISGELKTLMANS
NSVQQKIDYIGLNSELQKNIPYSFMDDKGKENGFINCSTKEGLFVSELSDVVLISKVYMDNSKPLFGYCSNDLKDVKVIT
KDDVIILTGYYLKDDIKISLSFTIQDENTIKLNGVYLDENGVAEILKFMNKKGSTNTSDSLMSFLESMNIKSIFINSLQS
NTKLILDTNFIISGTTSIGQFEFICDKDNNIQPYFIKFNTLETKYTLYVGNRQNMIVEPNYDLDDSGDISSTVINFSQKY
LYGIDSCVNKVIISPNIYTDEINITPIYEANNTYPEVIVLDTNYISEKINININDLSIRYVWSNDGSDFILMSTDEENKV
SQVKIRFTNVFKGNTISDKISFNFSDKQDVSINKVISTFTPSYYVEGLLNYDLGLISLYNEKFYINNFGMMVSGLVYIND
SLYYFKPPIKNLITGFTTIGDDKYYFNPDNGGAASVGETIIDGKNYYFSQNGVLQTGVFSTEDGFKYFAPADTLDENLEG
EAIDFTGKLTIDENVYYFGDNYRAAIEWQTLDDEVYYFSTDTGRAFKGLNQIGDDKFYFNSDGIMQKGFVNINDKTFYFD
DSGVMKSGYTEIDGKYFYFAENGEMQIGVFNTADGFKYFAHHDEDLGNEEGEALSYSGILNFNNKIYYFDDSFTAVVGWK
DLEDGSKYYFDEDTAEAYIGISIINDGKYYFNDSGIMQIGFVTINNEVFYFSDSGIVESGMQNIDDNYFYIDENGLVQIG
VFDTSDGYKYFAPANTVNDNIYGQAVEYSGLVRVGEDVYYFGETYTIETGWIYDMENESDKYYFDPETKKAYKGINVIDD
IKYYFDENGIMRTGLITFEDNHYYFNEDGIMQYGYLNIEDKTFYFSEDGIMQIGVFNTPDGFKYFAHQNTLDENFEGESI
NYTGWLDLDEKRYYFTDEYIAATGSVIIDGEEYYFDPDTAQLVISE

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
tcdB CAA63562.1 - Virulence PaLoc Protein 0.0 93
tcdA CAA63564.1 - Virulence PaLoc Protein 0.0 47

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
tcdB YP_003217086.1 toxin B VFG2288 Protein 0.0 93
tcdB YP_003217086.1 toxin B VFG2287 Protein 0.0 47