Gene Information

Name : tcdA (CD196_0602)
Accession : YP_003213641.1
Strain : Clostridium difficile CD196
Genome accession: NC_013315
Putative virulence/resistance : Virulence
Product : toxin A
Function : -
COG functional category : R : General function prediction only
COG ID : COG5263
EC number : -
Position : 718474 - 726606 bp
Length : 8133 bp
Strand : +
Note : -

DNA sequence :

ATGTCTTTAATATCTAAAGAAGAGTTAATAAAACTCGCATATAGCATTAGACCAAGAGAAAATGAGTATAAAACTATACT
AACTAATTTAGACGAATATAATAAGTTAACTACAAACAATAATGAAAATAAATATTTACAATTAAAAAAACTAAATGAAT
CAATTGATGTTTTTATGAATAAATATAAAAATTCAAGCAGAAATAGAGCACTCTCTAATCTAAAAAAAGATATATTAAAA
GAAGTAATTCTTATTAAAAATTCCAATACAAGTCCTGTAGAAAAAAATTTACATTTTGTATGGATAGGTGGAGAAGTCAG
TGATATTGCTCTTGAATACATAAAACAATGGGCTGATATTAATGCAGAATATAATATTAAACTGTGGTATGATAGTGAAG
CATTCTTAGTCAATACACTAAAAAAGGCTATAGTTGAATCTTCTACCACTGAAGCATTACAGCTACTAGAGGAAGAGATT
CAAAATCCTCAATTTGATAATATGAAATTTTACAAAAAAAGGATGGAATTTATATATGATAGACAAAAAAGGTTTATAAA
TTATTATAAATCTCAAATCAATAAACCTACAGTACCTACAATAGATGATATTATAAAGTCTCATCTAGTATCTGAATATA
ATAGAGATGAAACTTTATTAGAATCATATAGAACAAATTCTTTGAGAAAAATAAATAGTAATCATGGGATAGATATCAGG
GCTAATAGTTTGTTTACAGAACAAGAGTTATTAAATATTTATAGTCAGGAGTTGTTAAATCGTGGGAATTTAGCTGCAGC
ATCTGACATAGTAAGATTATTAGCCCTAAAAAATTTTGGCGGAGTATATTTAGATGTTGATATGCTTCCAGGTATTCACT
CTGATTTATTTAAAACAATACCTAGACCTAGCTCTATTGGACTAGACCGTTGGGAAATGATAAAATTAGAGGCTATTATG
AAGTATAAAAAATATATAAATAATTATACATCAGAAAACTTTGATAAACTTGATCAACAATTAAAAGATAATTTTAAACT
CATTATAGAAAGTAAAAGTGAAAAATCTGAGATATTTTCTAAATTAGAAAATTTAAATGTATCTGATCTTGAAATTAAAA
TAGCTTTCGCTTTAGGCAGTGTTATAAATCAAGCCTTGATATCAAAACAAGGTTCATATCTTACTAACCTAGTAATAGAA
CAAGTAAAAAATAGATATCAATTTTTAAACCAACACCTTAACCCAGCCATAGAGTCTGACAATAACTTCACAGATACTAC
TAAGATTTTTCATGATTCACTATTTAATTCAGCTACCGCAGAAAACTCTATGTTTTTAACAAAAATAGCACCATACTTAC
AAGTAGGTTTTATGCCAGAAGCTCGCTCCACAATAAGTTTAAGTGGTCCAGGAGCTTATGCATCAGCTTACTATGATTTC
ATAAATTTACAAGAAAATACTATAGAAAAAACTTTAAAAGCATCAGATTTAATAGAATTTAAATTCCCAGAAAATAATCT
ATCTCAATTGACAGAACAAGAAATAAATAGTCTATGGAGCTTTGATCAAGCAAGTGCAAAATATCAATTTGAGAAATATG
TAAGAGATTATACTGGTGGATCTCTTTCTGAAGACAATGGGGTAGACTTTAATAAAAATACTGCCCTCGACAAAAACTAT
TTATTAAATAATAAAATTCCATCAAACAATGTAGAAGAAGCTGGAAGTAAAAATTATGTTCATTATATCATACAGTTACA
AGGAGATGATATAAGTTATGAAGCAACATGCAATTTATTTTCTAAAAATCCTAAAAATAGTATTATTATACAACGAAATA
TGAATGAAAGTGCAAAAAGTTACTTTTTAAGTGATGATGGAGAATCTATTTTAGAATTAAATAAATATAGGATACCTGAA
AGATTAAAAAATAAGGAAAAAGTAAAAGTAACCTTTATTGGACATGGTAAAGATGAATTCAACACAAGCGAATTTGCTAG
ATTAAGTGTAGATTCACTTTCCAATGAGATAAGTTCATTTTTAGATACCATAAAATTAGATATATCACCTAAAAATGTAG
AAGTAAACTTGCTTGGATGTAATATGTTTAGTTATGATTTTAATGTTGAAGAAACTTATCCTGGTAAGTTACTATTAAGT
ATTATGGACAAAATTACTTCCACTTTACCTGATGTAAATAAAGATTCTATTACTATAGGAGCAAATCAATATGAAGTAAG
AATTAATAGTGAGGGAAGAAAAGAACTTCTAGCTCACTCAGGTAAATGGATAAATAAAGAGGAAGCTATTATGAGCGATT
TATCTAGTAAAGAATACATTTTTTTTGATTCCATAGATAATAAGCTAAAAGCAAAGTCCAAGAATATTCCAGGTTTAGCG
TCAATATCAGAAGATATAAAAACATTATTACTTGATGCAAGTGTTAGTCCTGATACAAAATTTATTTTAAATAATCTTAA
GCTTAATATTGAATCTTCTATTGGTGATTACATTTATTATGAAAAATTAGAACCTGTTAAAAATATAATCCACAATTCTA
TAGATGATTTAATAGATGAGTTCAATCTACTTGAAAATGTATCTGATGAATTATATGAATTAAAAAAATTAAATAATCTA
GATGAGAAGTATTTAATATCTTTTGAAGATATCTCAAAAAATAATTCAACTTATTCTGTAAGATTTATTAACAAAAGTAA
TGGTGAATCAGTTTATGTAGAGACAGAAAAAGAAATTTTTTCAAAATATAGCGAACATATTACAAAAGAAATAAGTACTA
TAAAGAATAGTATAATTACAGATGTTAATGGTAATTTATTGGATAATATACAGTTAGATCATACTTCTCAAGTTAATACA
TTAAACGCAGCATTCTTTATTCAATCATTAATAGATTATAGTAGCAATAAAGATGTACTGAATGATTTAAGTACCTCAGT
TAAGGTTCAACTTTATGCTCAACTATTTAGTACAGGTTTAAATACTATATATGACTCTATCCAATTAGTAAATTTAATAT
CAAATGCAGTAAATGATACTATAAATGTACTACCTACAATAACAGAGGGGATACCTATTGTATCTACTATATTAGACGGA
ATAAACTTAGGTGCAGCAATTAAGGAATTACTAGACGAACATGACCCATTACTAAAAAAAGAACTAGAAGCTAAGGTGGG
TGTTTTAGCAATAAATATGTCATTATCTATAGCTGCAACGGTAGCTTCAATTGTTGGAATAGGTGCTGAAGTTACTATTT
TCTTATTACCTATAGCTGGTATATCTGCGGGAATACCTTCATTAGTTAATAATGAATTAATATTGCATGATAAGGCAACT
TCAGTGGTAAACTATTTTAATCATTTGTCTGAATCTAAAGAATATGGCCCTCTTAAAACAGAAGATGATAAAATTTTAGT
TCCTATTGATGATTTAGTAATATCAGAAATAGATTTTAATAATAATTCGATAAAACTAGGAACATGTAATATATTAGCAA
TGGAGGGGGGATCAGGACACACAGTGACTGGTAATATAGATCACTTTTTCTCATCTCCATATATAAGCTCTCATATTCCT
TCATTATCAGTTTATTCTGCAATAGGTATAAAAACAGAAAATCTAGATTTTTCAAAAAAAATAATGATGTTACCAAATGC
TCCTTCAAGAGTGTTTTGGTGGGAAACTGGAGCAGTTCCAGGTTTAAGATCATTGGAAAATAATGGGACTAAATTGCTTG
ATTCAATAAGAGATTTATACCCAGGCAAATTTTACTGGAGATTCTATGCCTTTTTCGATTATGCAATAACTACATTAAAA
CCAGTGTATGAAGACACTAATACTAAAATTAAACTAGATAAAGATACTAGAAACTTTATAATGCCAACTATAACTACTGA
CGAAATTAGAAACAAATTATCTTATTCATTTGATGGAGCAGGAGGAACTTACTCTTTATTATTATCTTCATATCCAATAT
CAATGAATATAAATTTATCTAAAGATGATTTATGGATATTTAATATTGATAATGAAGTAAGAGAAATATCTATAGAAAAT
GGTACTATTAAAAAAGGAAATTTAATAGAAGATGTTTTAAGTAAAATTGATATAAATAAAAATAAACTTATTATAGGCAA
TCAAACAATAGATTTTTCAGGTGATATAGATAACAAAGATAGATATATATTCTTGACTTGTGAGTTAGATGATAAAATTA
GTTTAATAATAGAAATAAATCTTGTTGCAAAATCTTATAGTTTGTTATTGTCTGGGGATAAAAATTATTTGATATCCAAT
TTATCTAATACTATTGAGAAAATCAATACTTTAGGCCTAGATAGTAAAAATATAGCTTACAATTACACTGATGAATCTAA
TAATAAATATTTTGGAGCTATATCTAAAACAAGTCAAAAAAGCATAATACATTATAAAAAAGACAGTAAAAATATATTAG
AATTTTATAATGGCAGTACATTAGAATTTAACAGTAAAGACTTTATTGCTGAAGATATAAATGTATTTATGAAAGATGAT
ATTAATACTATAACAGGAAAATACTATGTTGATAATAATACTGATAAAAGTATAGATTTCTCTATTTCTTTAGTTAGTAA
AAATCAAGTAAAAGTAAATGGATTATATTTAAATGAATCCGTATACTCATCTTACCTTGATTTTGTGAAAAATTCAGATG
GACACCATAATACTTCTAATTTTATGAATTTATTTTTGAACAATATAAGTTTCTGGAAATTGTTTGGGTTTGAAAATATA
AATTTTGTAATCGATAAATACTTTACCCTTGTTGGTAAAACTAATCTTGGATATGTAGAATTTATTTGTGACAATAATAA
AAATATAGATATATATTTTGGTGAATGGAAAACATCGTCATCTAAAAGCACTATATTTAGCGGAAATGGTAGAAATGTTG
TAGTAGAGCCTATATATAATCCTGATACGGGTGAAGATATATCTACTTCACTAGATTTTTCCTATGAACCTCTCTATGGA
ATAGATAGATATATCAATAAAGTATTGATAGCACCTGATTTATATACAAGTTTAATAAATATTAATACCAATTATTATTC
AAATGAGTACTACCCTGAGATTATAGTTCTTAACCCAAATACATTCCACAAAAAAGTAAATATAAATTTAGATAGTTCTT
CTTTTGAGTATAAATGGTCTACAGAAGGAAGTGACTTTATTTTAGTTAGATACTTAGAAGAAAGTAATAAAAAAATATTA
CAAAAAATAAGAATCAAAGGTATCTTATCTAATACTCAATCATTTAATAAAATGAGTATAGATTTTAAAGATATTAAAAA
ACTATCATTAGGATATATAATGAGTAATTTTAAATCATTTAATTCTGAAAATGAATTAGATAGAGATCATTTAGGATTTA
AAATAATAGATAATAAAACTTATTACTATGATGAAGATAGTAAATTAGTTAAAGGATTAATCAATATAAATAATTCATTA
TTCTATTTTGATCCTATAGAATCTAACTTAGTAACTGGATGGCAAACTATCAATGGTAAAAAATATTATTTTGATATAAA
TACTGGAGCAGCTTCAACTAGTTATAAAATTATTAATGGTAAACACTTTTATTTTAATAATAATGGTGTGATGCAGTTAG
GAGTATTTAAAGGACCTGATGGATTTGAGTATTTTGCACCTGCCAATACTCAGAATAATAACATAGAAGGTCAGGCTATA
GTTTATCAAAGTAAATTCTTAACTTTGAATGGCAAAAAATATTATTTTGATAATGACTCAAAAGCAGTCACTGGATGGAG
GATTATTAACAATGAGAAATATTACTTTAATCCTAATAATGCTATTGCTGCAGTCGGATTGCAAGTAATTGACAATAATA
AGTATTATTTCAATCCTGACACTGCTATCATCTCAAAAGGTTGGCAGACTGTTAATGGTAGTAGATACTACTTTGATACT
GATACCGCTATTGCCTTTAATGGTTATAAAACTATTGATGGTAAACACTTTTATTTTGATAGTGATTGTGTAGTGAAAAT
AGGTGTGTTTAGTGGCTCTAATGGATTTGAATATTTCGCACCTGCTAATACTTATAATAATAACATAGAAGGTCAGGCTA
TAGTTTATCAAAGTAAATTCTTAACTTTGAATGGTAAAAAATATTACTTTGATAATAACTCAAAAGCAGTTACCGGATGG
CAAACTATTGATAGTAAAAAATATTACTTTAATACTAACACTGCTGAAGCAGCTACTGGATGGCAAACTATTGATGGTAA
AAAGTATTACTTTAATACTAACACTGCTGAAGCAGCTACTGGATGGCAAACTATTGATGGTAAAAAATATTACTTTAATA
CTAACACTTCTATAGCTTCAACTGGTTATACAATTATTAATGGTAAATATTTTTATTTTAATACTGATGGTATTATGCAG
ATAGGAGTGTTTAAAGTACCTAATGGATTTGAATACTTTGCACCTGCTAATACTCATAATAATAACATAGAAGGTCAAGC
TATACTTTACCAAAATAAATTCTTAACTTTGAATGGTAAAAAATATTACTTTGGTAGTGACTCAAAAGCAATTACTGGAT
GGCAAACCATTGATGGTAAAAAATATTACTTTAATCCTAATAATGCTATTGCTGCGACTCATCTATGCACTATAAATAAC
GACAAGTATTACTTTAGTTATGATGGAATTCTTCAAAATGGATATATTACTATTGAAAGAAATAATTTCTATTTTGATGC
TAATAATGAATCTAAAATGGTAACAGGAGTATTTAAAGGACCTAATGGATTTGAGTATTTTGCACCTGCTAATACTCATA
ATAATAACATAGAAGGTCAGGCTATAGTTTACCAGAATAAATTCTTAACTTTGAATGGCAAAAAATATTATTTTGATAAT
GACTCAAAAGCAGTTACTGGATGGCAAACTATTGATAGTAAAAAATATTACTTTAATCTTAACACTGCTGTTGCAGTTAC
TGGATGGCAAACTATTGATGGTGAAAAATATTACTTTAATCTTAACACTGCTGAAGCAGCTACTGGATGGCAAACTATTG
ATGGTAAAAGATACTACTTTAATACTAACACTTATATAGCTTCAACTGGTTATACGATTATTAATGGTAAACATTTTTAT
TTTAATACTGATGGTATTATGCAGATAGGAGTGTTTAAAGGACCTGATGGATTTGAATACTTTGCACCTGCTAATACTCA
TAATAATAACATAGAAGGTCAAGCTATACTTTACCAAAATAAATTCTTAACTTTGAATGGTAAAAAATATTACTTTGGTA
GTGACTCAAAAGCAGTTACCGGATTGCGAACTATTGATGGTAAAAAATATTACTTTAATACTAACACTGCTGTTGCAGTT
ACTGGATGGCAAACTATTAATGGTAAAAAATACTACTTTAATACTAACACTTATATAGCTTCAACTGGTTATACAATTAT
TAGTGGTAAACATTTTTATTTTAATACTGATGGTATTATGCAGATAGGAGTGTTTAAAGGACCTGATGGATTTGAATACT
TTGCACCTGCTAATACGGATGCTAACAACATAGAAGGTCAAGCTATACGTTATCAAAATAGATTCCTATATTTACATGAC
AATATATATTACTTTGGCAATGATTCAAAAGCGGCTACTGGTTGGGCAACTATTGATGGTAATAGATATTACTTCGAGCC
TAATACAGCTATGGGTGCGAATGGTTATAAAACTATTGATAATAAAAATTTTTACTTTAGAAATGGTTTACCTCAGATAG
GAGTGTTTAAAGGACCTAATGGATTTGAATACTTTGCACCTGCTAATACGGATGCTAACAATATAGATGGTCAAGCTATA
CGTTATCAAAATAGATTCCTACATTTACTTGGAAAAATATATTACTTTGGTAATAACTCAAAAGCAGTTACTGGATGGCA
AACTATTAATAGTAAAGTATATTACTTTATGCCTGATACTGCTATGGCTGCAGCTGGTGGACTTTTCGAGATTGATGGTG
TTATATATTTCTTTGGTGTTGATGGAGTAAAAGCCCCTGGGATATATGGCTAA

Protein sequence :

MSLISKEELIKLAYSIRPRENEYKTILTNLDEYNKLTTNNNENKYLQLKKLNESIDVFMNKYKNSSRNRALSNLKKDILK
EVILIKNSNTSPVEKNLHFVWIGGEVSDIALEYIKQWADINAEYNIKLWYDSEAFLVNTLKKAIVESSTTEALQLLEEEI
QNPQFDNMKFYKKRMEFIYDRQKRFINYYKSQINKPTVPTIDDIIKSHLVSEYNRDETLLESYRTNSLRKINSNHGIDIR
ANSLFTEQELLNIYSQELLNRGNLAAASDIVRLLALKNFGGVYLDVDMLPGIHSDLFKTIPRPSSIGLDRWEMIKLEAIM
KYKKYINNYTSENFDKLDQQLKDNFKLIIESKSEKSEIFSKLENLNVSDLEIKIAFALGSVINQALISKQGSYLTNLVIE
QVKNRYQFLNQHLNPAIESDNNFTDTTKIFHDSLFNSATAENSMFLTKIAPYLQVGFMPEARSTISLSGPGAYASAYYDF
INLQENTIEKTLKASDLIEFKFPENNLSQLTEQEINSLWSFDQASAKYQFEKYVRDYTGGSLSEDNGVDFNKNTALDKNY
LLNNKIPSNNVEEAGSKNYVHYIIQLQGDDISYEATCNLFSKNPKNSIIIQRNMNESAKSYFLSDDGESILELNKYRIPE
RLKNKEKVKVTFIGHGKDEFNTSEFARLSVDSLSNEISSFLDTIKLDISPKNVEVNLLGCNMFSYDFNVEETYPGKLLLS
IMDKITSTLPDVNKDSITIGANQYEVRINSEGRKELLAHSGKWINKEEAIMSDLSSKEYIFFDSIDNKLKAKSKNIPGLA
SISEDIKTLLLDASVSPDTKFILNNLKLNIESSIGDYIYYEKLEPVKNIIHNSIDDLIDEFNLLENVSDELYELKKLNNL
DEKYLISFEDISKNNSTYSVRFINKSNGESVYVETEKEIFSKYSEHITKEISTIKNSIITDVNGNLLDNIQLDHTSQVNT
LNAAFFIQSLIDYSSNKDVLNDLSTSVKVQLYAQLFSTGLNTIYDSIQLVNLISNAVNDTINVLPTITEGIPIVSTILDG
INLGAAIKELLDEHDPLLKKELEAKVGVLAINMSLSIAATVASIVGIGAEVTIFLLPIAGISAGIPSLVNNELILHDKAT
SVVNYFNHLSESKEYGPLKTEDDKILVPIDDLVISEIDFNNNSIKLGTCNILAMEGGSGHTVTGNIDHFFSSPYISSHIP
SLSVYSAIGIKTENLDFSKKIMMLPNAPSRVFWWETGAVPGLRSLENNGTKLLDSIRDLYPGKFYWRFYAFFDYAITTLK
PVYEDTNTKIKLDKDTRNFIMPTITTDEIRNKLSYSFDGAGGTYSLLLSSYPISMNINLSKDDLWIFNIDNEVREISIEN
GTIKKGNLIEDVLSKIDINKNKLIIGNQTIDFSGDIDNKDRYIFLTCELDDKISLIIEINLVAKSYSLLLSGDKNYLISN
LSNTIEKINTLGLDSKNIAYNYTDESNNKYFGAISKTSQKSIIHYKKDSKNILEFYNGSTLEFNSKDFIAEDINVFMKDD
INTITGKYYVDNNTDKSIDFSISLVSKNQVKVNGLYLNESVYSSYLDFVKNSDGHHNTSNFMNLFLNNISFWKLFGFENI
NFVIDKYFTLVGKTNLGYVEFICDNNKNIDIYFGEWKTSSSKSTIFSGNGRNVVVEPIYNPDTGEDISTSLDFSYEPLYG
IDRYINKVLIAPDLYTSLININTNYYSNEYYPEIIVLNPNTFHKKVNINLDSSSFEYKWSTEGSDFILVRYLEESNKKIL
QKIRIKGILSNTQSFNKMSIDFKDIKKLSLGYIMSNFKSFNSENELDRDHLGFKIIDNKTYYYDEDSKLVKGLININNSL
FYFDPIESNLVTGWQTINGKKYYFDINTGAASTSYKIINGKHFYFNNNGVMQLGVFKGPDGFEYFAPANTQNNNIEGQAI
VYQSKFLTLNGKKYYFDNDSKAVTGWRIINNEKYYFNPNNAIAAVGLQVIDNNKYYFNPDTAIISKGWQTVNGSRYYFDT
DTAIAFNGYKTIDGKHFYFDSDCVVKIGVFSGSNGFEYFAPANTYNNNIEGQAIVYQSKFLTLNGKKYYFDNNSKAVTGW
QTIDSKKYYFNTNTAEAATGWQTIDGKKYYFNTNTAEAATGWQTIDGKKYYFNTNTSIASTGYTIINGKYFYFNTDGIMQ
IGVFKVPNGFEYFAPANTHNNNIEGQAILYQNKFLTLNGKKYYFGSDSKAITGWQTIDGKKYYFNPNNAIAATHLCTINN
DKYYFSYDGILQNGYITIERNNFYFDANNESKMVTGVFKGPNGFEYFAPANTHNNNIEGQAIVYQNKFLTLNGKKYYFDN
DSKAVTGWQTIDSKKYYFNLNTAVAVTGWQTIDGEKYYFNLNTAEAATGWQTIDGKRYYFNTNTYIASTGYTIINGKHFY
FNTDGIMQIGVFKGPDGFEYFAPANTHNNNIEGQAILYQNKFLTLNGKKYYFGSDSKAVTGLRTIDGKKYYFNTNTAVAV
TGWQTINGKKYYFNTNTYIASTGYTIISGKHFYFNTDGIMQIGVFKGPDGFEYFAPANTDANNIEGQAIRYQNRFLYLHD
NIYYFGNDSKAATGWATIDGNRYYFEPNTAMGANGYKTIDNKNFYFRNGLPQIGVFKGPNGFEYFAPANTDANNIDGQAI
RYQNRFLHLLGKIYYFGNNSKAVTGWQTINSKVYYFMPDTAMAAAGGLFEIDGVIYFFGVDGVKAPGIYG

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
tcdA	CAA63564.1	-	Virulence	PaLoc	Protein	0.0	99
tcdB	CAA63562.1	-	Virulence	PaLoc	Protein	0.0	48

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
tcdA	YP_003213641.1	toxin A	VFG2287	Protein	0.0	99
tcdA	YP_003213641.1	toxin A	VFG2288	Protein	0.0	48