Gene Information

Name : tcdA (CDR20291_0584)
Accession : YP_003217088.1
Strain : Clostridium difficile R20291
Genome accession: NC_013316
Putative virulence/resistance : Virulence
Product : toxin A
Function : -
COG functional category : R : General function prediction only
COG ID : COG5263
EC number : -
Position : 715995 - 724127 bp
Length : 8133 bp
Strand : +
Note : -

DNA sequence :
ATGTCTTTAATATCTAAAGAAGAGTTAATAAAACTCGCATATAGCATTAGACCAAGAGAAAATGAGTATAAAACTATACT
AACTAATTTAGACGAATATAATAAGTTAACTACAAACAATAATGAAAATAAATATTTACAATTAAAAAAACTAAATGAAT
CAATTGATGTTTTTATGAATAAATATAAAAATTCAAGCAGAAATAGAGCACTCTCTAATCTAAAAAAAGATATATTAAAA
GAAGTAATTCTTATTAAAAATTCCAATACAAGTCCTGTAGAAAAAAATTTACATTTTGTATGGATAGGTGGAGAAGTCAG
TGATATTGCTCTTGAATACATAAAACAATGGGCTGATATTAATGCAGAATATAATATTAAACTGTGGTATGATAGTGAAG
CATTCTTAGTCAATACACTAAAAAAGGCTATAGTTGAATCTTCTACCACTGAAGCATTACAGCTACTAGAGGAAGAGATT
CAAAATCCTCAATTTGATAATATGAAATTTTACAAAAAAAGGATGGAATTTATATATGATAGACAAAAAAGGTTTATAAA
TTATTATAAATCTCAAATCAATAAACCTACAGTACCTACAATAGATGATATTATAAAGTCTCATCTAGTATCTGAATATA
ATAGAGATGAAACTTTATTAGAATCATATAGAACAAATTCTTTGAGAAAAATAAATAGTAATCATGGGATAGATATCAGG
GCTAATAGTTTGTTTACAGAACAAGAGTTATTAAATATTTATAGTCAGGAGTTGTTAAATCGTGGGAATTTAGCTGCAGC
ATCTGACATAGTAAGATTATTAGCCCTAAAAAATTTTGGCGGAGTATATTTAGATGTTGATATGCTTCCAGGTATTCACT
CTGATTTATTTAAAACAATACCTAGACCTAGCTCTATTGGACTAGACCGTTGGGAAATGATAAAATTAGAGGCTATTATG
AAGTATAAAAAATATATAAATAATTATACATCAGAAAACTTTGATAAACTTGATCAACAATTAAAAGATAATTTTAAACT
CATTATAGAAAGTAAAAGTGAAAAATCTGAGATATTTTCTAAATTAGAAAATTTAAATGTATCTGATCTTGAAATTAAAA
TAGCTTTCGCTTTAGGCAGTGTTATAAATCAAGCCTTGATATCAAAACAAGGTTCATATCTTACTAACCTAGTAATAGAA
CAAGTAAAAAATAGATATCAATTTTTAAACCAACACCTTAACCCAGCCATAGAGTCTGACAATAACTTCACAGATACTAC
TAAGATTTTTCATGATTCACTATTTAATTCAGCTACCGCAGAAAACTCTATGTTTTTAACAAAAATAGCACCATACTTAC
AAGTAGGTTTTATGCCAGAAGCTCGCTCCACAATAAGTTTAAGTGGTCCAGGAGCTTATGCATCAGCTTACTATGATTTC
ATAAATTTACAAGAAAATACTATAGAAAAAACTTTAAAAGCATCAGATTTAATAGAATTTAAATTCCCAGAAAATAATCT
ATCTCAATTGACAGAACAAGAAATAAATAGTCTATGGAGCTTTGATCAAGCAAGTGCAAAATATCAATTTGAGAAATATG
TAAGAGATTATACTGGTGGATCTCTTTCTGAAGACAATGGGGTAGACTTTAATAAAAATACTGCCCTCGACAAAAACTAT
TTATTAAATAATAAAATTCCATCAAACAATGTAGAAGAAGCTGGAAGTAAAAATTATGTTCATTATATCATACAGTTACA
AGGAGATGATATAAGTTATGAAGCAACATGCAATTTATTTTCTAAAAATCCTAAAAATAGTATTATTATACAACGAAATA
TGAATGAAAGTGCAAAAAGTTACTTTTTAAGTGATGATGGAGAATCTATTTTAGAATTAAATAAATATAGGATACCTGAA
AGATTAAAAAATAAGGAAAAAGTAAAAGTAACCTTTATTGGACATGGTAAAGATGAATTCAACACAAGCGAATTTGCTAG
ATTAAGTGTAGATTCACTTTCCAATGAGATAAGTTCATTTTTAGATACCATAAAATTAGATATATCACCTAAAAATGTAG
AAGTAAACTTGCTTGGATGTAATATGTTTAGTTATGATTTTAATGTTGAAGAAACTTATCCTGGTAAGTTACTATTAAGT
ATTATGGACAAAATTACTTCCACTTTACCTGATGTAAATAAAGATTCTATTACTATAGGAGCAAATCAATATGAAGTAAG
AATTAATAGTGAGGGAAGAAAAGAACTTCTAGCTCACTCAGGTAAATGGATAAATAAAGAGGAAGCTATTATGAGCGATT
TATCTAGTAAAGAATACATTTTTTTTGATTCCATAGATAATAAGCTAAAAGCAAAGTCCAAGAATATTCCAGGTTTAGCG
TCAATATCAGAAGATATAAAAACATTATTACTTGATGCAAGTGTTAGTCCTGATACAAAATTTATTTTAAATAATCTTAA
GCTTAATATTGAATCTTCTATTGGTGATTACATTTATTATGAAAAATTAGAACCTGTTAAAAATATAATCCACAATTCTA
TAGATGATTTAATAGATGAGTTCAATCTACTTGAAAATGTATCTGATGAATTATATGAATTAAAAAAATTAAATAATCTA
GATGAGAAGTATTTAATATCTTTTGAAGATATCTCAAAAAATAATTCAACTTATTCTGTAAGATTTATTAACAAAAGTAA
TGGTGAATCAGTTTATGTAGAGACAGAAAAAGAAATTTTTTCAAAATATAGCGAACATATTACAAAAGAAATAAGTACTA
TAAAGAATAGTATAATTACAGATGTTAATGGTAATTTATTGGATAATATACAGTTAGATCATACTTCTCAAGTTAATACA
TTAAACGCAGCATTCTTTATTCAATCATTAATAGATTATAGTAGCAATAAAGATGTACTGAATGATTTAAGTACCTCAGT
TAAGGTTCAACTTTATGCTCAACTATTTAGTACAGGTTTAAATACTATATATGACTCTATCCAATTAGTAAATTTAATAT
CAAATGCAGTAAATGATACTATAAATGTACTACCTACAATAACAGAGGGGATACCTATTGTATCTACTATATTAGACGGA
ATAAACTTAGGTGCAGCAATTAAGGAATTACTAGACGAACATGACCCATTACTAAAAAAAGAACTAGAAGCTAAGGTGGG
TGTTTTAGCAATAAATATGTCATTATCTATAGCTGCAACGGTAGCTTCAATTGTTGGAATAGGTGCTGAAGTTACTATTT
TCTTATTACCTATAGCTGGTATATCTGCGGGAATACCTTCATTAGTTAATAATGAATTAATATTGCATGATAAGGCAACT
TCAGTGGTAAACTATTTTAATCATTTGTCTGAATCTAAAGAATATGGCCCTCTTAAAACAGAAGATGATAAAATTTTAGT
TCCTATTGATGATTTAGTAATATCAGAAATAGATTTTAATAATAATTCGATAAAACTAGGAACATGTAATATATTAGCAA
TGGAGGGGGGATCAGGACACACAGTGACTGGTAATATAGATCACTTTTTCTCATCTCCATATATAAGCTCTCATATTCCT
TCATTATCAGTTTATTCTGCAATAGGTATAAAAACAGAAAATCTAGATTTTTCAAAAAAAATAATGATGTTACCAAATGC
TCCTTCAAGAGTGTTTTGGTGGGAAACTGGAGCAGTTCCAGGTTTAAGATCATTGGAAAATAATGGGACTAAATTGCTTG
ATTCAATAAGAGATTTATACCCAGGCAAATTTTACTGGAGATTCTATGCCTTTTTCGATTATGCAATAACTACATTAAAA
CCAGTGTATGAAGACACTAATACTAAAATTAAACTAGATAAAGATACTAGAAACTTTATAATGCCAACTATAACTACTGA
CGAAATTAGAAACAAATTATCTTATTCATTTGATGGAGCAGGAGGAACTTACTCTTTATTATTATCTTCATATCCAATAT
CAATGAATATAAATTTATCTAAAGATGATTTATGGATATTTAATATTGATAATGAAGTAAGAGAAATATCTATAGAAAAT
GGTACTATTAAAAAAGGAAATTTAATAGAAGATGTTTTAAGTAAAATTGATATAAATAAAAATAAACTTATTATAGGCAA
TCAAACAATAGATTTTTCAGGTGATATAGATAACAAAGATAGATATATATTCTTGACTTGTGAGTTAGATGATAAAATTA
GTTTAATAATAGAAATAAATCTTGTTGCAAAATCTTATAGTTTGTTATTGTCTGGGGATAAAAATTATTTGATATCCAAT
TTATCTAATACTATTGAGAAAATCAATACTTTAGGCCTAGATAGTAAAAATATAGCTTACAATTACACTGATGAATCTAA
TAATAAATATTTTGGAGCTATATCTAAAACAAGTCAAAAAAGCATAATACATTATAAAAAAGACAGTAAAAATATATTAG
AATTTTATAATGGCAGTACATTAGAATTTAACAGTAAAGACTTTATTGCTGAAGATATAAATGTATTTATGAAAGATGAT
ATTAATACTATAACAGGAAAATACTATGTTGATAATAATACTGATAAAAGTATAGATTTCTCTATTTCTTTAGTTAGTAA
AAATCAAGTAAAAGTAAATGGATTATATTTAAATGAATCCGTATACTCATCTTACCTTGATTTTGTGAAAAATTCAGATG
GACACCATAATACTTCTAATTTTATGAATTTATTTTTGAACAATATAAGTTTCTGGAAATTGTTTGGGTTTGAAAATATA
AATTTTGTAATCGATAAATACTTTACCCTTGTTGGTAAAACTAATCTTGGATATGTAGAATTTATTTGTGACAATAATAA
AAATATAGATATATATTTTGGTGAATGGAAAACATCGTCATCTAAAAGCACTATATTTAGCGGAAATGGTAGAAATGTTG
TAGTAGAGCCTATATATAATCCTGATACGGGTGAAGATATATCTACTTCACTAGATTTTTCCTATGAACCTCTCTATGGA
ATAGATAGATATATCAATAAAGTATTGATAGCACCTGATTTATATACAAGTTTAATAAATATTAATACCAATTATTATTC
AAATGAGTACTACCCTGAGATTATAGTTCTTAACCCAAATACATTCCACAAAAAAGTAAATATAAATTTAGATAGTTCTT
CTTTTGAGTATAAATGGTCTACAGAAGGAAGTGACTTTATTTTAGTTAGATACTTAGAAGAAAGTAATAAAAAAATATTA
CAAAAAATAAGAATCAAAGGTATCTTATCTAATACTCAATCATTTAATAAAATGAGTATAGATTTTAAAGATATTAAAAA
ACTATCATTAGGATATATAATGAGTAATTTTAAATCATTTAATTCTGAAAATGAATTAGATAGAGATCATTTAGGATTTA
AAATAATAGATAATAAAACTTATTACTATGATGAAGATAGTAAATTAGTTAAAGGATTAATCAATATAAATAATTCATTA
TTCTATTTTGATCCTATAGAATCTAACTTAGTAACTGGATGGCAAACTATCAATGGTAAAAAATATTATTTTGATATAAA
TACTGGAGCAGCTTCAACTAGTTATAAAATTATTAATGGTAAACACTTTTATTTTAATAATAATGGTGTGATGCAGTTAG
GAGTATTTAAAGGACCTGATGGATTTGAGTATTTTGCACCTGCCAATACTCAGAATAATAACATAGAAGGTCAGGCTATA
GTTTATCAAAGTAAATTCTTAACTTTGAATGGCAAAAAATATTATTTTGATAATGACTCAAAAGCAGTCACTGGATGGAG
GATTATTAACAATGAGAAATATTACTTTAATCCTAATAATGCTATTGCTGCAGTCGGATTGCAAGTAATTGACAATAATA
AGTATTATTTCAATCCTGACACTGCTATCATCTCAAAAGGTTGGCAGACTGTTAATGGTAGTAGATACTACTTTGATACT
GATACCGCTATTGCCTTTAATGGTTATAAAACTATTGATGGTAAACACTTTTATTTTGATAGTGATTGTGTAGTGAAAAT
AGGTGTGTTTAGTGGCTCTAATGGATTTGAATATTTCGCACCTGCTAATACTTATAATAATAACATAGAAGGTCAGGCTA
TAGTTTATCAAAGTAAATTCTTAACTTTGAATGGTAAAAAATATTACTTTGATAATAACTCAAAAGCAGTTACCGGATGG
CAAACTATTGATAGTAAAAAATATTACTTTAATACTAACACTGCTGAAGCAGCTACTGGATGGCAAACTATTGATGGTAA
AAAGTATTACTTTAATACTAACACTGCTGAAGCAGCTACTGGATGGCAAACTATTGATGGTAAAAAATATTACTTTAATA
CTAACACTTCTATAGCTTCAACTGGTTATACAATTATTAATGGTAAATATTTTTATTTTAATACTGATGGTATTATGCAG
ATAGGAGTGTTTAAAGTACCTAATGGATTTGAATACTTTGCACCTGCTAATACTCATAATAATAACATAGAAGGTCAAGC
TATACTTTACCAAAATAAATTCTTAACTTTGAATGGTAAAAAATATTACTTTGGTAGTGACTCAAAAGCAATTACTGGAT
GGCAAACCATTGATGGTAAAAAATATTACTTTAATCCTAATAATGCTATTGCTGCGACTCATCTATGCACTATAAATAAC
GACAAGTATTACTTTAGTTATGATGGAATTCTTCAAAATGGATATATTACTATTGAAAGAAATAATTTCTATTTTGATGC
TAATAATGAATCTAAAATGGTAACAGGAGTATTTAAAGGACCTAATGGATTTGAGTATTTTGCACCTGCTAATACTCATA
ATAATAACATAGAAGGTCAGGCTATAGTTTACCAGAATAAATTCTTAACTTTGAATGGCAAAAAATATTATTTTGATAAT
GACTCAAAAGCAGTTACTGGATGGCAAACTATTGATAGTAAAAAATATTACTTTAATCTTAACACTGCTGTTGCAGTTAC
TGGATGGCAAACTATTGATGGTGAAAAATATTACTTTAATCTTAACACTGCTGAAGCAGCTACTGGATGGCAAACTATTG
ATGGTAAAAGATACTACTTTAATACTAACACTTATATAGCTTCAACTGGTTATACGATTATTAATGGTAAACATTTTTAT
TTTAATACTGATGGTATTATGCAGATAGGAGTGTTTAAAGGACCTGATGGATTTGAATACTTTGCACCTGCTAATACTCA
TAATAATAACATAGAAGGTCAAGCTATACTTTACCAAAATAAATTCTTAACTTTGAATGGTAAAAAATATTACTTTGGTA
GTGACTCAAAAGCAGTTACCGGATTGCGAACTATTGATGGTAAAAAATATTACTTTAATACTAACACTGCTGTTGCAGTT
ACTGGATGGCAAACTATTAATGGTAAAAAATACTACTTTAATACTAACACTTATATAGCTTCAACTGGTTATACAATTAT
TAGTGGTAAACATTTTTATTTTAATACTGATGGTATTATGCAGATAGGAGTGTTTAAAGGACCTGATGGATTTGAATACT
TTGCACCTGCTAATACGGATGCTAACAACATAGAAGGTCAAGCTATACGTTATCAAAATAGATTCCTATATTTACATGAC
AATATATATTACTTTGGCAATGATTCAAAAGCGGCTACTGGTTGGGCAACTATTGATGGTAATAGATATTACTTCGAGCC
TAATACAGCTATGGGTGCGAATGGTTATAAAACTATTGATAATAAAAATTTTTACTTTAGAAATGGTTTACCTCAGATAG
GAGTGTTTAAAGGACCTAATGGATTTGAATACTTTGCACCTGCTAATACGGATGCTAACAATATAGATGGTCAAGCTATA
CGTTATCAAAATAGATTCCTACATTTACTTGGAAAAATATATTACTTTGGTAATAACTCAAAAGCAGTTACTGGATGGCA
AACTATTAATAGTAAAGTATATTACTTTATGCCTGATACTGCTATGGCTGCAGCTGGTGGACTTTTCGAGATTGATGGTG
TTATATATTTCTTTGGTGTTGATGGAGTAAAAGCCCCTGGGATATATGGCTAA

Protein sequence :
MSLISKEELIKLAYSIRPRENEYKTILTNLDEYNKLTTNNNENKYLQLKKLNESIDVFMNKYKNSSRNRALSNLKKDILK
EVILIKNSNTSPVEKNLHFVWIGGEVSDIALEYIKQWADINAEYNIKLWYDSEAFLVNTLKKAIVESSTTEALQLLEEEI
QNPQFDNMKFYKKRMEFIYDRQKRFINYYKSQINKPTVPTIDDIIKSHLVSEYNRDETLLESYRTNSLRKINSNHGIDIR
ANSLFTEQELLNIYSQELLNRGNLAAASDIVRLLALKNFGGVYLDVDMLPGIHSDLFKTIPRPSSIGLDRWEMIKLEAIM
KYKKYINNYTSENFDKLDQQLKDNFKLIIESKSEKSEIFSKLENLNVSDLEIKIAFALGSVINQALISKQGSYLTNLVIE
QVKNRYQFLNQHLNPAIESDNNFTDTTKIFHDSLFNSATAENSMFLTKIAPYLQVGFMPEARSTISLSGPGAYASAYYDF
INLQENTIEKTLKASDLIEFKFPENNLSQLTEQEINSLWSFDQASAKYQFEKYVRDYTGGSLSEDNGVDFNKNTALDKNY
LLNNKIPSNNVEEAGSKNYVHYIIQLQGDDISYEATCNLFSKNPKNSIIIQRNMNESAKSYFLSDDGESILELNKYRIPE
RLKNKEKVKVTFIGHGKDEFNTSEFARLSVDSLSNEISSFLDTIKLDISPKNVEVNLLGCNMFSYDFNVEETYPGKLLLS
IMDKITSTLPDVNKDSITIGANQYEVRINSEGRKELLAHSGKWINKEEAIMSDLSSKEYIFFDSIDNKLKAKSKNIPGLA
SISEDIKTLLLDASVSPDTKFILNNLKLNIESSIGDYIYYEKLEPVKNIIHNSIDDLIDEFNLLENVSDELYELKKLNNL
DEKYLISFEDISKNNSTYSVRFINKSNGESVYVETEKEIFSKYSEHITKEISTIKNSIITDVNGNLLDNIQLDHTSQVNT
LNAAFFIQSLIDYSSNKDVLNDLSTSVKVQLYAQLFSTGLNTIYDSIQLVNLISNAVNDTINVLPTITEGIPIVSTILDG
INLGAAIKELLDEHDPLLKKELEAKVGVLAINMSLSIAATVASIVGIGAEVTIFLLPIAGISAGIPSLVNNELILHDKAT
SVVNYFNHLSESKEYGPLKTEDDKILVPIDDLVISEIDFNNNSIKLGTCNILAMEGGSGHTVTGNIDHFFSSPYISSHIP
SLSVYSAIGIKTENLDFSKKIMMLPNAPSRVFWWETGAVPGLRSLENNGTKLLDSIRDLYPGKFYWRFYAFFDYAITTLK
PVYEDTNTKIKLDKDTRNFIMPTITTDEIRNKLSYSFDGAGGTYSLLLSSYPISMNINLSKDDLWIFNIDNEVREISIEN
GTIKKGNLIEDVLSKIDINKNKLIIGNQTIDFSGDIDNKDRYIFLTCELDDKISLIIEINLVAKSYSLLLSGDKNYLISN
LSNTIEKINTLGLDSKNIAYNYTDESNNKYFGAISKTSQKSIIHYKKDSKNILEFYNGSTLEFNSKDFIAEDINVFMKDD
INTITGKYYVDNNTDKSIDFSISLVSKNQVKVNGLYLNESVYSSYLDFVKNSDGHHNTSNFMNLFLNNISFWKLFGFENI
NFVIDKYFTLVGKTNLGYVEFICDNNKNIDIYFGEWKTSSSKSTIFSGNGRNVVVEPIYNPDTGEDISTSLDFSYEPLYG
IDRYINKVLIAPDLYTSLININTNYYSNEYYPEIIVLNPNTFHKKVNINLDSSSFEYKWSTEGSDFILVRYLEESNKKIL
QKIRIKGILSNTQSFNKMSIDFKDIKKLSLGYIMSNFKSFNSENELDRDHLGFKIIDNKTYYYDEDSKLVKGLININNSL
FYFDPIESNLVTGWQTINGKKYYFDINTGAASTSYKIINGKHFYFNNNGVMQLGVFKGPDGFEYFAPANTQNNNIEGQAI
VYQSKFLTLNGKKYYFDNDSKAVTGWRIINNEKYYFNPNNAIAAVGLQVIDNNKYYFNPDTAIISKGWQTVNGSRYYFDT
DTAIAFNGYKTIDGKHFYFDSDCVVKIGVFSGSNGFEYFAPANTYNNNIEGQAIVYQSKFLTLNGKKYYFDNNSKAVTGW
QTIDSKKYYFNTNTAEAATGWQTIDGKKYYFNTNTAEAATGWQTIDGKKYYFNTNTSIASTGYTIINGKYFYFNTDGIMQ
IGVFKVPNGFEYFAPANTHNNNIEGQAILYQNKFLTLNGKKYYFGSDSKAITGWQTIDGKKYYFNPNNAIAATHLCTINN
DKYYFSYDGILQNGYITIERNNFYFDANNESKMVTGVFKGPNGFEYFAPANTHNNNIEGQAIVYQNKFLTLNGKKYYFDN
DSKAVTGWQTIDSKKYYFNLNTAVAVTGWQTIDGEKYYFNLNTAEAATGWQTIDGKRYYFNTNTYIASTGYTIINGKHFY
FNTDGIMQIGVFKGPDGFEYFAPANTHNNNIEGQAILYQNKFLTLNGKKYYFGSDSKAVTGLRTIDGKKYYFNTNTAVAV
TGWQTINGKKYYFNTNTYIASTGYTIISGKHFYFNTDGIMQIGVFKGPDGFEYFAPANTDANNIEGQAIRYQNRFLYLHD
NIYYFGNDSKAATGWATIDGNRYYFEPNTAMGANGYKTIDNKNFYFRNGLPQIGVFKGPNGFEYFAPANTDANNIDGQAI
RYQNRFLHLLGKIYYFGNNSKAVTGWQTINSKVYYFMPDTAMAAAGGLFEIDGVIYFFGVDGVKAPGIYG

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
tcdA CAA63564.1 - Virulence PaLoc Protein 0.0 99
tcdB CAA63562.1 - Virulence PaLoc Protein 0.0 48

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
tcdA YP_003217088.1 toxin A VFG2287 Protein 0.0 99
tcdA YP_003217088.1 toxin A VFG2288 Protein 0.0 48