Gene Information

Name : Cthe_0886 (Cthe_0886)
Accession : YP_001037313.1
Strain : Clostridium thermocellum ATCC 27405
Genome accession: NC_009012
Putative virulence/resistance : Unknown
Product : DNA polymerase I
Function : -
COG functional category : L : Replication, recombination and repair
COG ID : COG0749
EC number : 2.7.7.7
Position : 1061395 - 1064079 bp
Length : 2685 bp
Strand : -
Note : has 3'-5' exonuclease, 5'-3' exonuclease and 5'-3'polymerase activities, primarily functions to fill gaps during DNA replication and repair

DNA sequence :

ATGAGCAAGCAAAAATTGATGGCCATAGACGGAAACAGTATTCTTAACAGGGCTTTTTACGGGCTTCCCGAACTTCTGAC
AACATCCGACGGGATATATACCAACGGAATTTATGTTTTTTTAAATATAATGCATAAATTTATTGAAGAGGAAAATCCCG
AGTACATTTGCGTTGCGTTCGACCTTAAGGCTCCGACTTTCAGGCACAATAAATACGAAGGTTACAAGGCAAACAGGAAA
GGAATGCCGGAAGAGCTCCGGGTTCAGGTTCCCCTGCTTAAGGAAGTTTTGGATGCAATGAATATAAAAAGACTTGAGAT
GGAGGGGTTCGAGGCTGACGACATACTTGGTTCCGTTTCCTTGTGCGCCGAAAAAAAGGGTCTGGAAGTAATACTGGTTA
CAGGGGACAGGGATGCTTTTCAATTGATCGGTCCTTCCACAAGGCTGAAACTTCCGCGGACGAGAGGCGGGAAAACAGAG
GTTGAGGAATATGACTACAACAAGATTGTGGAGGTCTACGGAATCAAGCCGGAACAGTTTGTTGACGTCAAGGCTTTGGC
GGGAGATACTTCCGACAATATTCCCGGTGTTCCGGGTATCGGCGAAAAGACGGCCCTGGCTCTCATAAAAGAATACAACA
ATCTTGAAAACCTTTATAATTCATTGGACAGCATTAAAAAGAAAGGACTTAGGGAAAAGCTTGAAACTTTTAAGGAGCAG
GCTTTTCTGAGCAGGGAGCTTGCCCTGATTGAAAGAAACATGCCGTCCCTTTGTGATATTGAAGAGCTGAAAAGAGTGGA
GATTGACAGGGAAAAAACCTATGAGATATTTAAGAGGCTGGAATTTAGAAGCTTTATTGACAAGTTTGGATTGAACGATG
TCCAAATCCAAAATACCGTGGAACTGAATGTGAAAATCGCAAAAAACGCCAGTGAACTTGAGAGTTTGAAAAACAATATT
CTCAAGTCCAGAAAAGTTTGTATTTATCATTTGATTGACAAAACGGGCAGCTTTTCTCAAAAGCTTGCCGCCATTGCAAT
TTCGCCCGTGGAGGATGAAGCATGGTATTTGGATTTTACCAATAATATTGATGAAGATGAGTTTTTCAGGCAGTTTAAGG
ACGTTTTGGAGGATGGAAATATAAAGAAATACGGGCATGATTTGAAAAATTTTATAGTATATTTAAATAATCGGGGAATT
GATTTTAACGGTTTGGCTTTTGACACAATGATTGGAGCTTATATAATAAACCCGTCAAAGGAGACCTATACGATATCCGA
GCTGGCACAGGAGTATTTAAACTTGAGTGTAAAGGCGGTTGAGGAACTTGCGGGCAAGGGCAAAAGCTTTACTTTGTTTA
AGGACATGCAGCCTGACGTTCTTTCAAAGACTGTTGGTGTTTATCCTCATGTTATAAGCAAAGTAAGCCGGAAAATTGAC
AGCCTTCTTAAAGAAAACAACCAGGAGAGGCTTTATTATGACATTGAGCTTCCGCTGGTGCGGACCTTGGCGGATATGGA
GTATTACGGATTCAAGGTTAATGTCGATGCTCTTGTGGAATTTTCGAAAGAGCTTCAGGAAAAGATAGATGTTGTAACAA
AAGAAATATACACTTTGGCGGGAGAAGAGTTCAATATCAATTCTCCGAAACAGCTGGGAGTTATTTTGTTTGAGAAACTG
GGTCTTCCCATTATTAAGAAAACAAAAACCGGATATTCAACCGATGCTGAAGTATTGGAAGAGCTTTCCGACAGGCATGA
AATAGTGGAAAAAATACTGGAATACAGACAGCTTGTAAAGCTGAAATCCACTTATGCGGAAGGCCTTTTGGCGGTTATAA
ATCCTTACACGGGAAAGATTCATTCAAGTTTCAACCAGACAGTGACGGCTACGGGAAGAATAAGCAGTACAGAGCCAAAT
CTTCAGAATATACCGATAAAACTTGAAATGGGCAGGAAAATACGAAAAGTTTTTATACCTTCGGATGAAAACTATCTGCT
TCTTGATGCGGACTATTCCCAGATAGAGCTTCGGGTTCTGGCCCACATAACCAATGACGAAAACATGATAAATGCGTTTT
TAAACAACGAAGACATTCATACTTCCACGGCTGCATCGGTCTTTGGAATACCAAAAGAGGAAGTTACCCCTCTCATGAGG
TCCAGAGCGAAAGCTGTCAATTTCGGTATTGTATACGGTATAGGGGACTTCAGTCTTGCAAAGGATCTTAAGATAAGCAG
AAAGGAAGCCAGAGCATATATAGACGGTTATCTGGACAGATATCCAAATGTAAAGAAATATATGCATGATATTGTGGAAG
AGGGAAAAGAAAAAGGTTTTGTAACCACCATGTTCATGAGAAGAAGGTACCTTCCTGAGCTTAAATCGCGCAACTTCAAC
ATACGGTCTTTTGGAGAACGGGTTGCGATGAACACCCCGATACAGGGAAGTGCCGCGGATATAATCAAGATTGCCATGGT
AAAGGTGCATGGAGAGCTTAAAAAAAGAAAGCTTAAATCCAGGCTGATACTTCAGGTTCACGATGAACTTATTGTAGAGA
CGTTCAAGGATGAAAAAGAAGAGGTGGAAAAGATTTTACTTGAAGGCATGCAAAATGCCGTAAGTCTGAAAGTGCCGCTG
GTTGTGGAGATTAAATCGGGCAGCAACTGGTATGAGACAAAGTAA

Protein sequence :

MSKQKLMAIDGNSILNRAFYGLPELLTTSDGIYTNGIYVFLNIMHKFIEEENPEYICVAFDLKAPTFRHNKYEGYKANRK
GMPEELRVQVPLLKEVLDAMNIKRLEMEGFEADDILGSVSLCAEKKGLEVILVTGDRDAFQLIGPSTRLKLPRTRGGKTE
VEEYDYNKIVEVYGIKPEQFVDVKALAGDTSDNIPGVPGIGEKTALALIKEYNNLENLYNSLDSIKKKGLREKLETFKEQ
AFLSRELALIERNMPSLCDIEELKRVEIDREKTYEIFKRLEFRSFIDKFGLNDVQIQNTVELNVKIAKNASELESLKNNI
LKSRKVCIYHLIDKTGSFSQKLAAIAISPVEDEAWYLDFTNNIDEDEFFRQFKDVLEDGNIKKYGHDLKNFIVYLNNRGI
DFNGLAFDTMIGAYIINPSKETYTISELAQEYLNLSVKAVEELAGKGKSFTLFKDMQPDVLSKTVGVYPHVISKVSRKID
SLLKENNQERLYYDIELPLVRTLADMEYYGFKVNVDALVEFSKELQEKIDVVTKEIYTLAGEEFNINSPKQLGVILFEKL
GLPIIKKTKTGYSTDAEVLEELSDRHEIVEKILEYRQLVKLKSTYAEGLLAVINPYTGKIHSSFNQTVTATGRISSTEPN
LQNIPIKLEMGRKIRKVFIPSDENYLLLDADYSQIELRVLAHITNDENMINAFLNNEDIHTSTAASVFGIPKEEVTPLMR
SRAKAVNFGIVYGIGDFSLAKDLKISRKEARAYIDGYLDRYPNVKKYMHDIVEEGKEKGFVTTMFMRRRYLPELKSRNFN
IRSFGERVAMNTPIQGSAADIIKIAMVKVHGELKKRKLKSRLILQVHDELIVETFKDEKEEVEKILLEGMQNAVSLKVPL
VVEIKSGSNWYETK

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
polA	YP_281523.1	DNA polymerase I	Not tested	Not named	Protein	8e-142	41