Gene Information

Name : TherJR_0963 (TherJR_0963)
Accession : YP_003639730.1
Strain : Thermincola potens JR
Genome accession: NC_014152
Putative virulence/resistance : Unknown
Product : DNA polymerase I
Function : -
COG functional category : L : Replication, recombination and repair
COG ID : COG0749
EC number : -
Position : 984780 - 987440 bp
Length : 2661 bp
Strand : +
Note : TIGRFAM: DNA polymerase I; PFAM: DNA-directed DNA polymerase; 5'-3' exonuclease, N-terminal resolvase-like domain; 5'-3' exonuclease, SAM-fold domain; KEGG: pth:PTH_1976 DNA polymerase I; SMART: 5'-3' exonuclease; Helix-hairpin-helix domain protein class

DNA sequence :

ATGACCCAGGGCAAGTTTATTATTATAGACGGAAACAGCCTGGTTTACCGGGCTTTTTACGCTTTACCGCTCTTAAAAAC
CACTACGGGCGTTTATACAAATGCCGTATACGGCTTCACAACCATGCTGATGAAGGTTTTGAACGAAGAAAAACCAGCCT
GCCTGGCCATAGCTTTTGATAAGGGGAAAACTACTTTTCGCAATGAGCATTTTGAAGATTACAAGGGGCACCGGAAAGCA
ACACCTGACGAACTGAAGCCCCAGTTTCCCCTGGTGAAAGAAATTGTGCGCGCTTTTCGCATTCCCGTTTACGAAATAGA
AGGTTATGAAGCTGATGATATAATAGGTACAGTTTCCTTGAAAGCAGAAGAAATGGGATATGAAACTGTAATTGTTACGG
GCGACAGGGACGCGTTGCAGTTGGTTTCACCCAAAACAAGAGTTATGTTAACCAAAAAAGGCATATCAGAAATGGAACTT
TACGACGAAAACAAGGTGGCCGAACGTTACGGGCTCAAACCTGCGCAGATAATAGACATGAAAGGATTAATGGGCGATAC
TTCCGATAATATCCCCGGGGTGCCGGGTATTGGAGAAAAAACGGCCGCCAAACTGGTCAGAGAATATGGCTCCGTGGAAG
AACTGCTGGCCCAAAGAGGTACAGTTGCCGGAAAACTCCGGGAAAAACTCGAGCAGTACGCGGAACAGGCTCTTCTCAGC
AAAAAACTGGCTACGATTATCAGGCATGTGCCTATAGAGATAGATTTACGGGAGTGTGTGGTGGAAGAACCTGACTACGC
GAAACTTTTGGAGTTGGGACGGAGTTTAGAATTTAAGGCTTTGACAAAGCTGGCCCAGGAAAAGGCGCCGGAACAGCCGG
AAAAATTATCTGAACCTGTTGATGAAGCCAAGCAATTGCAAATTAATGGCGAGTACAGACAGTATAACTTTGACGAGGCT
TTAGCTTCTATAACCCGATTTGTGGAACAGAAAAAAGACCTGGCCCTTGTTTTACAAACCTCAAACCAGGACCCCTGGTC
TGCCGGCATTCTTGGATTGGCCTGGTCAGCCGAACCGGGGAGCGGCGGGTATCTTGCCGGTGAGGAACTGCAGCCTGCAG
ATAAACTTACCCGTATCCTGGATACGGTCCTTTGGACGAAGGGCTGGGTATGCTTCCATGATGCCAAAAGGACCGATATC
TTACTGCGACGTTTAGGCAACAAGCCTGTTCGCGCAGGATTTGACACCATGTTGGCGGCTTACCTTTTGGATCCTTCTGT
TTCCAACCTCGATTTAGCTGCTTTATCTATAAAGTATTTGGGGCAGGAGTTGAGCCCTGGAGAAGACTACAGGTCTTTTT
GTGCCCAGGCCGATATTATATTGCGGCTGGTACCTGTACTGCATGAGAAGCTGGCCGAGCTGAACATGCTTGACCTGTAT
TTTGATGTGGAAATGCCCCTCCTGCATATTCTGGCCGATATGGAATTCAGCGGGGTCAAGCTGGACAAGGAATACCTGGA
AGCCATGTCTGTGGATTTAAGTACGGAAATCGACCGGATTACTGGGGATATTTACAGGCTGGCCGGGGAGGAATTCAACA
TCAATTCTACCCGGCAGTTGGGGACCATTCTTTTTGAAAAACTGGGTTTACCGGTCATTAAAAAGACGAAAACAGGGTAT
TCGACAGACGTTGAGGTCCTGGAAACCCTGGCGGAAAGGCATGAAATTGTGGCCAGGGTGCTTCATTACCGCCAGTTGGT
CAAGCTGAAGTCAACCTATGTGGACGGGTTAATTCCTTTGATAAATCCCGTTACGGGAAAGGTCCATACCACCTTTAACC
AGACGGTTACGGCAACGGGGCGGTTGAGCAGTACTGAACCAAACCTGCAGAACATACCTATCCGTATGGAAGAAGGCCGC
AGGATCAGGAAGGCCTTCGTACCTTCCGAACCAGGCTGGATAATCCTTAGTGCAGATTATTCCCAGATCGAGCTCAGGAT
TCTGGCGCACCTTTCCGGGGATGAAAGATTTGTCCAGGCTTTCAGAAATGACGAGGATATTCATACTCGGACTGCCGCGG
AAGTATTCGGCGTGTCTTTGGAGGAAGTAACCGGGGAGATGCGCAGCCGGGCCAAGGCTGTTAACTTCGGAATTGTTTAC
GGCATCAGTGATTTTGGGCTGGCGAAAAATATCTCTGTAAGCCGAAAAGAAGCCAGGCAGTATATTGAAAACTACTTTGC
CCGGTACGCGGGTATAAAAAAATACCTGGAGGAGACAGTCAGGTTGGCCAGGGAACAGGGATATGTAACCACCTTGCTCA
ACAGGCGCCGCTACCTGCCCGACATCCTAAGTCCCAACCGGAATATTCGCAGCTTTGGGGAGCGCACTGCCATGAACACT
CCAATTCAGGGCAGTGCCGCCGATATAATAAAACTGGCCATGGTCCGGGTTGCCGATTGCCTCAAAAAAGAAGGCTTAAA
AGCCCGCATGCTGCTGCAGGTTCACGACGAACTTATTTTTGAGGCGCCGCCTGAAGAACTTCCAAAAGTTACAGGCATTG
TAAGGGAATGTATGGAGAACACCGTTAAATTAACGGTTCCATTAAAAGTAGATATGAAAAAGGGGTTCAACTGGTACGAC
ATGGAGAAAATTAACGATTAA

Protein sequence :

MTQGKFIIIDGNSLVYRAFYALPLLKTTTGVYTNAVYGFTTMLMKVLNEEKPACLAIAFDKGKTTFRNEHFEDYKGHRKA
TPDELKPQFPLVKEIVRAFRIPVYEIEGYEADDIIGTVSLKAEEMGYETVIVTGDRDALQLVSPKTRVMLTKKGISEMEL
YDENKVAERYGLKPAQIIDMKGLMGDTSDNIPGVPGIGEKTAAKLVREYGSVEELLAQRGTVAGKLREKLEQYAEQALLS
KKLATIIRHVPIEIDLRECVVEEPDYAKLLELGRSLEFKALTKLAQEKAPEQPEKLSEPVDEAKQLQINGEYRQYNFDEA
LASITRFVEQKKDLALVLQTSNQDPWSAGILGLAWSAEPGSGGYLAGEELQPADKLTRILDTVLWTKGWVCFHDAKRTDI
LLRRLGNKPVRAGFDTMLAAYLLDPSVSNLDLAALSIKYLGQELSPGEDYRSFCAQADIILRLVPVLHEKLAELNMLDLY
FDVEMPLLHILADMEFSGVKLDKEYLEAMSVDLSTEIDRITGDIYRLAGEEFNINSTRQLGTILFEKLGLPVIKKTKTGY
STDVEVLETLAERHEIVARVLHYRQLVKLKSTYVDGLIPLINPVTGKVHTTFNQTVTATGRLSSTEPNLQNIPIRMEEGR
RIRKAFVPSEPGWIILSADYSQIELRILAHLSGDERFVQAFRNDEDIHTRTAAEVFGVSLEEVTGEMRSRAKAVNFGIVY
GISDFGLAKNISVSRKEARQYIENYFARYAGIKKYLEETVRLAREQGYVTTLLNRRRYLPDILSPNRNIRSFGERTAMNT
PIQGSAADIIKLAMVRVADCLKKEGLKARMLLQVHDELIFEAPPEELPKVTGIVRECMENTVKLTVPLKVDMKKGFNWYD
MEKIND

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
polA	YP_281523.1	DNA polymerase I	Not tested	Not named	Protein	4e-170	44