Gene Information

Name : Dole_1126 (Dole_1126)
Accession : YP_001529010.1
Strain : Desulfococcus oleovorans Hxd3
Genome accession: NC_009943
Putative virulence/resistance : Virulence
Product : DNA mismatch repair protein MutS
Function : -
COG functional category : L : Replication, recombination and repair
COG ID : COG0249
EC number : -
Position : 1335747 - 1338392 bp
Length : 2646 bp
Strand : +
Note : This protein performs the mismatch recognition step during the DNA repair process

DNA sequence :

ATGGCTTCCACAGGCGCCACTCCCATGATGCAGCAGTATCTCTCCATCAAGGAGCAGCACCGGGACGCCATTCTTTTTTA
CCGAATGGGCGACTTTTACGAGATGTTTTTTGAGGACGCTCAAACCGCGGCCCCGGTCCTTGAGATCGCTCTGACCTCCC
GCAACAAGAACGACACCGATCCCATTCCCATGTGCGGTGTGCCGGTAAAGGCCGCGGACGGCTATATCGGCCGGCTCATC
GAAAACGGGTTCAAGGTGGCGGTATGCGAGCAGACCGAGGACCCTGCCGCGGCCAAAGGCCTGGTCCGGCGGGACGTGGT
GCGCATCGTCACTCCGGGCATGATCATCGACAATGCTCTGCTGGAAAAGGGAACCAATAACTACGTTGTCTGCCTGGCCC
ATGCCGACGGTGTTGTGGGGTTTGCCAGCGTGGATATCTCCACCGGCACTTTTCGGGTGTGCGAGTCCTCCGACCTGCGG
GCCGTGCGCCACGAGCTGCTGCGCATCGCGCCCCGGGAAGTGGTAATACCGGAATCCGGCGCCGATGACGCGGCGCTTTC
GCCCTTTGTTTCCCTTTTTCCGCCGGCCATTCGAACAACGCTCGCTAACCGGGAGTTTGATTACAGAACCGCCTGCCAGC
GGCTGACCGACCAGTTTCAGACCCGGTCCCTGGAGGGGTTCGGGTGCCGGGGCCTCAAACCCGGCATTGTCGCGGCCGGG
GCCCTGCTTTCCTATGTAAACGATACCCAGAGACAGAAGGCGTCCCACCTGACCGGGCTGGAGGTCTACAGCATCGACCA
GTACCTGCTGATGGACGAGGTGACCTGCCGGAATCTGGAACTGGTGGCCAACCTTCGCAACAATGGCAGGCAGGGAACCC
TTATTGATGTGCTGGACGCCTGCGTCACCGCCATGGGCAGCCGCCTGCTGCGGCGCTGGATGCTCTATCCCCTGCTGTCG
GCAGAAGCCATCAACCGGCGGCTGGACGCGGTGGCAGAGGCCAAAGAGGGCCTGGGCACTCGAAAGGCGGTGCGGGAACT
GCTCAAACAGGTCTACGATATCGAGCGGCTTACCAGCCGGGCCGTTATGGGCCGGGTCACCCCTCGGGACCTGCTGGCCT
TGAAACAGACCCTTTTCGCCCTGCCGGGTCTGGCAACAGAACTGAAGTCTTTTGACAGCCCTTTTTTCTCCTTTGCCGGG
GAACCGGGGCCCGAAGGCCTTGATAAGCTGGCCGGCCTGGCCGATCTGCTGAAGGCGGCGGTGCGGGAGGACGCGCCGGT
TTCCATCGCTGACGGCGGTGTCATCAACCCCGACTATCATCCCCGGCTGGCCGAACTGGTAACCATCAGCCGGGACGGCA
AGAGCAGCCTGGCCCGGCTGGAGGCAACGGAAAAAGAGAAGACCGGCATTTCCACCCTCAAGGTGCGGTACAACAAGGTG
TTTGGTTACTATATCGAGGTACCCCGGTCCCAGGTGGGGGCCGTGCCGGCTCACTACGTTCGCAAGCAGACCCTTGTCAA
CGGTGAGCGCTACATCACCGACGAGCTTAAGGTGTTTGAGGAAAAAGCCCTGGGCGCCGAAGAACAGCGCGTTCGGCTGG
AGCAGGAGTTGTTTGCCGATATCGTGGGCCGGGTGACCGCGTGCAGCCCGATGCTGTTTGCCGTGGCCCGGGTCGCGGCC
GGAATCGACGTGTTGTGCGCCCTGGCCCAGGTGGCCGATGACCATGACTATGTCCGGCCCGAGATGCTGTCCGGCGGCGA
GATCATCATTGAAGAGGGCCGTCATCCCGTGGTGGAGCGCATGCTTTCCGGCGAACGGTACGTGCCCAACAGCATTACGT
TAAACGATACCGACCGGCAGCTGCTGATCATCACCGGTCCCAACATGGCGGGCAAATCCACGGTGCTGCGCAAGGTGGCG
CTGTTTTCGGTCATGGCCCAGATGGGCTCCTTTGTACCGGCCCGGCGGGCCGCCATGGGTGTGGTGGACCGGCTCTTTAC
CCGGGTGGGGGCCCTGGACAACCTGGCCTCAGGCCAGAGTACCTTCATGGTGGAGATGGAAGAGACGGCCAACATCATCA
ACAACGCCACGCCGAAAAGCCTGGTGGTGATCGACGAGATCGGCCGGGGCACCAGCACCTACGACGGCCTGAGCATTGCC
TGGGCCGTGGCCGAGGCCCTGCATGATCTGCACGGCAGAGGGGTCAAGACCCTGTTTGCCACCCATTACCACGAGCTGAC
CGAACTGGAAAACACCCGGCCCCGGGTGAAGAACTTTCATATTGCCGTCAAGGAGTGGAACGATACCATCATTTTTTTAA
GAAAGCTGGTGGAGGGCAGCACCAACCGCAGCTACGGCATTCAGGTGGCAAGGCTGGCCGGCATTCCCGGCCCGGTGATC
GCCAGGGCCAAGAAGATTCTGCTGGACATCGAGCAGGGCACCTACAGTTTTGAGGCAAAGTCCGGCACTGCTCCGGGCAC
CGGACAGAGCGGCCCGGTTCAGCTCTCCCTGTTTACCCCGCCGGAACAGATGCTGGTGGACCGGCTTCAAAAGGTCGACA
TTTCAACCATGACGCCCCTGGAGGCATTGAACTGCCTTCACGAACTGCAACAGAAGGCGCACGCCATATCGGAGACCGAC
GGATGA

Protein sequence :

MASTGATPMMQQYLSIKEQHRDAILFYRMGDFYEMFFEDAQTAAPVLEIALTSRNKNDTDPIPMCGVPVKAADGYIGRLI
ENGFKVAVCEQTEDPAAAKGLVRRDVVRIVTPGMIIDNALLEKGTNNYVVCLAHADGVVGFASVDISTGTFRVCESSDLR
AVRHELLRIAPREVVIPESGADDAALSPFVSLFPPAIRTTLANREFDYRTACQRLTDQFQTRSLEGFGCRGLKPGIVAAG
ALLSYVNDTQRQKASHLTGLEVYSIDQYLLMDEVTCRNLELVANLRNNGRQGTLIDVLDACVTAMGSRLLRRWMLYPLLS
AEAINRRLDAVAEAKEGLGTRKAVRELLKQVYDIERLTSRAVMGRVTPRDLLALKQTLFALPGLATELKSFDSPFFSFAG
EPGPEGLDKLAGLADLLKAAVREDAPVSIADGGVINPDYHPRLAELVTISRDGKSSLARLEATEKEKTGISTLKVRYNKV
FGYYIEVPRSQVGAVPAHYVRKQTLVNGERYITDELKVFEEKALGAEEQRVRLEQELFADIVGRVTACSPMLFAVARVAA
GIDVLCALAQVADDHDYVRPEMLSGGEIIIEEGRHPVVERMLSGERYVPNSITLNDTDRQLLIITGPNMAGKSTVLRKVA
LFSVMAQMGSFVPARRAAMGVVDRLFTRVGALDNLASGQSTFMVEMEETANIINNATPKSLVVIDEIGRGTSTYDGLSIA
WAVAEALHDLHGRGVKTLFATHYHELTELENTRPRVKNFHIAVKEWNDTIIFLRKLVEGSTNRSYGIQVARLAGIPGPVI
ARAKKILLDIEQGTYSFEAKSGTAPGTGQSGPVQLSLFTPPEQMLVDRLQKVDISTMTPLEALNCLHELQQKAHAISETD
G

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
mutS	AAA80578.1	DNA mismatch repair protein	Virulence	SPI-1	Protein	2e-142	41

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
Dole_1126	YP_001529010.1	DNA mismatch repair protein MutS	VFG0562	Protein	6e-153	42