Gene Information

Name : Acear_1156 (Acear_1156)
Accession : YP_003827743.1
Strain : Acetohalobium arabaticum DSM 5501
Genome accession: NC_014378
Putative virulence/resistance : Virulence
Product : DNA mismatch repair protein MutS
Function : -
COG functional category : L : Replication, recombination and repair
COG ID : COG0249
EC number : -
Position : 1239584 - 1242265 bp
Length : 2682 bp
Strand : +
Note : COGs: COG0249 Mismatch repair ATPase (MutS family); InterProIPR005748:IPR007696:IPR000432:IPR016151:IPR 007860:IPR007695:IPR007861; KEGG: hor:Hore_11670 DNA mismatch repair protein MutS; PFAM: MutS III domain protein; DNA mismatch repair protein MutS doma

DNA sequence :
ATGGCTAAAGAATTAACTCCAATGATGCAGCAGTACTTTTCAATTAAAGATGAATATGATGATGCAATTTTATTATTTAG
ATTAGGCGATTTTTATGAAATGTTTGCTGATGATGCTGAGTTAGCAGCTAGGGAACTAGAATTAACCTTAACTTCTCGAA
ATAAAGGTAAAGGCAAGAAGACGCCGATGGCAGGCATTCCTTATCATTCAGCCGAATCATATATTGCTACCTTAATCGAT
AAAGGCTATCGGGTTGCTATCTGTGAACAGGTAGAAGACCCCAGTGAAACCAACGGCTTAGTCAAGCGGGAAGTGGTTAG
AGTAATTACCCCGGGAACTGTAATTGATAATGAAATGTTAGATGATAAGAATAATAATTATCTTTCAGCAGTTGTAGCTA
ATGAAGAAGGTTTTGGTATTGCCACAATAGATATCTCGACCGGTGATTTTTCAACAACAGAACTGACAGGAGAAGAAGCT
CAGTCTAATTTAATAGATGAATTGGCCCGCATAAATCCTGCGGAATGTTTAGTTGATACTAATTTATACGAAAAGACAGA
GGTAATTACTTATATTAATCAGCAGTTAGATCCGATTATTAATGAAATCAAGGAACGATTTAATTATAGTCAGGCTTATG
ATTTATTGATAGATCATTTTGAAGTTAATTCTTTAGATGGATTTGGCTGTGAAGATTTAAAGTTTGCTGTAACTGCTGCT
GGAGCTGTACTAGATTTCTTAATTGAAACTCAAAAACGGACTTTAGGCCACTTAAATCAGTTAACTACCTACTCAACCAA
GGATTATATGACTTTAGATGCCAATACGAGGCGGAATTTAGAACTGACAAAGACAATCCGTGACCAATCATATAAGGGGA
GTCTACTCTGGGTATTAGATCAGACAGTCACAGCTATGGGAGGACGTAAGTTACAGAAGTGGTTAGAACAGCCGCTATTG
GATGTAGAAGGAATTAATAACCGGTTGGATGCAGTTGGAGAGCTTAAGGATAATATCTTTCTTAAAGAGGAGCTAAAGGA
TAATTTAACTGAAGTCTATGATCTTGAGCGGCTAATGAGTAAGATTACCTACGGTTCAGCCAATGCTAGAGACTTAATTG
CTCTCAAAACTTCAATAGCCAATCTACCGGCGATTAAGGAATTATTAACTCAGTTTGAATCTTCTAAATTAAAATCGGCT
GCTGATAAGTTAGATACTCTAGAAGATGTTCATGAATTAATTGAAAGTTCCATTAAAGAGGAACCGCCGACAACAGTAAC
TGAAGGGGATATAATTAAAACAGGTTATGATGAAGAATTAGATGAATTTAGACAGGCTATGAATGAAGGAAAAGACTGGA
TTGCTAATTTAGAAAAAGAGGAGAAGGAACGAACAGGAATTAAGTCATTAAAGGTTGGGTTTAATAAGGTCCACGGCTAT
TATATAGAAGTAACTAAGGCTAATCTGGATTTAGTGCCTGATAATTATGAACGAAAACAGACTCTTTCTAACAGCGAAAG
ATATATTACACCTGAACTAAAAGAAAAGGAGTCCAAAATTTTGGGCGCTGAAGAGAAAAGTGTTGAGTTAGAATATCAAT
TATTTACTGAAATTAGAGAAAAGGTAGCCCAGGAGACGGAAAGAGTTCAGAAAGTAGCCGATATTGTAGCTCAACTAGAT
GTGCTGGCTTCATTAGCAGAAGTAGCTATCAATAATAACTACTGTCATCCTGAGGTAAATGCCAGTGATGTGATTGATAT
CGAGGACGGACGCCATCCTGTGGTTGAAGAGATGTTAGAAGAAGAAAGCTTTGTTCCTAATGATAGTTATATTGATTGTG
ATCAGGACCGCTTTTTAATCATTACCGGTCCTAATATGTCCGGAAAGTCTACTTATATGCGTCAGGTGGCTTTAATGGTT
TTAATGTCTCAAATCGGGAGCTTTATTCCAGCAGATGAAGCTAAAATAGGTATTGTAGATCGCATCTTTACCCGGGTAGG
TGCTTCGGATGATTTAACTACTGGACAGAGTACTTTTATGGTGGAGATGAATGAGGTTGCTAATATTCTCAATAATGCTA
CGCAGAATAGTCTTGTTATTTTAGATGAAGTCGGACGCGGAACTAGTACCTATGACGGTTTAAGTATTGCCTGGGCGGTA
ACAGAATATATCAGTGATCAGAGCAATATTGGAGCTAAGTCGCTCTTTGCTACTCATTATCATGAGCTAACTGAACTGGA
GTCTAAATTACCGGGGGTAAAGAATTACAATGTTGCTGTCAAAGAAGAAGGCAGTGATATCACCTTCTTACGAAAAATTG
TACCTGGTAAAGCCAATGATAGCTACGGAATTGAAGTAGCTAAACGGGCCGGAGTGCCTAAGTCGGTAATTGATAGAGCC
AATGAAGTTTTAGAAAAGCTAGAGACTGAGATAGATAATTATGAACAGATAAATAACAGTTTAGAGTCTGAGAAGGTAGC
TGAAGCCAAAGCTGAAATTACATCAGAGTCTGAATTACAACAGCAGAACCAGTTGGCCTTATTTGCAGCCCAAAATAGCG
AACTTATACAAAAGCTTGGTGAGTTAGATATTATGTCAATGACTCCTCTAGAGGCTATGAATAAACTCCACCAGCTACAA
CAGGAAGCAAGGGAAGAGTTAAAGAGTCAGGAATTAGCTTAA

Protein sequence :
MAKELTPMMQQYFSIKDEYDDAILLFRLGDFYEMFADDAELAARELELTLTSRNKGKGKKTPMAGIPYHSAESYIATLID
KGYRVAICEQVEDPSETNGLVKREVVRVITPGTVIDNEMLDDKNNNYLSAVVANEEGFGIATIDISTGDFSTTELTGEEA
QSNLIDELARINPAECLVDTNLYEKTEVITYINQQLDPIINEIKERFNYSQAYDLLIDHFEVNSLDGFGCEDLKFAVTAA
GAVLDFLIETQKRTLGHLNQLTTYSTKDYMTLDANTRRNLELTKTIRDQSYKGSLLWVLDQTVTAMGGRKLQKWLEQPLL
DVEGINNRLDAVGELKDNIFLKEELKDNLTEVYDLERLMSKITYGSANARDLIALKTSIANLPAIKELLTQFESSKLKSA
ADKLDTLEDVHELIESSIKEEPPTTVTEGDIIKTGYDEELDEFRQAMNEGKDWIANLEKEEKERTGIKSLKVGFNKVHGY
YIEVTKANLDLVPDNYERKQTLSNSERYITPELKEKESKILGAEEKSVELEYQLFTEIREKVAQETERVQKVADIVAQLD
VLASLAEVAINNNYCHPEVNASDVIDIEDGRHPVVEEMLEEESFVPNDSYIDCDQDRFLIITGPNMSGKSTYMRQVALMV
LMSQIGSFIPADEAKIGIVDRIFTRVGASDDLTTGQSTFMVEMNEVANILNNATQNSLVILDEVGRGTSTYDGLSIAWAV
TEYISDQSNIGAKSLFATHYHELTELESKLPGVKNYNVAVKEEGSDITFLRKIVPGKANDSYGIEVAKRAGVPKSVIDRA
NEVLEKLETEIDNYEQINNSLESEKVAEAKAEITSESELQQQNQLALFAAQNSELIQKLGELDIMSMTPLEAMNKLHQLQ
QEAREELKSQELA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
mutS AAA80578.1 DNA mismatch repair protein Virulence SPI-1 Protein 2e-142 43

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
Acear_1156 YP_003827743.1 DNA mismatch repair protein MutS VFG0562 Protein 7e-156 44