Gene Information

Name : TREAZ_2426 (TREAZ_2426)
Accession : YP_004528992.1
Strain : Treponema azotonutricium ZAS-9
Genome accession: NC_015577
Putative virulence/resistance : Unknown
Product : putative type-1 restriction enzyme MjaXP R protein
Function : -
COG functional category : V : Defense mechanisms
COG ID : COG0610
EC number : -
Position : 3769495 - 3772776 bp
Length : 3282 bp
Strand : +
Note : identified by match to protein family HMM PF04313; match to protein family HMM PF04851; match to protein family HMM TIGR00348

DNA sequence :

ATGCCCTTCCTCACCGAGTCTGATATTGAACAATACGCCCTCGAACTTCTCGAAGCCCAGGGCTATGACTGTCTGTACGG
CCCGGACATTGCGCCGGGCGGGCATAATCCGCTCCGTAAATCTTTTGATGAGGTTCTCCTCTTTGATATGCTGGAAGCCG
CTGTTGCCCGGATTAACCCGAACCTTTCACGGGAGCTTCGGGAGGATGCGGTCAGGCAGTTGGCCCGGCTCCGCAGTGCG
GATCTTATGGTCAACAACGAAACCTTTCACCGCTTCTTCACCGAGGGGGTTCCTGTAACCAGTGTTTCAGGCGGTTATGA
GCGGGGAGACAGGGTGATGCTGGTTGACTTTGAACATCCTGAGACTAACGATTTTACAGCGGTCAACCAGTTTACGATTA
TCGAGAATCATATCAATAAACGGCCCGACATCATCCTCTTTATAAACGGGATTCCCCTGGTGGTAATCGAATTAAAAAAC
GCCGCCGATGAAAACGCGGATATTGCATCAGCCTGGAAGCAGATACAAACGTACAAAGAGGCGATTCCCTCCCTTTTTAC
CTTTAACAGTTTTGCAATTATCTCTGACGGCCTTGAGGCGCGGGCGGGAACCATTTCTTCGGGGCAGAGCCGCTTTATGG
CCTGGAAAAGCGCCGATGGCAGGAAAGATGCGTCCGGGCATACGGGGCAGATCGAGACCCTTATTAAGGGGATGCTGAAT
ACGCAAACCCTGCCGGATCTTATCCGCCACTTTATTGTGTTTGAAAAAACCAGACGGGAAGACAGTAAAGGAATTACCGC
CGTCGAGACGGTTAAAAAACTTGCGGCCTATCATCAATACTACGCGGTGAACAAGGCGGTGGAATCTACCCTGCGGGCAT
CGGGGTATGTAAAAAAGTCAAAGGGGATACACAAGGGGATTGGCGCAGAATCGGAGAATGCCGCTGCCGAAGATCCTGAA
TCCTACGGACTGCCCGGTGTAAAAACCCAGCCCCTGCGGGACCGGAAGGGCGGCGTTATCTGGCATACCCAGGGCTCGGG
GAAGTCCCTGTCCATGGTGTTCTTTACGGGCAAGATCATCCTTGCCATGGATAACCCTACCGTGGTGGTGATCACCGACC
GGAATGATCTGGACGATCAGCTTTTTGACACTTTTAGTGCTTCAAAACAACTGCTCCGTCAGGAACCGGTTCAGGCGGAG
AGCCGAGGCCAGCTCAAGGAACTTCTCAAGGTTGTTTCAGGTGGCGTGGTGTTTACTACCATTCAGAAATTTCAGCCCGA
GGACGGCAGTAATCTGTACGAAGAACTGTCGAAGCGGGAAAATATCATCGTTATTGCCGACGAAGCCCACCGGAGTCAGT
ACGGGTTTACTGCAAAAACGCTGGACGAAAAAAACGAAGCCGGGGAAGTGATCGGCAAAAAGACGGTGTACGGTTTTGCC
AAATATCTGCGGGACGCCCTGCCCAACGCGACGTATCTGGGCTTTACCGGCACCCCCATCGAAAGCGCCGATGTGAACAC
CCCTGCGGTCTTTGGCAATTATGTGGATATCTACGATATTGCCCAGGCGGTGGAAGACGGCGCCACAGTCCGCATCTATT
ACGAAACCCGTCTGGCGAAAATTTCATTGAGCGATGAAGGCAAAAGGCTCATTCAGGAATTTGACGATGACCTTGAAATG
ACTGAACTCGCGGAGACCCAAAAGGCTCAGGCGAAATGGGCCCAGCTTGAAGCCCTTGTCGGAAGCTCCGGCAGGATAAA
AAAAATAGCCCTGGATATTGTTACCCATTTTGAACAGCGCCAAACGGTATTAAACGGCAAGGCCATGATTGTCGCCATGT
CACGCCGTATTGCCGCCGCCCTGTATGAGGAAATTACCGTCCTGAGGCCCGAATGGCACAACAGCGATTTGGATAAGGGA
AGTATCAAAGTGGTGATGACATCTTCTTCTTCCGATGGGCCTGAAATATCCAAACATCATACTACCAAGGATCAACGCCG
CAAACTTTCTGACCGGATGAAAAATCCCCATGACGAACTCCGTCTGGTGATCGTTCGGGATATGTGGCTCACCGGGTTTG
ATGTGCCCGCTCTCCATACCCTCTATATTGATAAGCCCATGCGGGGCCATAACCTGATGCAGGCCATAGCCCGAGTCAAC
CGGGTATATCTGGATAAAAAGGGCGGCCTCATCGTGGATTATCTGGGGATCGCTTCGGATCTAAAAGATGCCCTTTCCTT
TTATTCCGCCTCAGGGGGCAGGGGCGATCCGGCGGAAACCCAGGAGCAGGCGGTTTCCCTCATGCTGGAAAAACTGGAAG
TGGTGTCTCAGCTGTTCCACGGTTTCGATTATTCCCCCTACTTTAGTGCCGGTACGGGGCAGAAGCTTTCCCTCATTCTT
GCTGCGGAGGAACATATCTTGCAGCAGGAAGACGGACGACGGCGTTTTCTCGATCAGGTAACTGCCCTGTCCCAGGCCTT
CGCTATTGCGGTTCCCCATGACAAGGCCATGGATGTAAAGGATGAAGTCGCCTTCTTCCAGGCGGTAAAGGCCCGGCTTG
CAAAATTTGACGGGCCCGCTTCCGACGAAACCGTTTCCGGTAAATCCTCAGGCGCCTCCGCGCAGACAGCCTCCTCCCTG
GAAACCGCCATCCGCCAGATCGTTGACCAGGCCCTGGTAACAAGCCGGGTGATCGATGTGTATGAAGCGGCGGGAATCAA
GAAGCCCGATATTTCGATCCTTTCGGAAGAATTCCTTATGGACGTAAAAAACATGGAGCACAAGCACCTCGCCATGGAAG
TGCTGCGAAAACTCCTTGCCGATGAAATCAGGGCCCGGCTTAAAACAAACCTGGTGGAAGGGAAGACCCTGATGGAAATG
CTGGAAAATTCCATCAAAAATTATCAGAATAAAATCGTCACCGCTGCGGAAGTCATCGACGAGCTTATATCCCTTGCCAG
GGATATTCATAAACGGGATACGGCTTTTGAGGAACTTAAGCTTACCGAATACGAATATGCTTTTTATACCGCAGTGGCGA
ATAACGAAAGCGCCCGCGAATTAATGGGCAAGGAACAGCTCCGGGAATTGGCAGTGGTACTCTACCGGAAAGTAAAAGAG
AACGCCTCCATCGACTGGACTATACGCGAAGATGTGCGGGCCAAGCTCAAGGTGACGGTGAAACGCCTTCTCCGCGAATA
CGGCTATCCCCCGGACATGGAAGCCCTGGCAACCGAAACGGTTTTGCAGCAGGCGGAAAAAATCGCCGATGAGCTGGCGT
AA

Protein sequence :

MPFLTESDIEQYALELLEAQGYDCLYGPDIAPGGHNPLRKSFDEVLLFDMLEAAVARINPNLSRELREDAVRQLARLRSA
DLMVNNETFHRFFTEGVPVTSVSGGYERGDRVMLVDFEHPETNDFTAVNQFTIIENHINKRPDIILFINGIPLVVIELKN
AADENADIASAWKQIQTYKEAIPSLFTFNSFAIISDGLEARAGTISSGQSRFMAWKSADGRKDASGHTGQIETLIKGMLN
TQTLPDLIRHFIVFEKTRREDSKGITAVETVKKLAAYHQYYAVNKAVESTLRASGYVKKSKGIHKGIGAESENAAAEDPE
SYGLPGVKTQPLRDRKGGVIWHTQGSGKSLSMVFFTGKIILAMDNPTVVVITDRNDLDDQLFDTFSASKQLLRQEPVQAE
SRGQLKELLKVVSGGVVFTTIQKFQPEDGSNLYEELSKRENIIVIADEAHRSQYGFTAKTLDEKNEAGEVIGKKTVYGFA
KYLRDALPNATYLGFTGTPIESADVNTPAVFGNYVDIYDIAQAVEDGATVRIYYETRLAKISLSDEGKRLIQEFDDDLEM
TELAETQKAQAKWAQLEALVGSSGRIKKIALDIVTHFEQRQTVLNGKAMIVAMSRRIAAALYEEITVLRPEWHNSDLDKG
SIKVVMTSSSSDGPEISKHHTTKDQRRKLSDRMKNPHDELRLVIVRDMWLTGFDVPALHTLYIDKPMRGHNLMQAIARVN
RVYLDKKGGLIVDYLGIASDLKDALSFYSASGGRGDPAETQEQAVSLMLEKLEVVSQLFHGFDYSPYFSAGTGQKLSLIL
AAEEHILQQEDGRRRFLDQVTALSQAFAIAVPHDKAMDVKDEVAFFQAVKARLAKFDGPASDETVSGKSSGASAQTASSL
ETAIRQIVDQALVTSRVIDVYEAAGIKKPDISILSEEFLMDVKNMEHKHLAMEVLRKLLADEIRARLKTNLVEGKTLMEM
LENSIKNYQNKIVTAAEVIDELISLARDIHKRDTAFEELKLTEYEYAFYTAVANNESARELMGKEQLRELAVVLYRKVKE
NASIDWTIREDVRAKLKVTVKRLLREYGYPPDMEALATETVLQQAEKIADELA

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
hsdR	BAD24840.1	type I restriction-modification system endonuclease homologue	Not tested	Type-V SCCmec	Protein	0.0	47
hsdR	YP_251977.1	type I restriction-modification system restriction subunit	Not tested	SCCmec	Protein	0.0	47
hsdR	BAH57699.1	type I restriction-modification system endonuclease homologue	Not tested	Type-VII SCCmec	Protein	0.0	47
api52	CAF28526.1	hsdr-like Type I restriction enzyme	Not tested	YAPI	Protein	0.0	44