Gene Information

Name : Neut_0537 (Neut_0537)
Accession : YP_746777.1
Strain : Nitrosomonas eutropha C91
Genome accession: NC_008344
Putative virulence/resistance : Unknown
Product : type I site-specific deoxyribonuclease, HsdR family protein
Function : -
COG functional category : V : Defense mechanisms
COG ID : COG0610
EC number : 3.1.21.3
Position : 559110 - 562328 bp
Length : 3219 bp
Strand : -
Note : KEGG: dge:Dgeo_2012 type I site-specific deoxyribonuclease, HsdR family; TIGRFAM: type I site-specific deoxyribonuclease, HsdR family; PFAM: type III restriction enzyme, res subunit; protein of unknown function DUF450; SMART: DEAD/DEAH box helicase domain

DNA sequence :

ATGGCATTTCTGTCGGAGGCTGCCGTGGAGCAAGCACTGTTGGATCAGTTACGTGCTTTAGGCTACAGCATTGAGCAAGA
GGAAATCATCGGCCCCGACGGTAAGCAGTCTGAGCACGAGAGTCATGATGAGGTTGTGCTCAAGAAGCGCTTCGAGGATG
CAGTCGCGCGTCTGAACCCTGGCCTACCGCTGGAAGCGCGTCAGGATGCGGTTCACAAAGTGATGCAGTCAGAGCTGCCC
TCACTGCTGGAGGAGAACCGCCGCTTGCACAAGCTGCTGACGGAAGGTGTAGATGTGGAGTACTACACCAACGATGGCAC
CCTGACGGCGGGCAAGGTCGCGCTGATTAACTTTGAACATCCAGAACAAAACGACTGGCTGGCTGTGAGCCAGTTTGTGG
TAATCAACGATCAAAATAACCGGCGGCCCGATGTGGTGGTATTCGTCAACGGGTTACCGTTAGGTGTGATTGAGCTGAAA
GCACCGGGTAACGCTGGAGCACATCTGCTGGGCGCATTTAACCAATTGCAAACCTACAAACAGCAGATTCCGCAACTTTT
TAACACCAACGCACTGCTGGTGACCTCCGACGGTATTACGGCACGAGTGGGGTCGCTATCGGCAGACCTTGAGCGTTTTA
TGCCATGGCGCACCACCGACGGCACACGCATCGAACCCAAAGGCATGCCGGAGATGGCCACGCTGATCGAGGGCGTGTTC
GAGCAAGGACGCTTTCTCGACCTGCTGCGCCATTTCACCGTGTTTGGCGAAACCGGTGGCGGGCTGATCAAGATCATCGC
CGGCTACCACCAGTTTCACGCGGTGAAGAAGGCGGTAGTTTCTACGTTACGGGCGAGCCAGCCATCGGATCGTCTCGGAG
TGGCCGAGGACCCGGCTGTCTACGGGCTACCCAGCGTTAAGGTCCAACCGCCTGGTGATCACAAGGCCGGGGTGATCTGG
CATACGCAGGGTTCCGGCAAGAGCCTGCTGATGGCGTTTTACGCGGGCCTGCTGGTATTCGACTCGCGCATGGCCAACCC
CACGTTGGTGGTGCTCACCGACCGCAACGATCTGGACGACCAGTTATTCGCTACCTTCGCCATGTGCAAGGACCTGCTGC
GCCAGACGCCGGTGCAGGCGCAGGACCGCGAGCATCTGCGCACCCTGCTCAACCGCGCTTCGGGCGGCGTGATCTTTACC
ACTCTGCAGAAGTTTTCCCCGGCGGCAGACGAGACCGATTTCCCCGCGCTCACGAATCGGTCCAACATCGTGGTCATCGC
CGACGAAGCGCACCGCAGCCAGTACGGCTTCAGAGCAAAAGTGGCCAGCAAAACCGGTGAGATTGCCTACGGCTTTGCCA
AATATCTGCGTGATGCGCTGCCCCATGCCTCCTTCATCGGCTTTACCGGTACGCCCATCGAAGCCGCCGATGTGAACACG
CCGGCGGTGTTCGGCCACTACATCGACATCTACGACATCAGCCGTGCGGTGGAAGATGGCGCTACGGTGCCGATCTATTA
CGAATCGCGGCTGGCGCGCATCGAACTGGATGAGGACGAGAAACCGCACATCGACGCCGAGATCGAGGCACTGCTGGAAG
ACGAAGTTGAGGCCAGCGCCGAACGCACCAAACAGAAATGGAGCACCGTGGAGGCACTGGTGGGCAGCGACAAGCGCCTC
GCCCTGGTGGCCGCCGACCTGGTGCAGCACTTCGAGGACCGGGTGGCGGCACTCTCAGGCCGCGCGATGATGGTGTGCAT
GAGCCGGCGCATCTGTGTGGCGCTGTATGACCAGATCATCAAGCTGTGCCCCGACTGGCACAGCAACGATGACAACGCCG
GCAGCATCAAGATCGTGATGACCGGCACGGCGTCTGACCCGGTTGAGTGGCAACAGCACATCGGAAACAAGGCGCGCCGT
GATCTGCTGGCCAAGCGTGCCCGTGATCCGCAGGACCCGCTGCGGCTGGTGATCGTGCGCGACATGTGGCTGACTGGCTT
CGATGCGCCCAGCATACATACCATGTATATCGACAAGCCGATGCGTGGCCACGGCCTGATGCAGGCCATTGCCCGCGTTA
ACCGGGTGTTCCGTGACAAGCCGGCGGGCTTGATCGTGGATTACATCGGCATTGCCCAGAACCTGAAGTCGGCCCTCGCC
CAGTATTCCAAACCGGATCAAGACAAAACCGGTATTGATGAGCGGGAGGCCGTGGCGGTGTTGTTGGAGAAGGTCGAGAT
TGTGCGCGACATGTTCTTTGGGTTCGACTACCAAACCGGCCTTGGCGGCACGCCCAGCGAGCGGCTGGCGATGATGGCCA
GCGCCATCGAATGGATACTCGACAAGCAGCAGCAATGGGCGGCGGCAGAAAAGACGCCAGAGGCTTCGAGGCAGGCGCGA
CGGCGCTTTGCCGATGGCGTACTGAGTCTATCGAAGGCCTTTGCACTGGTGGCAAGTTCGGATGAAGCGCGCGGCATCCG
CGAGGAAGTCGGTTTCTTCCAGGCCATCCGTGCTGCGCTAGTCAAGACGGCGGGCGGTGCAGGGGCTATCCGGCAGGATC
GGGAACTAGCCATCCAGCAGATCGTCAGCCGTGCTGTGGTCTCCACCGAGATCGTCGATATCCTTGCTGCTGCTGGCATC
CAGACGCCGGATATCTCCATCCTCTCCGACGAGTTTCTGCTTGAAGTGCAGCAGATGGAGAAAAAGAATCTGGGGCTGGA
AGCGCTGCGCAAGCTGCTCAATGACAGCATCCGCTCGCGCACCCGCACCAACGTGGTTGAGACTCGCGCTTTCACCGAGC
GGTTGGAAGACGCCATTGCCCGTTATCACGCCAATGCTATCACCACCGCCGAGGTGCTGCAGGAACTGATCAATTTGGCG
CAGGACATTCGCGCCGCGCGCAATCGCGGCGAGGAACAGGGCTTATCCCTTGATGAGATCGCCTTTTACGACGCGCTGGC
GGAGAACGAATCTGCTGTGCAGGTGATGGGTGACGACAATTTGCGGGTTATCGCTCACGAGCTGCTGGTCAGCCTGAAAG
AAAACATTGCCGTTGACTGGGCCCACCGTGAATCGGCCCGGGCGCGGCTGCGCGTGCTGGTCAAGCGCATCCTGCGCAAA
TATGGCTACCCACCCGACCTGCAGGATGCGGCGGTGCAGACCGTATTGCAGCAGGCGGAGGCATTGTCGTCAGAATGGAG
TGTGGCTGGATATGGATGA

Protein sequence :

MAFLSEAAVEQALLDQLRALGYSIEQEEIIGPDGKQSEHESHDEVVLKKRFEDAVARLNPGLPLEARQDAVHKVMQSELP
SLLEENRRLHKLLTEGVDVEYYTNDGTLTAGKVALINFEHPEQNDWLAVSQFVVINDQNNRRPDVVVFVNGLPLGVIELK
APGNAGAHLLGAFNQLQTYKQQIPQLFNTNALLVTSDGITARVGSLSADLERFMPWRTTDGTRIEPKGMPEMATLIEGVF
EQGRFLDLLRHFTVFGETGGGLIKIIAGYHQFHAVKKAVVSTLRASQPSDRLGVAEDPAVYGLPSVKVQPPGDHKAGVIW
HTQGSGKSLLMAFYAGLLVFDSRMANPTLVVLTDRNDLDDQLFATFAMCKDLLRQTPVQAQDREHLRTLLNRASGGVIFT
TLQKFSPAADETDFPALTNRSNIVVIADEAHRSQYGFRAKVASKTGEIAYGFAKYLRDALPHASFIGFTGTPIEAADVNT
PAVFGHYIDIYDISRAVEDGATVPIYYESRLARIELDEDEKPHIDAEIEALLEDEVEASAERTKQKWSTVEALVGSDKRL
ALVAADLVQHFEDRVAALSGRAMMVCMSRRICVALYDQIIKLCPDWHSNDDNAGSIKIVMTGTASDPVEWQQHIGNKARR
DLLAKRARDPQDPLRLVIVRDMWLTGFDAPSIHTMYIDKPMRGHGLMQAIARVNRVFRDKPAGLIVDYIGIAQNLKSALA
QYSKPDQDKTGIDEREAVAVLLEKVEIVRDMFFGFDYQTGLGGTPSERLAMMASAIEWILDKQQQWAAAEKTPEASRQAR
RRFADGVLSLSKAFALVASSDEARGIREEVGFFQAIRAALVKTAGGAGAIRQDRELAIQQIVSRAVVSTEIVDILAAAGI
QTPDISILSDEFLLEVQQMEKKNLGLEALRKLLNDSIRSRTRTNVVETRAFTERLEDAIARYHANAITTAEVLQELINLA
QDIRAARNRGEEQGLSLDEIAFYDALAENESAVQVMGDDNLRVIAHELLVSLKENIAVDWAHRESARARLRVLVKRILRK
YGYPPDLQDAAVQTVLQQAEALSSEWSVAGYG

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
hsdR	BAD24840.1	type I restriction-modification system endonuclease homologue	Not tested	Type-V SCCmec	Protein	0.0	47
hsdR	BAH57699.1	type I restriction-modification system endonuclease homologue	Not tested	Type-VII SCCmec	Protein	0.0	47
hsdR	YP_251977.1	type I restriction-modification system restriction subunit	Not tested	SCCmec	Protein	0.0	47
api52	CAF28526.1	hsdr-like Type I restriction enzyme	Not tested	YAPI	Protein	0.0	47