Gene Information

Name : Nwat_1306 (Nwat_1306)
Accession : YP_003760553.1
Strain : Nitrosococcus watsonii C-113
Genome accession: NC_014315
Putative virulence/resistance : Unknown
Product : HsdR family type I site-specific deoxyribonuclease
Function : -
COG functional category : V : Defense mechanisms
COG ID : COG0610
EC number : -
Position : 1414766 - 1417924 bp
Length : 3159 bp
Strand : +
Note : TIGRFAM: type I site-specific deoxyribonuclease, HsdR family; PFAM: protein of unknown function DUF450; type III restriction protein res subunit; KEGG: maq:Maqu_3386 HsdR family type I site-specific deoxyribonuclease; SMART: DEAD-like helicase

DNA sequence :

ATGACCGAAGAGCAACTGGAACAACAATGCTTGCAATGGTTCGCCGAAGGCGGCTGGGAGATCGCCCATGGACCGGATCT
GGCGCCGGATGGCGAGGCCCCGGAACGGGCCGATTACCGGCAGGTGTTGTTGCTGGCGGATCTTGAGGCGGCCATAAAGC
GCATCAATCCTCACCTGTCCCAGAGCGCCGTTGAGCAGGCTATCGCCGTGGTGCGCAAGCCGGAAAGCCTGGATGTGGTG
ATCAGCAATCGGGTCTTCCACCGCCTGCTGCTGAATGGCGTACCCGTTGAGTACAAGCACGACGACAAGCTGGTTCACGA
CCGGGCATTGCTGGTGGATTTCAGAGATCTCACCGCCAACCGCTTCCGGGCCATTAATCAGTTCACCCTCGCAGGCTCCC
GGCAACTGCGCCGGCCGGATGTGATCTGCTTTATCAACGGCTTACCTCTGGCCGTGCTGGAGCTGAAAAGCCCCGGCGCC
GAGAACGCGAACATCTGGGATGCCTACCACCAGATCCAGACCTACAAGGACGAAATCCCCGACCTATTCGCCTATAACGA
GGCAGCCATCATCAGTGACGGCTATGGGGCCCGGGTAGGCTCTCTCACCGCCAGCCAGGAGCGCTACATGCCCTGGCGCA
CAATCAAGCACGAGGACGACAAGCCCCTGCTGGAGTGGCAGTTAGAAACCATGGTGCGGGGCTTTTTCGACCGGGAACTG
TTCCTGGATTACCTTCGCTACTTCGTGATCTTCGAGGCCGACTCGGACAAGCTGATTAAGAAGATTGCCGGCTACCATCA
GTTCCATGGGGTGCGCGAAGCGGTAAAGGCCACGGTGATTGCCGCCCAAGCGCCGGAGCAAGGTTACTGGGCCAAAGAAA
AACGCGCTACCTACGGCGATGAGGTGCAGCCAGGGAGCAAAAAGGCCGGGGTAGTGTGGCATACCCAGGGCTCTGGTAAG
AGCCTTTCCATGTGCTGTTACGCCGGCAAGTTGCTGCAACAGCCCGGGATGAACAACCCCACCCTGATGGTGGTGACCGA
TCGCAACGATCTGGACGGCCAACTGTTCGCCACCTTTAGCGCCGCCCGGGAATTGCTTAAACAGGAGCCGGTACAAGCCG
ATGACCGGGATACCCTGCGGCGGTTGCTGTCGGAACGGGAATCCGGCGGGATCATCTTCACCACGGTGCAGAAGTTCGCC
CTGCTGAATGATGAGACCGGCCACCCGGTGCTGAATGACCGCCACAACATCGTGGTGATCTCCGATGAAGCCCACCGCAG
CCAGTATGGCCTGAAAGCTACCCTCAAGCGAGACGGCAGCTACACGTTCGGTTATGCCCGCCACCTGCGCGATGCCCTGC
CCAATGCCTCGTTCATTGGCTTCACCGGCACCCCCATTGAGCGCGAAGACAGGGACACCCGCGCCGTGTTCGGTGATTAC
GTCTCCATCTACGACATCCAGGATGCCGTGGACGATGGCGCGACGGTACCCATCTTCTATGAATCCCGCTTGGCCAAGCT
GGACCTCAACCGGGACCTGATCGGGGAACTGTCCGAGCAGGTAGAGGAAATGGTTGAAGACGATGAAGACGTGGGCAGCC
GCGAGAAAACCAAGGGCGAGTGGAGCCGCCTGGAGAAACTGGTAGGTGCTGGCCCGCGTCTGAAGCAGGTGGCGGAAGAC
CTGGTCAGCCACTTTGAAACCCGCTCCCGTACCCTCAGCGGTAAAGCCATGATTGTGGCTATGAGCCGGGAGATTTGCGT
GCATCTGTATAACGAGATAGTCGCCCTGCGCCCGGCATGGCACGACGATGATCCGGAGAAAGGCGCCATCAAGGTTGTGA
TGACTGGCTCCGCCTCGGATCGGGCCTTGCTGCAACCCCATATCTATAACAAGCAGACCAAAAAGCGGTTCGAGAAGCGC
TTCAAGGACAGCAACGATTCGCTCAAGCTGGTGATCGTGCGGGATATGTGGCTGACCGGGTTCGACGCGCCTTGTTGCCA
CACCATGTACGTGGACAAGCCCATGAAGGGCCATAATTTGATGCAGGCCATTGCCCGGGTCAACCGGGTGTTCAAGGACA
AGCCCGGTGGGCTGGTGGTGGACTACATCGGCATTGCCAACGAACTCAAGCAGGCCCTGAAAACCTACACTGATGCCAAG
GGCAAGGGTTCCCCCACTCACAGCGCGGAAGAAGCCTACGCCATTTTGCTGGAGAAGCTGGCCATCATCCACGGCCTGTT
CGCACCTGGCCCGCAAGGCCAGGGCTTCAACTACAACGGTTTCGAAACCGGGCCCCACAAGTTGCTGGTGCCTACCGCCA
ACTATGTGCTCAGTCTGGAAGATGGCAAGAAGCGTTTCTTGGATACCGTGCTGGCCATGAACAAAGCGTTCTCCCTCTGC
GCTACCCTGGACGAAGCCCAGGCCCTGCAGAAGGAGGTGGCGTTTTGGTCGCAGGTGAAAATCGCCATCACCAAGTTCAC
CAGCGTGGACAAAAAGCTCACCGAGGAAGACAAGAACACTGCCTTGAAGCAGATTCTGGACAACGCCCTGGTGGCCGAAG
GCGTGACCGATGTGTTTGCCCTGTGCGGCCTGGACAGGCCCAACATCGGCCTACTCTCGGACGAATTCCTGGAAGACGTG
CGGCAAATGCCCTATAAGAATTTCGCCGTGGAGCTGCTGGAAAAACTGCTCAAGGACAACATCAAGGCTAGAACCCGCAG
CAACGTGGTGCAGGAGAAGAAATACGCCGACCGCCTGCAAGCAACCCTGCGCCAGTACAACAACCGGGGCATTGAGACGG
CACAGGTGATGGAAGAGCTGATTGCCATGGCCAAGCAATTCCAGGCGGAACTGGAGCGCGACGAAGCCCTGGGCCTGAAC
CTGGATGAAGTAGCCTTCTACGATGCCCTGGCCAATAATGAAAGTGCGGTGCGAGAGTTGGGTGATGAGACGCTGAAGAA
AATCGCCGTGGAAATCACCGACAAGCTGCGCAAATCCACTACCGTCGACTGGCAGGTGCGGGAAAGCGTGCGGGCCAAGC
TGCGGATTTTGGTGCGCCGAACGTTACAACGGTACCAATATCCGCCGGACAAGGCTCCGGAGGCGGTCGAACTTATTTTG
CAGCAGGCCGAGGTACTATCGGATGAGTGGACAAAATAA

Protein sequence :

MTEEQLEQQCLQWFAEGGWEIAHGPDLAPDGEAPERADYRQVLLLADLEAAIKRINPHLSQSAVEQAIAVVRKPESLDVV
ISNRVFHRLLLNGVPVEYKHDDKLVHDRALLVDFRDLTANRFRAINQFTLAGSRQLRRPDVICFINGLPLAVLELKSPGA
ENANIWDAYHQIQTYKDEIPDLFAYNEAAIISDGYGARVGSLTASQERYMPWRTIKHEDDKPLLEWQLETMVRGFFDREL
FLDYLRYFVIFEADSDKLIKKIAGYHQFHGVREAVKATVIAAQAPEQGYWAKEKRATYGDEVQPGSKKAGVVWHTQGSGK
SLSMCCYAGKLLQQPGMNNPTLMVVTDRNDLDGQLFATFSAARELLKQEPVQADDRDTLRRLLSERESGGIIFTTVQKFA
LLNDETGHPVLNDRHNIVVISDEAHRSQYGLKATLKRDGSYTFGYARHLRDALPNASFIGFTGTPIEREDRDTRAVFGDY
VSIYDIQDAVDDGATVPIFYESRLAKLDLNRDLIGELSEQVEEMVEDDEDVGSREKTKGEWSRLEKLVGAGPRLKQVAED
LVSHFETRSRTLSGKAMIVAMSREICVHLYNEIVALRPAWHDDDPEKGAIKVVMTGSASDRALLQPHIYNKQTKKRFEKR
FKDSNDSLKLVIVRDMWLTGFDAPCCHTMYVDKPMKGHNLMQAIARVNRVFKDKPGGLVVDYIGIANELKQALKTYTDAK
GKGSPTHSAEEAYAILLEKLAIIHGLFAPGPQGQGFNYNGFETGPHKLLVPTANYVLSLEDGKKRFLDTVLAMNKAFSLC
ATLDEAQALQKEVAFWSQVKIAITKFTSVDKKLTEEDKNTALKQILDNALVAEGVTDVFALCGLDRPNIGLLSDEFLEDV
RQMPYKNFAVELLEKLLKDNIKARTRSNVVQEKKYADRLQATLRQYNNRGIETAQVMEELIAMAKQFQAELERDEALGLN
LDEVAFYDALANNESAVRELGDETLKKIAVEITDKLRKSTTVDWQVRESVRAKLRILVRRTLQRYQYPPDKAPEAVELIL
QQAEVLSDEWTK

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
api52	CAF28526.1	hsdr-like Type I restriction enzyme	Not tested	YAPI	Protein	0.0	69
hsdR	BAH57699.1	type I restriction-modification system endonuclease homologue	Not tested	Type-VII SCCmec	Protein	0.0	44
hsdR	YP_251977.1	type I restriction-modification system restriction subunit	Not tested	SCCmec	Protein	0.0	44
hsdR	BAD24840.1	type I restriction-modification system endonuclease homologue	Not tested	Type-V SCCmec	Protein	0.0	44