Gene Information

Name : Noc_1804 (Noc_1804)
Accession : YP_343804.1
Strain : Nitrosococcus oceani ATCC 19707
Genome accession: NC_007484
Putative virulence/resistance : Unknown
Product : type I topoisomerase
Function : -
COG functional category : V : Defense mechanisms
COG ID : COG0610
EC number : 3.1.21.3
Position : 2039740 - 2042946 bp
Length : 3207 bp
Strand : -
Note : -

DNA sequence :

ATGACCGAAGAGCAACTGGAACAACAATGCCTGGCCTGGTTTGCCGAGGGCGGTTGGGAACTGGCCCACGGCTCCGATCT
GGCGCCTGGGCGTGCTGATTACCGCCAAGTATGGTTACTGGCCGATCTGGAAGCGGCCATTCGCCGCATCAACCCCCACT
TGCCGGAAAGCTGTATCGAGCAGGTAGTGGCGGTGGTTGGTAAGCCCGAAAGCCTGGATACCGTGGTCAGCAATCGAGCC
TTTCACCGGTTACTGCTGGAAGGGGTGCCGGTTGAATACAAGACCCTATCCTCCCTCTCCCCCTGGGAGAGGGCCGGGGT
GAGGGAAAGGGAAGAGAAAATAGTCCACGACCGGGCGTTGCTGATCGATTTCGATGATCTGAACGCCAACCGCTTCCGGG
CCATCAATCAGTTCACCCTCTTGGGGAGCAAGCAACTGCGCCGCCCGGATATTATTTGCTTTATCAATGGCCTGCCCTTG
GCGGTGCTGGAGCTGAAAAGCCCCCATGCCGAGAATGTGGACATCTGGGATGCCTTCCATCAGCTTCAGACTTACAAGGA
CGAAATCCCCGAGCTGTTCGTCTTTAACGAGGCGCTGGTAATCAGCGACGGCTACCATGCCCGGGTGGGTTCGCTTACGG
CCAACCAGGAGCGCTTTATGCCCTGGCGCACTCTCAAGCACGAGGACGACAAGCCCCTGCTGGACTGGCAGTTGGAAACC
CTGGTGCGGGGTTTCTTCGATCGGGAATTGTTCCTGGATTACCTTCGTTATTTCGTCATTTTCGAGACGGATTCCGGTCG
CCTGAGCAAGAAGATTGCCGGTTATCACCAGTTCCACGCGGTGCGGGAAGCGGTGAAGGCCACCGTGATTGCCGCCCAGG
AGCCCAGGCAGCGCTGGGCCGGTGAAAAGCGCGCCACCTACGCCGATGACCTGGTGCCGGGCAGCAAAAAGGCCGGCGTG
GTCTGGCACACCCAGGGGTCCGGCAAGAGTCTTTCCATGTGCTGCTACGCGGGCAAGCTGCTGCAACAGCCCGAGATGAA
CAACCCGACCCTGATGGTGGTCACCGACCGCAACGATCTGGACGGCCAACTCTTCGCCACCTTCAGCGCCGCCAAGGAAC
TGCTGAAGCAGGAACCGGTGCAGGCGGAAGACCGGGATACCCTGCGCCGCTTGCTGGCCGAGCGGGCATCCGGTGGCATT
ATCTTCACCACGGTGCAGAAATTCGCCCTGCTGGATGGGGAGAACGATCATCCCATTCTCAACGACCGCCATAATATCGT
GGTGATTTCCGACGAGGCTCACCGCAGTCAGTACGGCCTTAAGGCCACCCTGAAGAAGGATGGCCGCTACACCTTCGGCT
ACGCCAAGCACATGCGCGATGCCCTGCCCAATGCCTCCTTTATCGGTTTTACCGGTACCCCCATTGCCAATGAAGATAAG
GATACCCGCGCCGTGTTCGGCGATTATGTGTCCATCTATGACATTCAGGATGCGGTGGACGATGGGGCTACCGTGCCCAT
CTATTACGAATCCCGGCTGGCCAAATTGGATATCAACCGGGAGCTGATTGAGAAATTATCCGACCAAGTGGAAGCAGTGG
TGGAGGATGAGGAAGACCTCGGCCAGCGGGAAAAAACCAAGGGCGAGTGGAGCCGCCTGGAAAAGCTGGTGGGGTCTGGG
CCGCGGCTTAAGCAGGTGGCTGCCGATCTGGTGCGGCACTTTGAAATCCGCTCTCAGTCCATGGACGGTAAAGCCATGAT
CGTGGCCATGAGCCGGGAGATTTGCGTGCATCTGTATAATGAGATTGTCGCCCTGCGCCCGGACTGGCACGACCCGGACC
CGGAGAAAGGGGCCATCAAGATTGTGATGACTGGCTCCGCCTCTGACAGGCCCTTGTTGCAACCGCACCTTTACAACCAG
CAGACCAAGAAACGACTGGAGAAGCGCTTCAAGGACATCTATGATCCCCTCAAGCTGGTGATTGTGCGGGATATGTGGCT
CACCGGCTTTGACGCCCCTTGCTGCCATACCATGTATGTGGACAAGCCCATGAAAGGCCATAACCTGATGCAGGCCATTG
CCCGCGTCAACCGGGTGTTCAAGAACAAGCCCGGCGGGCTGGTGGTGGACTATATCGGTATCGCCAATGCGCTCAAGCAA
GCCCTGAAAACCTATACCGACGCCAAGGGCAAGGGCGAGCCGACCCACAGCGCGGAAGAAGCCTTTGCCGTGCTGCTGGA
GAAGCTGGACATTATCCACGGGCTGTTTGCCAAGACACCCCAAAATGCTGGCTTTGATTACAGCAGCTTTGAGCATGAGG
CGACCCGATTGCTGATTCCCACCGCCAACTATATATTGAGCCTTGAGGGCGGTAAGAAGCGTTTCCTCGATACGATTCTT
GCTGTGAATATGGCCTACTCTTTGTGTGGCACCCTGGAGGAGGCCCGGGCCTATCATAAGGAGGTCGCTTTCCTATCGGC
GGTGAAGGCTGCCCTTACCAAGCACACCCGCGTGGACAAGAAATTGACCCAGGAGGAAAAAAATTCCGCCCTCAAGCAGA
TCCTGGACAATGCCCTGGTGGCGGAAGGCGTGACCGACGTGTTTGCGTTGTGCGGATTAGATAAACCTAACATCGGCCTG
CTCTCGGAGGAATTCCTCGAAGACGTGCGGCGGATGCCTTACAAGAATTTCGCCGTGGAGCTACTGGAAAAGCTGCTGAA
AGACAACATCAAGGCCAAAACCCGCAATAACGTGGTGCAGGAGAAGAAATACGCTGATCGGCTGCAAGAGACCCTGCGCC
AATACAACAACCGGGGCATTGAAACCGCCCAGGTGATAGAAGAGCTGATCGCCATGGCCAAGCAATTCCAGGCGGAACTG
GAGCGCGACGAAGCCCTGGGCCTGAACCCGGATGAAGTAGCCTTCTACGATGCCCTGGCCAACAATGAGAGTGCGGTGCG
GGAGTTGGGTGATGAGACGCTGAAGAAAATCGCCGTGGAAATCACTGACAAGCTGCGCAGGTCCACTACCGTGGACTGGC
AGGTGCGGGAAAGCATCAGGGCAAAATTGCGGATTCTGGTGCGCCGAACGTTGCAACGGTACAAATATCCGCCGGACAAG
GCCCCGGAAGCGGTAGAGCTGATTTTGCAGCAAGCCGAGGTACTATCGGATGAAAAGCGCAACGCGCTAACAAGAAAAAA
CGGGTAA

Protein sequence :

MTEEQLEQQCLAWFAEGGWELAHGSDLAPGRADYRQVWLLADLEAAIRRINPHLPESCIEQVVAVVGKPESLDTVVSNRA
FHRLLLEGVPVEYKTLSSLSPWERAGVREREEKIVHDRALLIDFDDLNANRFRAINQFTLLGSKQLRRPDIICFINGLPL
AVLELKSPHAENVDIWDAFHQLQTYKDEIPELFVFNEALVISDGYHARVGSLTANQERFMPWRTLKHEDDKPLLDWQLET
LVRGFFDRELFLDYLRYFVIFETDSGRLSKKIAGYHQFHAVREAVKATVIAAQEPRQRWAGEKRATYADDLVPGSKKAGV
VWHTQGSGKSLSMCCYAGKLLQQPEMNNPTLMVVTDRNDLDGQLFATFSAAKELLKQEPVQAEDRDTLRRLLAERASGGI
IFTTVQKFALLDGENDHPILNDRHNIVVISDEAHRSQYGLKATLKKDGRYTFGYAKHMRDALPNASFIGFTGTPIANEDK
DTRAVFGDYVSIYDIQDAVDDGATVPIYYESRLAKLDINRELIEKLSDQVEAVVEDEEDLGQREKTKGEWSRLEKLVGSG
PRLKQVAADLVRHFEIRSQSMDGKAMIVAMSREICVHLYNEIVALRPDWHDPDPEKGAIKIVMTGSASDRPLLQPHLYNQ
QTKKRLEKRFKDIYDPLKLVIVRDMWLTGFDAPCCHTMYVDKPMKGHNLMQAIARVNRVFKNKPGGLVVDYIGIANALKQ
ALKTYTDAKGKGEPTHSAEEAFAVLLEKLDIIHGLFAKTPQNAGFDYSSFEHEATRLLIPTANYILSLEGGKKRFLDTIL
AVNMAYSLCGTLEEARAYHKEVAFLSAVKAALTKHTRVDKKLTQEEKNSALKQILDNALVAEGVTDVFALCGLDKPNIGL
LSEEFLEDVRRMPYKNFAVELLEKLLKDNIKAKTRNNVVQEKKYADRLQETLRQYNNRGIETAQVIEELIAMAKQFQAEL
ERDEALGLNPDEVAFYDALANNESAVRELGDETLKKIAVEITDKLRRSTTVDWQVRESIRAKLRILVRRTLQRYKYPPDK
APEAVELILQQAEVLSDEKRNALTRKNG

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
api52	CAF28526.1	hsdr-like Type I restriction enzyme	Not tested	YAPI	Protein	0.0	70
hsdR	BAD24840.1	type I restriction-modification system endonuclease homologue	Not tested	Type-V SCCmec	Protein	0.0	44
hsdR	BAH57699.1	type I restriction-modification system endonuclease homologue	Not tested	Type-VII SCCmec	Protein	0.0	44
hsdR	YP_251977.1	type I restriction-modification system restriction subunit	Not tested	SCCmec	Protein	0.0	43