Gene Information

Name : G432_08520 (G432_08520)
Accession : YP_007616025.1
Strain : Sphingomonas sp. MM-1
Genome accession: NC_020561
Putative virulence/resistance : Unknown
Product : HsdR family type I site-specific deoxyribonuclease
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 1753872 - 1757054 bp
Length : 3183 bp
Strand : +
Note : COG0610 Type I site-specific restriction-modification system, R (restriction) subunit and related helicases

DNA sequence :

ATGGCCTTTTTGTCCGAAGCCCAAGTCGAACAAACCTTGCTAGAGCAACTGCGCGGGCTGGGCTACGTGGTTGCATCTGA
TGAGGTCATCAGCCCTGACGGCAGCGCGCCAGAACGCGAAAGCCACGATGTCGTATTGCTGCATCAGCGGCTGGCAGATG
CCGTTCTGCGGCTCAACCCGCACCTGCCGCTGGAGGCGCGGGCGGATGCCATTCGCAAGCTCACCCAATCCGTATTCCCC
GGTTTGCTGGAAGAAAACCGTCGCATCCACACACTGCTGACCGAGGGCGTGGACGTGGAATACTACGGCGATGATGGGGT
ACTGACGGCAGGCAAGGTGGCGTTGCTGGATTTCGACTCGCCTGCGCACAACGACTGGCTGGCCGTGCAGCAGTTCGTGG
TCATCCACGGCCAGGTCAAGCGCAGGCCGGACGTAGTGCTGTTCGTCAACGGTTTACCGCTTGCAGTGATCGAGCTGAAG
GCGCCAGGTAGCGCAGGCGCGCATCTGGCGGGTGCATTTAACCAGTTGCAGACTTACAAGCAGCAGATTCCGGCGCTGTT
TCACACCAACGCGCTGCTGGTCACTTCTGATGGCATCGCGGCGCGCGTGGGGTCGCTGTCCGCCGATCTGGAACGGTTCA
TGCCGTGGCGCACCACGGATGGCAGGGCTATTCTGGAAAAAGGCTCGCCGGAACTTCCGACGCTAATCGAGGGCGTATTC
GAGAAGCAGCGGTTCCTCGATCTGCTGCGCCATTTCACCGTGTTCGGCGAGACCGGCAGCGGCTTGGCGAAGATCGTGGC
GGGCTATCACCAGTACCACGCAGTCAACCGCGCCATCGAGTCCACGATTCGCGCTTCCGACTCATGGCACGGCGTAGCCG
AGGAACCAGCGTCTTACGGGCTACCCAGCGTGGCGACGCAATCCCTGGGCGACAGACGCGCGGGGGTGATCTGGCATACG
CAAGGTTCCGGCAAGAGTTTGCTGATGGCCTTCTACGCCGGGCGACTGGTGAAACACCCAGCGATGGAGAACCCGACGCT
TGTCGTGCTTACCGATCGCAATGACCTAGACGATCAGTTGTTCGCCACCTTCTCGATGTGCCGTGACTTGATCCGCCAGA
CACCGGTGCAGGCCGAAAGCCGCGAGCATTTACAGCAATTGCTTGCCAGAGCTTCGGGTGGCGTGATCTTCACCACCTTG
CAGAAATTTGGAGAGGTAAACGCGCCGCTGACTACACGCCGCAACGTAGTGGTCATTGCTGATGAAGCGCACCGTTCGCA
ATACGGCTTTCGTGCCAAAGTGGATGCCAAGACTGGCGAGGTCTCCTACGGATTCGCCAAATACTTGCGCGACGCGCTGC
CCAATGCCTCTTTCATCGGTTTCACGGGTACGCCTATCGAGGCGACGGACGTGAACACTCCGGCCGTGTTCGGTAATTAC
ATTGATATCTACGACATCAGCCGCGCGGTGGAGGACGGCGCGACGGTGCCGATCTACTACGAATCGCGTCTGGCGCGCAT
TGAACTGGACGAGGACGAGAAGCCTAAGCTCGATGCTGAGGTGGAAGCGCTGACTGAGGACGAGGCGGTTACCGAACAGG
AAAAGCTGAAGGCGAAATGGGCGACAGTCGAACAACTGGTCGGTAGCGAAAAACGCGTCGCGCTGGTGGCGAAGGACTTG
GTGGCGCACTTCGAGGATAGGCTATCCGCGCTGGATGGCAAGGCGATGGTGGTGTGCATGAGCCGCCGCATCTGCGTGGC
GCTGTATGACGAGATCGTCAAGTTGCGCCCGGACTGGCACAGCACCGATGACAATGCCGGAGCCATCAAAATCGTGATGA
CGGGCGCAGCCAGCGACCCACCCGAATGGCAGCAGCATATCGGCAACAAGGCGCGACGCGACCTGCTCGCCAAGCGCGCC
CGCGACGCCAAAGATCCGCTCAAGTTGGTCATCGTGCGCGATATGTGGCTGACCGGCTTCGACGCGCCGTGCATGCACAC
GATGTACGTGGACAAGCCGATGCAGGGACACGGGCTGATGCAGGCCATTGCCCGCGTCAACCGTGTGTTCCGCGACAAGC
CTGCTGGCCTGATCGTGGACTATATCGGCATTGCTCAGAGCTTGAAGTCGGCGCTGGCGCAGTATTCGGCGCGCGACCAG
GAAGCAACTGGCGTCGATGAAGCGCAGGCTGTGGCCGTGCTGTTGGAGAAGTACGAAGTGGTGCGTGACATGTACCACGG
CTTCGATTACGTCACGGCATTGAACGGCACTCCGCAGCAACGACTGGCGATGATGGCCGGAGCCATCGAGTGGATTCTCG
ACAGGCAACAACAATGGACAGCGGCGGAGACCACCGAGGAAGGGAAGAAGAACGCTCAGCGGCGTTATCAGGACTCGGTG
CTGGCCTTATCGAAGGCGTATTCGCTGGCGTCGGCCTCTGACGAGGCGCGCGGCATCCGCGAGGAAGTCGGCTTCTTCCA
AGCTATTCGCGCCGCGCTGGTCAAGTCAAGCACTGGCTCCGGCGTGACCTCGCAGGAGCGCGACTTCGCCATCCAACAGA
TCGTCAGCCGTGCGGTGGTCAGCACCGAGATCGTGGACATCCTGAAAGCGGCAGGCATCCAGTCGCCGGACATTTCCATC
CTGTCCGACGAGTTTCTTGCCGAAGTGCAGCAGATGCAGAAGAAGAACCTTGCGCTGGAAGCCCTGCGCAAGCTCATCAA
CGATGGCATCCGTTCGCGCAGCAAGGCCAACATCGTCGAAACGCGGACGTTCTCGGAACGGTTGGAGCAGGCCGTCGCGC
GTTATCACGCTAACGCCATCACTACTGCCGAGGTGTTGCAGCAGCTCATCCAGTTGGCGAAGGACATTCGAGCGGCGCGA
CAGCGTGGGGAGGAGTCCGGCCTCAGTGACGAAGAAATTGCCTTTTATGACGCGCTGGCTGAAAACGAATCGGCAGTGCA
AATAATTGGCGATGACAATCTCAAGGTGATCGCCCATGAATTGCTGGTCAGTCTGAAAAGCAATGTCTCGGTTGACTGGG
CACATCGCGATTCGGCGCGTGCCCGGATGCGCGTGCTGGTCAAGCGTATCCTGCGCAAGTACGGCTATCCGCCTGATTTG
CAGGACGCCGCCGTCCAGACAGTGTTGCAGCAGGCGGAAGCACTGTCAGCCGGGTGGGCTTAA

Protein sequence :

MAFLSEAQVEQTLLEQLRGLGYVVASDEVISPDGSAPERESHDVVLLHQRLADAVLRLNPHLPLEARADAIRKLTQSVFP
GLLEENRRIHTLLTEGVDVEYYGDDGVLTAGKVALLDFDSPAHNDWLAVQQFVVIHGQVKRRPDVVLFVNGLPLAVIELK
APGSAGAHLAGAFNQLQTYKQQIPALFHTNALLVTSDGIAARVGSLSADLERFMPWRTTDGRAILEKGSPELPTLIEGVF
EKQRFLDLLRHFTVFGETGSGLAKIVAGYHQYHAVNRAIESTIRASDSWHGVAEEPASYGLPSVATQSLGDRRAGVIWHT
QGSGKSLLMAFYAGRLVKHPAMENPTLVVLTDRNDLDDQLFATFSMCRDLIRQTPVQAESREHLQQLLARASGGVIFTTL
QKFGEVNAPLTTRRNVVVIADEAHRSQYGFRAKVDAKTGEVSYGFAKYLRDALPNASFIGFTGTPIEATDVNTPAVFGNY
IDIYDISRAVEDGATVPIYYESRLARIELDEDEKPKLDAEVEALTEDEAVTEQEKLKAKWATVEQLVGSEKRVALVAKDL
VAHFEDRLSALDGKAMVVCMSRRICVALYDEIVKLRPDWHSTDDNAGAIKIVMTGAASDPPEWQQHIGNKARRDLLAKRA
RDAKDPLKLVIVRDMWLTGFDAPCMHTMYVDKPMQGHGLMQAIARVNRVFRDKPAGLIVDYIGIAQSLKSALAQYSARDQ
EATGVDEAQAVAVLLEKYEVVRDMYHGFDYVTALNGTPQQRLAMMAGAIEWILDRQQQWTAAETTEEGKKNAQRRYQDSV
LALSKAYSLASASDEARGIREEVGFFQAIRAALVKSSTGSGVTSQERDFAIQQIVSRAVVSTEIVDILKAAGIQSPDISI
LSDEFLAEVQQMQKKNLALEALRKLINDGIRSRSKANIVETRTFSERLEQAVARYHANAITTAEVLQQLIQLAKDIRAAR
QRGEESGLSDEEIAFYDALAENESAVQIIGDDNLKVIAHELLVSLKSNVSVDWAHRDSARARMRVLVKRILRKYGYPPDL
QDAAVQTVLQQAEALSAGWA

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
api52	CAF28526.1	hsdr-like Type I restriction enzyme	Not tested	YAPI	Protein	0.0	48
hsdR	YP_251977.1	type I restriction-modification system restriction subunit	Not tested	SCCmec	Protein	0.0	47
hsdR	BAD24840.1	type I restriction-modification system endonuclease homologue	Not tested	Type-V SCCmec	Protein	0.0	47
hsdR	BAH57699.1	type I restriction-modification system endonuclease homologue	Not tested	Type-VII SCCmec	Protein	0.0	47