Gene Information

Name : R2APBS1_3887 (R2APBS1_3887)
Accession : YP_007592173.1
Strain : Rhodanobacter sp. 2APBS1
Genome accession: NC_020541
Putative virulence/resistance : Unknown
Product : type I site-specific deoxyribonuclease, HsdR family
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 4145366 - 4148581 bp
Length : 3216 bp
Strand : +
Note : PFAM: Domain of unknown function (DUF3387); Type I restriction enzyme R protein N terminus (HSDR_N); Type III restriction enzyme, res subunit; TIGRFAM: type I site-specific deoxyribonuclease, HsdR family

DNA sequence :

ATGACACCGATCCTGCTGGAGGACCACCTGGAACAGGCTGCGCTGCAGTGGCTGGCCGGCCTGGGTTGGGAGGTGGCGCA
CGGCCCGGATATTTCGCCGCCGGATGCGCACACGCCAGGCAGCGAGCGGGACAGTTACCGGCAGGTGGTACTGGAGCATC
GGCTGCGCGACGCGATCCGTCGACTGAATCCGCGGATTCCCGCCACGGCACAGGATGAGGCGCTGCGGATAGTGCTGAAC
CCCAACATCCCGGGCCCGTTGCAGGCGAACCGCCAACTGCATCGCTGGCTGACGGAAGGCGTGCCGGTGCAGTTCCAGCA
GGGCAACGAGACGCGTGGCGACCTCGTGCGGCTGGTCGATTTCGACGATGTACGCGGCAACGACTGGGTGGCGGTCAACC
AGTTTTCCATCCAGGGGCCGAAACGCACGCGGCGACCGGATCTGCTGCTGTTTCTAAACGGCCTGCCGATCGTACTGCTT
GAGCTGAAGAACCCGGGCGACGAGAACGCGGATATCTGGTCGGCGTTCAACCAGGTGCAGGCGTACCGGGAGGACATCCC
CGACCTGTTCATCTACAACACGCTGGTGGTGATCTCCGACGGTATTCGCGCGCGGATGGGCTCGCTCAGCGCCGAGCGCG
AACGCTACATGGCATGGCGCACGATCGACGGCGCGCAGACCGATCCGCTGGGCGAGATGCGCGAGTTGGAAACGCTGGTG
CATGGGGCATTCGACCGCGCGCTGCTGTTGGCATACCTGCGCAACTTCATCTTGTTCGAGGACGACGGTGCCCTGGTCAA
GAAGGTGGCCGGATATCACCAGTTCCATGCGGTACGCGCGGTGGTGGAAAGCGTACTGGCGGCATCGAAGCCGGGCGGGT
CGCGCAAGGGCGGCGTGGTGTGGCATACGCAGGGCGCGGGCAAGAGCATCGAGATGACCTGCTTGGCCGGCACCTTGATG
CAGCACCCGGCGATGGGCAACCCGACCATCGTGGTGGTGACCGACCGCAACGATCTGGACAACCAGTTGTTTGGCGTCTT
CGCTGGCGTTGCCGACCTGCTGCGCGAAACACCGGTGCAAGCCGATACGCGGCCACGTCTGCGCGAACTGCTGGGCAACC
GTCCGTCCGGCGGCATCATCTTCACCACGATCCAGAAATTCACGCCGGGCGAGGACGAGGATGTGTTTCCGGTGCTGTCC
GAGCGGCAGAACATCGTGGTCATCTGCGACGAGGCGCATCGCACGCAGTACGGCTTCGAGGCGAAGCTGACCGGCGATCT
CGCCAAGGCGAAGCCCGCGAAGATGGCGGCGGATGCGGCAGGCTCGGTGGCGATGGCGGCGCTGATGTCGCACGAGGCAT
CCGCCAGTTACGCGAGCAGCGTGCGCTACGGCTACGCCCAGCACCTGCGTGATGCGCTGCCAAACGCCACCTTTGTCGCG
TTCACCGGCACGCCGGTGTCGTTGACCGATCGCGACACGCGCGCCGTGTTCGGTGACTACGTGCATGTCTACGACATCGA
GCAGGCGGTGAAGGACGGTGCCACCGTACCGATCTACTACGAGTCACGACTGGCGAAGCTCGAACTGAGCGACGGCGACA
TCGACGCGCTCGACGAGGAAGTCGACGAGTTGAACGAGGGCGCGATCGACGATCCCTCGCATGCAGCGCGCATTCGCCGC
TGGGCTGCGCTGGAGAAGGTGGTGGGTGCCGCGCCGCGCATCCAGAAGGTGGCCAGCGACATTGTCGAGCATTTCGAGAA
TCGCCTGGCCGCGATGGACGGCAAGGCCATGATCGTGGCGATGAGTCGCGAGATCTGCGTGCACCTGTACGACGCCATCG
TGGCGTTGCGGCCTGAATGGCACGCCGCCGATCCCGAAAAGGGCGTGATCAAGATCGTGATGACCGGCTCGGCCGCCGAC
AAGCCGATGCTCAAGCCGCATGTGTATCCGAAGGAAACGCGCAAGCGGCTGGAGCGACGCTACAAGGACTCCGCGGACCC
GTTCAAGCTGGTGATCGTGCGCGACATGTGGCTGACCGGCTTCGATGCACCCTGCCTACACACCATGTACATCGACAAGC
CGATGCGCGGGCACAACCTGATGCAGGCGATCGCACGGGTGAACCGGGTGTTCAAAGACAAGCCCGGCGGCCTGGTGGTC
GACTACATCGGCATTGCCAACGAGTTGAAGCAGGCGCTGGCCGATTACACCCAGGCCAAGGGCAGAGGCAGCCCCACGAT
CGACGCCGAAGAGGCGCTGGAAGTGCTGGTGGAGCGGATGGAGCTGCTGCACGGCATGCTGCACGGCTACGACTATGCGG
CGTTCCGCGCTCAGGCCTGGGCGCTCCTGCCCGGCGCGGCAAACCACGTGTTGGGGCTGGATGACGGCAAGCAGCGTTTT
GCCGATCAGGTGTTGGCGGCCACCAAGGCGTTCGCACTGTGCTGCACGCTGGATGCGGCGCTGGCGTATCGTGATGAGCT
GGCGTTCCTGCAGGCGATCAAGTCGGCGATCACCAAGCATGCGACCACCGACAAGAAGCTCAGCGACGAGCAGAAGGAAC
ATGCACTGCGCCAGATCATCTCGCGCGCCGTGGTGTCCGATCAGGTCATCGACATCTTTGCCGCCGCCGGCCTGAAGCGA
CCGGATATCGGCGTGCTGTCGGAGGAGTTCCTGCAGGACATGCGCCATATGAAGGAACGCAACCTCGCAGTGGAGCTCCT
GGATCGGCTGCTGAAGGGCGAGATCAAATCGCGCTTCAAGACCAACGTGGTGCAGAGTGCGAAATTCTCGGAGCTGCTGC
AGGCATCGTTGACCCGCTACCGCAACCGTGCGATCGAAACGGCGCAGGTGATCGAAGAGCTGATCGCGATGGCGAAGAAG
TTCCAGCAAGCCGCCGAACACGGTGACGCGCTGGGACTCAATCGCGATGAGGTCGCCTTCTACGACGCACTAGCGAACAA
CGAATCCGCCGTGCGTGAGCTCGGCGACGAGACATTGCGCAAGATTGCGGTAGAGCTTACCCAGAAGCTACGCAACTCCG
TCACAGTGGATTGGGCGGTCCGTGACTCGGTACGCGCCAAGCTGCGGGTGATGGTGAAGACCTTGCTGCGCCGCTACAAG
TATCCGCCGGACAAGCAGGATGAGGCCGTGGAGATCGTATTGCGGCAAGCTGAGACTTTGACAAATACTTGGGCGGGTGC
GGAGCAGCTAGGTTGA

Protein sequence :

MTPILLEDHLEQAALQWLAGLGWEVAHGPDISPPDAHTPGSERDSYRQVVLEHRLRDAIRRLNPRIPATAQDEALRIVLN
PNIPGPLQANRQLHRWLTEGVPVQFQQGNETRGDLVRLVDFDDVRGNDWVAVNQFSIQGPKRTRRPDLLLFLNGLPIVLL
ELKNPGDENADIWSAFNQVQAYREDIPDLFIYNTLVVISDGIRARMGSLSAERERYMAWRTIDGAQTDPLGEMRELETLV
HGAFDRALLLAYLRNFILFEDDGALVKKVAGYHQFHAVRAVVESVLAASKPGGSRKGGVVWHTQGAGKSIEMTCLAGTLM
QHPAMGNPTIVVVTDRNDLDNQLFGVFAGVADLLRETPVQADTRPRLRELLGNRPSGGIIFTTIQKFTPGEDEDVFPVLS
ERQNIVVICDEAHRTQYGFEAKLTGDLAKAKPAKMAADAAGSVAMAALMSHEASASYASSVRYGYAQHLRDALPNATFVA
FTGTPVSLTDRDTRAVFGDYVHVYDIEQAVKDGATVPIYYESRLAKLELSDGDIDALDEEVDELNEGAIDDPSHAARIRR
WAALEKVVGAAPRIQKVASDIVEHFENRLAAMDGKAMIVAMSREICVHLYDAIVALRPEWHAADPEKGVIKIVMTGSAAD
KPMLKPHVYPKETRKRLERRYKDSADPFKLVIVRDMWLTGFDAPCLHTMYIDKPMRGHNLMQAIARVNRVFKDKPGGLVV
DYIGIANELKQALADYTQAKGRGSPTIDAEEALEVLVERMELLHGMLHGYDYAAFRAQAWALLPGAANHVLGLDDGKQRF
ADQVLAATKAFALCCTLDAALAYRDELAFLQAIKSAITKHATTDKKLSDEQKEHALRQIISRAVVSDQVIDIFAAAGLKR
PDIGVLSEEFLQDMRHMKERNLAVELLDRLLKGEIKSRFKTNVVQSAKFSELLQASLTRYRNRAIETAQVIEELIAMAKK
FQQAAEHGDALGLNRDEVAFYDALANNESAVRELGDETLRKIAVELTQKLRNSVTVDWAVRDSVRAKLRVMVKTLLRRYK
YPPDKQDEAVEIVLRQAETLTNTWAGAEQLG

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
api52	CAF28526.1	hsdr-like Type I restriction enzyme	Not tested	YAPI	Protein	0.0	56
hsdR	BAH57699.1	type I restriction-modification system endonuclease homologue	Not tested	Type-VII SCCmec	Protein	0.0	46
hsdR	YP_251977.1	type I restriction-modification system restriction subunit	Not tested	SCCmec	Protein	0.0	45
hsdR	BAD24840.1	type I restriction-modification system endonuclease homologue	Not tested	Type-V SCCmec	Protein	0.0	45