Gene Information

Name : Caur_1816 (Caur_1816)
Accession : YP_001635422.1
Strain : Chloroflexus aurantiacus J-10-fl
Genome accession: NC_010175
Putative virulence/resistance : Unknown
Product : HsdR family type I site-specific deoxyribonuclease
Function : -
COG functional category : V : Defense mechanisms
COG ID : COG0610
EC number : -
Position : 2497678 - 2500812 bp
Length : 3135 bp
Strand : +
Note : KEGG: rrs:RoseRS_0281 type I site-specific deoxyribonuclease, HsdR family; TIGRFAM: type I site-specific deoxyribonuclease, HsdR family; PFAM: type III restriction protein res subunit; protein of unknown function DUF450; SMART: DEAD-like helicases

DNA sequence :

ATGGCGCATTTGACCGAATCAAACATCGAGACCGTCGCCCTTGACTGGTTGAAATCGCTGGGTTGGCAGGTCGCGCACGG
TCCTGGTATCGCTCCTGGCATGTCGGCAGCCGAACGTCAAAACTACGGCGAGGTCGTGCTCGAGCAGCGCCTGCGCGACG
CTCTTGCACGTCTCAACCCCGACCTGCCAACCGAGGCGCTGGACGACGCCTTCCGCAAACTGACTCAACCCGAAGGGGCT
GATCTTCTCCAGCGCAACCGCGTCGTTCACCTCATGCTGGCGAACGGCGTGACGGTGGAATACCGTCATCCCGACGGCGG
TATTCGCGGCACACAGGTGCGTGTGATAGATTTCGACGACCCCGCCAACAACAACTGGCTGGCGGTGAACCAGTTTAGCA
TTGAGGAGAACAAGCACAACCGCCGCGCCGACGTGGTGCTGTTCGTCAACGGTCTGCCCCTCGCGATCATCGAACTCAAA
AACGCAGCCGACGAGCACGCAACCATCTGGAGTGCATTCCAGCAATTGCAAACCTACCAGGTAGAGATCCCATCCTTGTT
TGTCTTCAACGAGACGTTAGTTATCTCTGATGGTCTCGAAGCGCGCATTGGCACACTGGGTGCTGGTCGCGAGTGGTTTA
AACCCTGGCGCACCATCTCCGGCATGCAGGTAGAGGATGTTGGTGTACCACAGCTAGAGGTTGTGCTCAAGGGTGTGTTC
GAGAAAAATCGCTTTCTTACTCTCATACGTGACTTTATCGTGTTTGAGGACGATGGTAGTGGACGGTTAGTGAAGAAGAT
GGCTGGTTACCACCAGTTTCATGCTGTACTGGTAGCGGTGAAGGAAACCCTACGCGCCAGCGCAGTTGTTTCATCCAACC
GTATGGCGGAGTCGGGTGGCGTCTATGAAGCAGGACGCGAACCTGGCGGTAAGCCTGGTGATCGACGTATCGGTGTTGTC
TGGCACACGCAAGGTTCGGGAAAGAGCCTGACGATGGTGTTCTACGCGGGGTGCATCATTCGCAAACCAGCTATGGAGAA
CCCTACCATCGTTGTGCTTACCGACCGTAATGATCTTGACGACCAGCTCTTCAACACCTTCTCACGCTGTCAGGATTTAC
TGCGCCAGCCGCCCGTGCAAGCTGAAAGTCGTGTACACCTACGCCAGCTCCTAAGCGTGCAGTCAGGCGGTATCGTTTTT
ACCACTATTCAGAAATTTCTACCCGAAGAGAAGGGCGACCGTCATCCAGTATTGTCCAACCGTCGGAACATCGTCGTGAT
CACTGACGAGGCACACCGCAGCCAGTACGACTTCATTGACGGTTTTGCCCGCCATATGCGCGATGCACTACCTCAGGCAT
CCTTTATTGGTTTCACTGGCACGCCGATTGAGAAGGCGGATGCCGATACACGAGCAGTTTTTGGAGATTACATCTCAATC
TATGATATTCAGCGTGCGGTGGAAGATGGTGCGACCGTATCGATTTATTATGAGGCACGGCTAGCAAAACTCGATCTTCC
TGACGAACTCAAGCCAAAGATTGACGATGAGTTTGAGGAGATTACAGAAGGTGAGGAAGTTGAGCGTAAAGAAAAGCTCA
AAACCAAATGGGCGCAGCTTGAATCCATTGTCGGCACTGAACAACGGCTGAGACTGATTGCCAACGATATTATCGAGCAT
TTTGAGCGGAGACTGGAGGCAATCGAAGGTAAAGGCATGGTTGTCTGCATGAGCCGGCGCATCTGTGTTGAGCTGTATAA
CATCATTTGCACTCTTCGTCCCAACTGGCATCACGAAGACGACGACAAAGGTGTAATAAAGGTAGTGATGACCGGTTCTG
CCTCCGACCCGGTAGACTGGCAGCCGCATATTCGCAATAAACAACGCCGCGAACTGCTGGCGAAGCGCTTTCGTGATCCG
AACGATCCGCTTAAATTGGTCATCGTGCGTGATATGTGGCTCACCGGATTTGATTGTCCGAGTCTACACACGATGTACCT
GGACAAGCCGATGCGCGGCCACGGGTTAATGCAGGCAATTGCCAGGGTCAATCGCGTCTTTCGCGATAAGCCGGGTGGTC
TGGTGGTGGACTATCTGGGCCTTGCCCACGAATTGAAGGCTGCACTGGCGGTTTACACTGAAAGCGGTGGTACTGGTAAA
ACCACTATTGACCAGGAAGAGACTGTTGCGTTGATGCAAGAGAAGTACGAAATCTGCTGTGGAATCCTGCACGGCTTCGA
TTGGTCGGATTGGGCAAGTGGTGATGCACATGCACGCATTGGACTTTTACCTGCAGCTCAAGAACACGTGCTGGCACGCG
TGAAAGGAAAGGAACGATTTGTTCAGGCGGTGCGTGATTTGACAAAAGCCTTTGCCCTTGCAGTGCCGCATGAAAAAGCG
CTTGAGATTCGTGATGATGTGGCATTTTTTCAGGCGCTCTCTGCGGCGCTGACCAAACGCGCACCCGGCGATGTAAGAAC
TGAAGAGCAGCTAGATCATGCCATTCGGAGGATTATTGCGCAGGTAATTGCGCCTGAAGGCGTGGAGGATATTTTTGCTG
CGGCAGGGCTGAAAAAGCCGGATATCTCCATCCTCTCCGATGAATTCCTGGCTGAAGTGCGTGGTATGCCGCACAAGAAT
CTGGCAGTTGAAGTTCTTCAGAAACTGCTTAACGGTGAAATTAAGAGGCGTAGCCACAAAAATATCGTTCAGGCACGCTC
ATTCGCTGAACTGTTACAGCAAGCCCTTCACCGTTACCAGAATCGTGCAATCGAAGCAGCACAGGTGATCGAAGAATTGA
TAACTTTGGCGAAGGAAATGCGTGAAGCCGACCGGCGGGGTGAAGTATTGGGCCTTTCGGAGGAGGAGCTGGCGTTTTAC
GATGCGCTTGAAACAAATGATAGTGCTGTGGCTGTGTTGGGTGATCAGACTCTACGCACCATTGCCCGTGAACTCGTCGA
GACCGTGCGTAACAGTATCAGTATTGATTGGGCACAGCGGGAAGATGTACGGGCGAATCTACGCAGATTGGTTAAGCGCA
TTCTTCGCAAGCACGGCTATCCACCAGACAAGCAGGAGAAAGCTACGCAGACTGTATTGGAACAGGCGGAAGTGCTTTCA
GCAGAATGGGCCTAA

Protein sequence :

MAHLTESNIETVALDWLKSLGWQVAHGPGIAPGMSAAERQNYGEVVLEQRLRDALARLNPDLPTEALDDAFRKLTQPEGA
DLLQRNRVVHLMLANGVTVEYRHPDGGIRGTQVRVIDFDDPANNNWLAVNQFSIEENKHNRRADVVLFVNGLPLAIIELK
NAADEHATIWSAFQQLQTYQVEIPSLFVFNETLVISDGLEARIGTLGAGREWFKPWRTISGMQVEDVGVPQLEVVLKGVF
EKNRFLTLIRDFIVFEDDGSGRLVKKMAGYHQFHAVLVAVKETLRASAVVSSNRMAESGGVYEAGREPGGKPGDRRIGVV
WHTQGSGKSLTMVFYAGCIIRKPAMENPTIVVLTDRNDLDDQLFNTFSRCQDLLRQPPVQAESRVHLRQLLSVQSGGIVF
TTIQKFLPEEKGDRHPVLSNRRNIVVITDEAHRSQYDFIDGFARHMRDALPQASFIGFTGTPIEKADADTRAVFGDYISI
YDIQRAVEDGATVSIYYEARLAKLDLPDELKPKIDDEFEEITEGEEVERKEKLKTKWAQLESIVGTEQRLRLIANDIIEH
FERRLEAIEGKGMVVCMSRRICVELYNIICTLRPNWHHEDDDKGVIKVVMTGSASDPVDWQPHIRNKQRRELLAKRFRDP
NDPLKLVIVRDMWLTGFDCPSLHTMYLDKPMRGHGLMQAIARVNRVFRDKPGGLVVDYLGLAHELKAALAVYTESGGTGK
TTIDQEETVALMQEKYEICCGILHGFDWSDWASGDAHARIGLLPAAQEHVLARVKGKERFVQAVRDLTKAFALAVPHEKA
LEIRDDVAFFQALSAALTKRAPGDVRTEEQLDHAIRRIIAQVIAPEGVEDIFAAAGLKKPDISILSDEFLAEVRGMPHKN
LAVEVLQKLLNGEIKRRSHKNIVQARSFAELLQQALHRYQNRAIEAAQVIEELITLAKEMREADRRGEVLGLSEEELAFY
DALETNDSAVAVLGDQTLRTIARELVETVRNSISIDWAQREDVRANLRRLVKRILRKHGYPPDKQEKATQTVLEQAEVLS
AEWA

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
api52	CAF28526.1	hsdr-like Type I restriction enzyme	Not tested	YAPI	Protein	0.0	50
hsdR	BAD24840.1	type I restriction-modification system endonuclease homologue	Not tested	Type-V SCCmec	Protein	0.0	45
hsdR	BAH57699.1	type I restriction-modification system endonuclease homologue	Not tested	Type-VII SCCmec	Protein	0.0	45
hsdR	YP_251977.1	type I restriction-modification system restriction subunit	Not tested	SCCmec	Protein	0.0	45