Gene Information

Name : AL1_19090 (AL1_19090)
Accession : YP_007817023.1
Strain : Alistipes shahii WAL 8301
Genome accession: NC_021030
Putative virulence/resistance : Unknown
Product : type I site-specific deoxyribonuclease, HsdR family
Function : -
COG functional category : -
COG ID : -
EC number : 3.1.21.3
Position : 2180181 - 2183222 bp
Length : 3042 bp
Strand : +
Note : -

DNA sequence :

ATGCACTTCACCGAAGATGATTTTGAAAACGCCATTCTCGAGTTGTTTCGAGAGCAATTAGGTTACGATTATGTGTACGG
CCCCAATGTGATACGCGACTATGCAGAACCGCTTTACGTGGAGGCGCTGGAGGCTGTGTTGCCGCAGATCAATCGTGGTC
TGCCACAGGCCGCTATTGACGAAGCCATGGTGAAGATTCGAACTTATGAGGGTGGAACGTTGGTACAGAAGAATGAATTG
TTCACGGATTACTTGCAAAATGGCGTAGCTGTCAATTATTTCGATGGCCGCGAGCAATGCTCTGCAAATGTCCGGCTTGT
CGATTATGATTCACCATTACATAATCGGTTTACAATCGCTAATCAATGGACGGTCGATGGGCACTCGGTAAGGCGTGCGG
ATATGATCGTATTTGTCAATGGATTGCCGCTGGTGGTGGTCGAGCTCAAATCGCCCTCGCGTGAGAATACGGACGTGTCG
GAAGCTTATGCACAATTGCGTAACTATATGCAGGAGATTCCGTCACTCTTTATCTATAACGCTTTTTGTGTGATGAGCGA
TCAGGGGATGACTAAGGCGGGGACGATCACGGCGGGTGAAGACCGTTTTATGCAGTGGAAGACGGTGGATGGGAGTTATG
AGGATACCCATAGCGCGAATTTCGATGTGCTTTTCGCGGGAATGTTCGAAAAAACGCGGTTTGTTGAATTGTTGCGGAAT
TTTATTTGCTACTCGAAAGACGGTAAACAGCGCGTTAAGATATTAAGTGCCTATCATCAGTTTTATGCCGTACGCAAGGC
TGTGCTTTCGACGGTCAAAGCAGCTGAGACGGATGGTCGGGGTGGCGTGTTTTGGCATACGCAGGGCAGCGGAAAGTCAT
TGTCGATGGTCTTTTTCGCCAAGCAGTTGCAGCAGGCGATGTCGTCGCCGACGATTGTCGTGCTGACAGACCGTAACGAT
TTGGACGGCCAGTTGTACCGGCAGTTCGCTTGTTGCAGGGATTTTTTGCGTCAGACACCCGTGCAAGCCGAAAGTCGGGC
TCATCTTCGGGAATTATTGGCGGGACGCGAAGCGAACGGTATCTTTTTCTCGACGATGCAGAAATTCGAGGAGAGCGAAG
AACCGCTTTCGATACGACGAAACATAGTCGTTATGGCCGACGAGGCGCATCGCAGTCAATATGGATTGGAGGAGAGGGTC
CGAATGGTTACGGATGCTGACGGGGTGATGCAGGCCAAAGTTGTAATCGGCGCGGCGCGTCTGGTGCGTAATGCGTTGCC
GAATGCTACCTATATCGGGTTTACCGGAACGCCTATTGCGCAAAAAGATCGGTCGACACGCGAAGTATTCGGCGATTACA
TCGACGTGTACGATATGACGCAGTCGGTGGATGACGGTGCGACACGGCCGGTATTTTACGAGAGCCGTGTAATCAATCTG
AAACTCGACGAGCAGACCTTGCGACGTATTGATGCGGAGTATGATGCGATGGCCGAGGAAGCGGAAGAGTATGTCATTGA
GAAAAGCAAGCGTGAATTGGGGCGGCTCGATTCGATCTTTGGAGCTGACGCGACGGTGGCATCATTGTGCGAGGACATCG
TAAAACACTATGAGGAATTCCGGCAATACGAGCAGACGGGTAAGGCGATGATAGTAGCCTATTCGCGGCCGATAGCGATC
AAGATTTACCGTCGGATTCTCGAAATGCGCCCGGTATGGGGTGACAAGCTGGCTGTTGTGATGACTTCCGGTAATAAAGA
TCCGGAAGACTGGCGGGCGATTATCGGAAATGATTCCCACAAGAAAGAGTTGGAGAAGAGGTTCAAAGACAACGACAGCT
CGTTGAAAATCGTCATCGTAGTTGATATGTGGCTTACGGGTTTCGACGTACCTTCGCTTTCGACGATGTATGTTTATAAA
CCGATGTCCGGACACAATCTAATGCAGGCTATTGCTCGTGTGAATCGTGTGTTCGGGGATAAACAAGGCGGTTTGGTTGT
GGATTATGTGGGTATCGCTTCGGCGTTGAAGACGGCGATGAACGATTATACATACCGTGACCGCAAAAATTATGGTGATA
CGGATGTGGCTAAAACCGCCTATCCGGAGTTTCAAAAGAAACTGGACGTTTGCCGTGATCTGATGTATGGATTCAATTAT
GGCGCTTTCTTCGGTAAGTCTGATTTGGAGCGGGCGAAAGCCATCAGCGGAGGTGTCGATTTCATGCAGTCCCCTGAGCG
GATGGAAACGAAAAAACTCTATATCAAAGAGGCGCTGCTGCTGCGGCAGGCATTGTCGCTTTGTCAGAGTTTGCTGAATT
ACGAGCAGCGTATCGAAGCTGCCTATTTTGAGGCGGTGCGCACATTACTGACGCGCGTGGAGGGCAAGGGTAAGATTTCG
TTCCGTGAGATCAACGGGCGTATTAATGAATTGCTCAAGCAGAGTATCAAGAGCGAAGGGGTAATTAATCTTTTCTCCGA
TATTAAGGAGGAGTTCTCTTTGTTCGATCCGAAATTCCTTGAAGAGGTTGCCCGGATGAAGGAACGGAATTTCGCCGTAG
AATTATTGCGTAGGTTGATTGCAGAACAGGTACAACTATATCAGCGAACGAATACGGTACGAGCCGAGAAGTTTTCGGAA
ATTCTGTCCGATGCCATGAGTCGCTATTTGAAAGGGATGCTGACGAACGAAGAGGTTATCGAAGAATTACTGAAAATAGC
CCGTGAGATCGTTTTCGGCGAAAAGGCCGGCGAGTCGCTTAATCTGAACAGCGAAGAACTTGCCTTTTATGATGCGTTGA
CCAAGCCTGAGGCTGTAAAAGATTTCTATTCCAACGATCAGTTGATCGCTATTACACGTGAGCTGACGGATGCACTCCGG
CGTAACAAAACGATCGACTGGAATATGAAGGAGAGTGCTCGTGCCGGAATGCGGCGTATTGTCAAACGGTTGTTGAAAAA
GTATGATTATCCGCCTGCAGGGCAGGAAGATGCTTTGAATACGATTATGGAGCAGTGTAAGAAGTGGAACGAAAATAATT
GA

Protein sequence :

MHFTEDDFENAILELFREQLGYDYVYGPNVIRDYAEPLYVEALEAVLPQINRGLPQAAIDEAMVKIRTYEGGTLVQKNEL
FTDYLQNGVAVNYFDGREQCSANVRLVDYDSPLHNRFTIANQWTVDGHSVRRADMIVFVNGLPLVVVELKSPSRENTDVS
EAYAQLRNYMQEIPSLFIYNAFCVMSDQGMTKAGTITAGEDRFMQWKTVDGSYEDTHSANFDVLFAGMFEKTRFVELLRN
FICYSKDGKQRVKILSAYHQFYAVRKAVLSTVKAAETDGRGGVFWHTQGSGKSLSMVFFAKQLQQAMSSPTIVVLTDRND
LDGQLYRQFACCRDFLRQTPVQAESRAHLRELLAGREANGIFFSTMQKFEESEEPLSIRRNIVVMADEAHRSQYGLEERV
RMVTDADGVMQAKVVIGAARLVRNALPNATYIGFTGTPIAQKDRSTREVFGDYIDVYDMTQSVDDGATRPVFYESRVINL
KLDEQTLRRIDAEYDAMAEEAEEYVIEKSKRELGRLDSIFGADATVASLCEDIVKHYEEFRQYEQTGKAMIVAYSRPIAI
KIYRRILEMRPVWGDKLAVVMTSGNKDPEDWRAIIGNDSHKKELEKRFKDNDSSLKIVIVVDMWLTGFDVPSLSTMYVYK
PMSGHNLMQAIARVNRVFGDKQGGLVVDYVGIASALKTAMNDYTYRDRKNYGDTDVAKTAYPEFQKKLDVCRDLMYGFNY
GAFFGKSDLERAKAISGGVDFMQSPERMETKKLYIKEALLLRQALSLCQSLLNYEQRIEAAYFEAVRTLLTRVEGKGKIS
FREINGRINELLKQSIKSEGVINLFSDIKEEFSLFDPKFLEEVARMKERNFAVELLRRLIAEQVQLYQRTNTVRAEKFSE
ILSDAMSRYLKGMLTNEEVIEELLKIAREIVFGEKAGESLNLNSEELAFYDALTKPEAVKDFYSNDQLIAITRELTDALR
RNKTIDWNMKESARAGMRRIVKRLLKKYDYPPAGQEDALNTIMEQCKKWNENN

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
hsdR	YP_251977.1	type I restriction-modification system restriction subunit	Not tested	SCCmec	Protein	0.0	42
hsdR	BAH57699.1	type I restriction-modification system endonuclease homologue	Not tested	Type-VII SCCmec	Protein	0.0	42
hsdR	BAD24840.1	type I restriction-modification system endonuclease homologue	Not tested	Type-V SCCmec	Protein	0.0	42