Gene Information

Name : CAP2UW1_1871 (CAP2UW1_1871)
Accession : YP_003167098.1
Strain : Candidatus Accumulibacter phosphatis UW-1
Genome accession: NC_013194
Putative virulence/resistance : Unknown
Product : HsdR family type I site-specific deoxyribonuclease
Function : -
COG functional category : V : Defense mechanisms
COG ID : COG0610
EC number : -
Position : 2108373 - 2111531 bp
Length : 3159 bp
Strand : -
Note : KEGG: bxe:Bxe_A0222 type I site-specific deoxyribonuclease HsdR; TIGRFAM: type I site-specific deoxyribonuclease, HsdR family; PFAM: type III restriction protein res subunit; protein of unknown function DUF450; SMART: DEAD-like helicases

DNA sequence :

ATGACCGAAGATCACCTCGAACAAGAAGCGCTCGGCTGGCTGACCGAAGTCGGCTACGACACCCTTTACGGCCCTGACAT
CGCCCCCGACGGCGCCAACCCGGAGCGCGCTGGCTACCAGCAGGTGCTGCTGCCGTTCCGGTTGCGCGAGGCGATTCACC
GCCTGAACCCCTCCATCCCTCTCGCCGCCCGCGAGGATGCACTCAAGCAAGTGCTCGACCTCGGCATCCCGGCCTTGCTG
TCGGCCAACCGCCACTTTCACAAGCTGCTGGTCGGCGGCGTACCGGTGCAATACCAGAAGGACGGCGAAACCCGGGGTGA
CCTGGTCCGCCTGATCGACTGGACCAACCCCGCCAAGAACAAGTGGCTGGCGATCAACCAACACTCGATCAAGGGGCCGC
ACCACACCCGCCGGCCGGACATCATCCTGTTCATCAACGGGCTGCCCCTGGTGTTGATCGAACTGAAGAACCCGGCCGAC
GGAAACGCGGACATCTGGCGGGCCTACGACCAGCTTCAGACCTACAAGGAACAGATTCCGGACGCCTTCCAGTACAACGA
GGTGCTGATCATCTCCGACGGCAGCGAGGCACGCTTCGGATCCCTCTCGGCCAATGCCGAGCGATTCATGCAGTGGCGCA
CGATCGACGGGGTGGCGCTCGACCCACTCGGCGAATTCAACGAACTGGAGACGCTGGTACGCGGCCTGCTGGCTCCGGCC
ATCCTGCTCGACTACCTGCGCTTCTTCGTCCTCTTCGAAGATGACGGCGCATTGGTCAAGAAGATCGCCGGCTATCACCA
GTTCCATGCGGTGCGCGCGGCGATCGATCAGGTGGTTACCGCCTCGCGCCCCGGCGGTACGCACAAGGGCGGCGTCGTCT
GGCATACGCAGGGCAGCGGCAAGAGCATCACGATGACCTGCTTCGCCGCCCGGGTGATGCAGGAAGCGGTGATGGAGAAC
CCGACCATCGTCGTCATCACCGACCGCAACGACCTCGACGGCCAGCTGTTCGGCGTCTTCTCGCTGGCGCAGGACCTTCT
GCGCGAGGAACCGGTACAAGCCAACACCCGGCAAGACCTGCGCGCCAAGCTCGGCAACCGCCCCTCGGGCGGCATCGTCT
TCGCCACCATCCAGAAGTTCATGCCTGGCGAGGACGAGGACGCCTACCCGACCCTCTCCGACCGCCACAACATCGTGGTG
ATTGCCGACGAAGCCCACCGCACCCAGTACGGCTTCGAGGCCAGGCTCAAGACCGTCCGGGCGCCCCGGAACACGGCCGG
CGACGGCGTCAACGACGCCAACGCGCGGCTCGCCGCCGAGCCCGCCGCGTCGTACCTTTCGCGCTACCAGGTCGGCTACG
CCCAGCACCTGCGCGACGCCTTGCCCAATGCGACCTTCGTCGCCTTCACGGGGACCCCGGTATCGAGCGAGGACCGCGAC
ACGCGTGCCGTGTTCGGCGACTACATCCACGTCTACGACATGCAACAGGCGAAGGAGGATGGGGCGACCGTCGCCATCTA
CTTCGAGTCGCGCCTCGCAAAACTGTCGCTGAACGAGGCCGAGCTGCCGCACATCGACGACGAGGTCGATGAACTCGCCG
AGGACGAGGAGGAAGGACAGCAGGCCCGGCTGAAGAGCAAGTGGGCAGCGCTCGAAAAGGTGGTCGGTGCCGAACCCCGT
ATCGCCAGCGTCGCCGCCGATCTGGTCGCCCACTTCGAAGAACGCAGCCAGGCCCAGACCGGCAAGGCGATGGTCGTCGC
CATGAGCCGCGAAATCTGCGTCCATCTCTACAACGAGATCACCAGGTTGCGCCCCGAGTGGCATGACGCCGATCCGGAAA
AGGGGGCGATCAAGATCGTCATGACCGGTTCCGCCAGCGACAAGGCACTGCTCCGGCCGCACATCTATAGCGCACAGGTC
AAGAAGCGCCTCGAGAAGCGCTTCAAGGATCCCGCGGACCCACTGCGCATCGTCATCGTGCGGGACATGTGGCTGACCGG
CTTCGATGCGCCCTGCGTGCATACGATGTACATCGACAAGCCGATGAAGGGCCACAACCTGATGCAGGCCATCGCCCGCG
TCAATCGCGTGTTCAAGGACAAGCAGGGTGGGTTGGTGGTGGATTACATCGGCATCGCCAACGAACTCAAGAGCGCGCTC
AAGGAATACACCGCCAGCCAGGGGCGCGGCCGGCCGACGGTCGATGTCGCCGAAGCGTATGCGGTGCTGGAGGAGAAACT
CGACATCCTGCGCGGGATGTTGCACGGCTTCGATTACAGCGACTTCCTGACCACCGGCCACCGGCGACTCGCCGGCGCCG
CCAACCATGTGCTCGGGCAGAAGGACGGCAAGAAGCGATTTGCGGATACCGCACTGGCGATGAGCAGGGCATTCACCCTC
TGTTGCACACTGGACGCGGCCAAGGAAGTACGCGAAGAGGTCGCCTTCATGCAGGCGGTGAAGGTCATCCTGACCAAGCG
CGACCTCAGTCAGCAGCGCCGTACGGATGAGCAGCGCGAACTGGCAATCCGGCAGATCATCAATTCGGCCATCGTTTCCG
AGGAAGTGGTCGATGTGTTCGACGCGGTCGGCCTCGACAAGCCGAACATCGGGATTCTCGACGACGCCTTTCTCGCCGAG
GTGCGCAACCTGCCCGAGCGCAATCTTGCCGTCGAACTGCTGGAGCGCCTGCTCGAAGGGGAGATCAAGAGCCGCTTTGC
CGGCAACGTGGTGCAGGCGAAGAAGTTCTCCGAGTTGCTGACCAACGTGATCAAGCGCTACCAGAACCGGGCCATCGAAA
CTGCGCAGGTCATCGAAGAACTGATCGAGATGGCCAAGAAGTTCCGCGCGGCGGCGAACCGGGGCGAGGCACTGGGGCTG
ACCGAAGACGAGGTTCGCTTCTACGATGCCTTGGCCGACAACGAATCGGCGGTACGTGAGCTGTCTGACGAAACCTTGAA
GAAGATCGCCCACGAACTGACCGAGAGCCTGCGCCAGAACATCACCGTGGATTGGTCGGCGCGGGACAGCATCCGCGCCA
GGCTTCGACTCATGGTCAAACGCATCCTCCGCAAGTACAAGTACCCCCCGGATCAGCAGGAGGCGGCAATCGAGCTGGTG
CTGAAGCAGGCTGAGGTGTTGGGCGAAGAGTGGATGTGA

Protein sequence :

MTEDHLEQEALGWLTEVGYDTLYGPDIAPDGANPERAGYQQVLLPFRLREAIHRLNPSIPLAAREDALKQVLDLGIPALL
SANRHFHKLLVGGVPVQYQKDGETRGDLVRLIDWTNPAKNKWLAINQHSIKGPHHTRRPDIILFINGLPLVLIELKNPAD
GNADIWRAYDQLQTYKEQIPDAFQYNEVLIISDGSEARFGSLSANAERFMQWRTIDGVALDPLGEFNELETLVRGLLAPA
ILLDYLRFFVLFEDDGALVKKIAGYHQFHAVRAAIDQVVTASRPGGTHKGGVVWHTQGSGKSITMTCFAARVMQEAVMEN
PTIVVITDRNDLDGQLFGVFSLAQDLLREEPVQANTRQDLRAKLGNRPSGGIVFATIQKFMPGEDEDAYPTLSDRHNIVV
IADEAHRTQYGFEARLKTVRAPRNTAGDGVNDANARLAAEPAASYLSRYQVGYAQHLRDALPNATFVAFTGTPVSSEDRD
TRAVFGDYIHVYDMQQAKEDGATVAIYFESRLAKLSLNEAELPHIDDEVDELAEDEEEGQQARLKSKWAALEKVVGAEPR
IASVAADLVAHFEERSQAQTGKAMVVAMSREICVHLYNEITRLRPEWHDADPEKGAIKIVMTGSASDKALLRPHIYSAQV
KKRLEKRFKDPADPLRIVIVRDMWLTGFDAPCVHTMYIDKPMKGHNLMQAIARVNRVFKDKQGGLVVDYIGIANELKSAL
KEYTASQGRGRPTVDVAEAYAVLEEKLDILRGMLHGFDYSDFLTTGHRRLAGAANHVLGQKDGKKRFADTALAMSRAFTL
CCTLDAAKEVREEVAFMQAVKVILTKRDLSQQRRTDEQRELAIRQIINSAIVSEEVVDVFDAVGLDKPNIGILDDAFLAE
VRNLPERNLAVELLERLLEGEIKSRFAGNVVQAKKFSELLTNVIKRYQNRAIETAQVIEELIEMAKKFRAAANRGEALGL
TEDEVRFYDALADNESAVRELSDETLKKIAHELTESLRQNITVDWSARDSIRARLRLMVKRILRKYKYPPDQQEAAIELV
LKQAEVLGEEWM

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
api52	CAF28526.1	hsdr-like Type I restriction enzyme	Not tested	YAPI	Protein	0.0	56
hsdR	YP_251977.1	type I restriction-modification system restriction subunit	Not tested	SCCmec	Protein	0.0	47
hsdR	BAH57699.1	type I restriction-modification system endonuclease homologue	Not tested	Type-VII SCCmec	Protein	0.0	47
hsdR	BAD24840.1	type I restriction-modification system endonuclease homologue	Not tested	Type-V SCCmec	Protein	0.0	47