Gene Information

Name : Galf_1221 (Galf_1221)
Accession : YP_003847013.1
Strain : Gallionella capsiferriformans ES-2
Genome accession: NC_014394
Putative virulence/resistance : Unknown
Product : HsdR family type I site-specific deoxyribonuclease
Function : -
COG functional category : V : Defense mechanisms
COG ID : COG0610
EC number : -
Position : 1318358 - 1321576 bp
Length : 3219 bp
Strand : +
Note : TIGRFAM: type I site-specific deoxyribonuclease, HsdR family; PFAM: Protein of unknown function DUF3387; type III restriction protein res subunit; protein of unknown function DUF450; KEGG: bte:BTH_I2740 type I restriction-modification system endonuclease;

DNA sequence :

ATGATGGCGTTTTTGTCGGAGGCAGCCGTTGAGCTGGCACTACTAGAGCAACTGCGAGGGCTGGGCTACAGCATCGAGCA
AGAAGAAAACATCGGCCCAGATGGACATCGCCCTGAGCGTGACAGTCACGACGTGGTCGTGCTGAAGAAGCGATTGGAGG
ACGCCGTTGCGTTGCTCAATCCCGGAATGCCATTGGATGCGCGTCAGGATGCGATCCGCAAGGTGATGCAGTCCGAGCTG
CCATTAATGCTTGAAGAGAACCGCCGTATCCACAAACTGATGACTGAGGGCGTCGACGTCGAGTATTACGCCGACGACGG
AACACTGACCGCAGGCAAGGTTTCCCTCATCAACTTCGAGCGGCCAGAGCAGAACGATTGGCTGGTGGTGAGCCAGTTCG
TGGTGATCGCCGGGCAATACAACCGCCGCCCAGACGTGGTGGTGTTCGTTAATGGCCTGCCGCTGGGCGTGATCGAGCTG
AAGGCTCCCGGCAGCGGGAACGCAACATTGGTCGGGGCTTTCAACCAGCTGCAGACCTACAAGAAGCAGATCCCGGCGCT
ATTCAATACCAACGCACTGCTAGTGACATCGGATGGGATTACCGCGCGCGTCGGCTCGCTGTCTGCCGACCTGGAGCGGT
TCATGCCATGGCGCACGACCGACGGCAAAGACGTTGCACCGAAAGGTGCGCCCGAACTCTCGACATTGATCGAAGGCGTT
TTCGAGCAGCGCCGCTTGCTCGACATGCTGTGCCACTTTACGGTCTTCGGTGAGACGGGCTCGGGCTTGGCGAAGATCAT
CGCGGGCTATCACCAGTTTCACGCAGTCATCCGCGCGGTCGATTCGACCCTTCGCGCATCAAGCCAATGGCAGGGCGTGC
AAGAAGATCCGCGCGACTACGGCTTACCCAGCGTCAAGACCCAAGCCAAAGGTGACAGAAGAGCTGGGGTAATCTGGCAC
ACACAAGGCTCCGGCAAAAGTCTGTTGATGGCGTTCTACGCTGGGCAGCTGGTCAAACATCCGGCGATGGCCAATCCAAC
GCTCGTAGTACTGACCGACCGTAACGATCTCGATGACCAGTTGTTCGCCACCTTCTCGATGTGCCGCGACCTGATTCGGC
AAACACCGGTACAGGCTGACAGCCGCGAAGACTTGACTAAACTTTTGGCGCGGGCATCTGGCGGCGTGATTTTTACAACC
TTGCAAAAGTTTGGCGAGACAAGTCAGGCGCTGACAGACCGTCGCAATGTGGTTGTGATCGCTGATGAAGCGCACCGTAG
CCAATATGGCTTTCGGGCCAAGGTGGATGCCAAAACGGGTGAGATTTCCTACGGGTTCGCCAAGTACCTGCGCGACGCGC
TGCCCAACGCGTCGTTCATTGGTTTTACCGGAACGCCCATTGAGGCCGACGATGTGAACACCCCGGCGGTGTTCGGCAAT
TACATCGACGTTTACGATATCAGCCGAGCAGTCGAGGACGGCGCGACAGTGCCGATCTACTACGAGTCGCGGCTCGCTCG
CATTGAACTTGATGAGGACGAGAAACCCAAGATCGATGCCGAGGTCAACGAACTCACAGAAGACGATCCGGAGGTTGAGC
AAGAACGCTTCAAGCGCAAATGGTCAACAGTAGAAGCCTTGGTGGGCAGCGATAAGCGCCTCGCGCTGGTTGCGCAAGAC
ATGGTTACCCACTTCGAGGATCGCGTTGCTGCGCTGGACGGAAAAGCGATGGTTGTTTGCATGAGCCGTCGCATCTGCGT
GAAGCTGTATGACGAGATCGTGAAGCTCCGTCCAGACTGGCACAGTGCCGATGACAACGCGGGGGCGGTCAAAATTGTGA
TGACGGGCGCTGCCAGCGACCCCGAAGACTGGCAGCAGCACATCGGCAACAAGGCCCGCCGCGATCTGCTGGCCAAGCGC
GCTCGCGACGCCAAAGACCCGCTCAAGCTGGTGATCGTGCGAGATATGTGGCTTACCGGGTTTGATGCGCCCTGCATGCA
CACGATGTACGTGGACAAGCCGATGCAGGGGCACGGCTTGATGCAGGCGATTGCGCGGGTGAATCGTGTGTTCCGCGACA
AGCCTGCCGGGTTGATCGTCGACTACATCGGTATCGCCCAGAACCTGAAATCGGCGCTTCAGCAATACTCGAAGAACGAC
CAGGAAAACACCGGCGTCGACGAGTCGCAGGCCATCGCCGTGCTGATGGAAAAGTACGAAGTCGTGCGCGACATGTACCA
CGGCTTCGACTACGCCTCAGCAATGGGCGGAACACCTCAAGAACGCTTGGCAATGATGGCCGGTGCAATTGAGTGGATTC
TCGACATGCAGCAAAAGTTGGCGGCGAAGGAGAAAACCAAGGACGGCAAAAAGGATGCGCATCGCCGCTATCAGGATGCC
GTGCTTGCGTTGTCCAAGGCGTTCTCCCTTGCATCGGCATCCGACGAGGCCCGCGAAATCCGAGAGGAAGTGGGCTTCTT
CCAGGCAATTCGCGCGGCGCTGGTAAAGAGCAGTACCGGGTCGGGCGTGACTCAGCAAGAGCGTGAACTGGCAATCCAGC
AGATCGTGAGTCGCGCCGTAGTTTCCACCGAGATTGTCGACATCCTCGCTGCCGCCGGGATCAAGAGCCCGGACATCTCG
ATCTTGTCAGACGAGTTCCTGGCCGAAGTTCAGCAGATGGAGCGCAAGAACCTCGCTCTCGAAGCGTTGCGGAAATTGAT
CAACGATGGCATCCGCTCCCGCAGCAAATCCAACGTCGTGCAGACCAAGGCTTTCTCAGAGCGGTTGGAAGATGCTGTCG
CGCGGTATCACGCCAATGCGATCACCACCGCTGAGGTCTTGCAGGAGTTGATTGATCTCGCTAAGGATATTCGGGCAGCT
CGTCAGCGTGGTGAAGAGCAAGGTTTGTCCGAGGATGAAATTGCTTTCTACGACGCGCTGGCCGAGAACGAGAGCGCGAT
TCAAATGATGGGTGACGACAAACTGAAACTTATCGCACACGAGTTGTTAGTCAGCCTGCGCGAGAACGTATCTGTGGATT
GGGCGCATCGTGATTCTGCCCGCGCACGGATGCGAGTGCTGGTGAAGCGCATTCTGCGCAAGTATGGTTACCCGCCTGAT
CTGCAGGACGCGGCCGTGCAAACGGTACTGCAGCAGGCCGAGGCATTGTCGTCGACGTGGAGCATGCCGAGACCTGGCAG
AGGAGATGGCCATGGCTGA

Protein sequence :

MMAFLSEAAVELALLEQLRGLGYSIEQEENIGPDGHRPERDSHDVVVLKKRLEDAVALLNPGMPLDARQDAIRKVMQSEL
PLMLEENRRIHKLMTEGVDVEYYADDGTLTAGKVSLINFERPEQNDWLVVSQFVVIAGQYNRRPDVVVFVNGLPLGVIEL
KAPGSGNATLVGAFNQLQTYKKQIPALFNTNALLVTSDGITARVGSLSADLERFMPWRTTDGKDVAPKGAPELSTLIEGV
FEQRRLLDMLCHFTVFGETGSGLAKIIAGYHQFHAVIRAVDSTLRASSQWQGVQEDPRDYGLPSVKTQAKGDRRAGVIWH
TQGSGKSLLMAFYAGQLVKHPAMANPTLVVLTDRNDLDDQLFATFSMCRDLIRQTPVQADSREDLTKLLARASGGVIFTT
LQKFGETSQALTDRRNVVVIADEAHRSQYGFRAKVDAKTGEISYGFAKYLRDALPNASFIGFTGTPIEADDVNTPAVFGN
YIDVYDISRAVEDGATVPIYYESRLARIELDEDEKPKIDAEVNELTEDDPEVEQERFKRKWSTVEALVGSDKRLALVAQD
MVTHFEDRVAALDGKAMVVCMSRRICVKLYDEIVKLRPDWHSADDNAGAVKIVMTGAASDPEDWQQHIGNKARRDLLAKR
ARDAKDPLKLVIVRDMWLTGFDAPCMHTMYVDKPMQGHGLMQAIARVNRVFRDKPAGLIVDYIGIAQNLKSALQQYSKND
QENTGVDESQAIAVLMEKYEVVRDMYHGFDYASAMGGTPQERLAMMAGAIEWILDMQQKLAAKEKTKDGKKDAHRRYQDA
VLALSKAFSLASASDEAREIREEVGFFQAIRAALVKSSTGSGVTQQERELAIQQIVSRAVVSTEIVDILAAAGIKSPDIS
ILSDEFLAEVQQMERKNLALEALRKLINDGIRSRSKSNVVQTKAFSERLEDAVARYHANAITTAEVLQELIDLAKDIRAA
RQRGEEQGLSEDEIAFYDALAENESAIQMMGDDKLKLIAHELLVSLRENVSVDWAHRDSARARMRVLVKRILRKYGYPPD
LQDAAVQTVLQQAEALSSTWSMPRPGRGDGHG

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
api52	CAF28526.1	hsdr-like Type I restriction enzyme	Not tested	YAPI	Protein	0.0	49
hsdR	BAH57699.1	type I restriction-modification system endonuclease homologue	Not tested	Type-VII SCCmec	Protein	0.0	47
hsdR	YP_251977.1	type I restriction-modification system restriction subunit	Not tested	SCCmec	Protein	0.0	47
hsdR	BAD24840.1	type I restriction-modification system endonuclease homologue	Not tested	Type-V SCCmec	Protein	0.0	47