Gene Information

Name : Hprae_2037 (Hprae_2037)
Accession : YP_005837319.1
Strain : Halanaerobium praevalens DSM 2228
Genome accession: NC_017455
Putative virulence/resistance : Unknown
Product : type III restriction protein res subunit
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 2228821 - 2231805 bp
Length : 2985 bp
Strand : -
Note : COGs: COG0610 Type I site-specific restriction-modification system R (restriction) subunit and related helicase; InterPro IPR014001:IPR007409:IPR006935:IPR014021; KEGG: type III restriction protein res subunit; PFAM: type III restriction protein res subun

DNA sequence :

TTGCTGAGCACAGGCACACCAGCCCAATTGACAGAGAAAGAATTTCAGAACTTAATTAAAAAGCATCTAATTAGTGAAAA
TGCTTATCTTGAAAGCAGTAATCAAAACTATGATAAATATCATGCTCTAGATACAGAAATCTTATTTGAATTTCTGGAAA
CAACACAGGAAAAAACCATGCAGGAATTAAAAAATATTTATGGACCTGAATATAAGCAAAAAATAGTTAAAAGATTAAAT
GCAGAATTAGCCAGAAGAAGTATGATTGATGTAATTAAGCATGGAATTAAAGATTATGGTAAAAAATTAGATTTAGCCTA
TTTTAAGCCCCCGACAGATTTTAATGCAAAGCTAAATAAATTATATCAACAGAACATTTTTTCTGTAATTGATGAACTAA
ATTATCAGGATAATAAACGACTTGATATAGTTCTTTTTCTAAATGGTCTCCCGATTATCACAATGGAGCTCAAAAATCAG
GATACAAGTCAGGGCTACAAAGATGCTATTAAACAATATAAAACTGAGAGGTCTCCCAATGAAAAAATATTTAGATTTAA
ACAGCGCTCAATAGTAAATTTTGCTGTTGATAAAGCTGAAGTCTATATGACAACTGAGCTTAAGGGAAAAGATACCTTCT
TTTTACCTTTTAACAAAGGTCAAGGCAAGGGTAAAGCCAAAAGAGCAGGGAATCCTACAGTTGCAGGCAAAATAAAAACT
CATTATCTCTGGGAGGATATTTTCAAAAAAGATCAGCTTTTAGAGATTCTGCAGAAATTTGTTTTCATTGATCAAGAAGA
AGATATTGATCAACAGGGTAATCTTAAACAAGATGAGAAAATAATTTTTCCTCGCTATCACCAATTAGATGTAGTCTCTA
AAATTTTGGGGGATGTCAAAGAAAAAAAAGCGGGCTCTAAATATTTAATTCAACATAGTGCAGGCTCAGGTAAAACCTAT
TCCATCACCTGGCTGGCCCATCGATTATCCAGTTTACATGATAGAGAAAATAACCCCATTTTTAGCAGTGTCATAGTTGT
GACAGATAGAGTTTCCCTAGACCAGCAGCTGCAGGAAACGATTTATCAGATAGATCATAAACTGGGAGTAGTCGCTCCGA
TTAAAAAAGATTCACATCAATTAGCTGCTGAATTAAATGCTGGCACCAAGATTATTATCAGTACAATCCAGAAGTTTCCC
TTTATCTTAGATAAGGTTTCAGATACTAAAGTTAAAAACTTTGCCATTATAATTGATGAGGCCCATTCTTCTACTAGTGG
CAAAAATATTTTAGCTTTAAAAGAATCACTATCTCTAGAAGAAGCAGCTGAATTAGATAGACAGGCAGAAATGAATTCTG
ATGATGTTGAGGATAAGATTAATAAAGAGTTAAAGCGGGTCCAGAGTCTTGATTCCTTGAGCTTCTTTGGCTTTACCGCT
ACTCCTAAACCAGCCACTTTAGAGCTTTTTGGTTCTACTAATCAGGCAGGTAAAAAAGAGGCTTTTCACCTTTATTCAAT
GCGGCAGGCTATTGAAGAAGGTTTTATTTTAGATGTTTTAGAAAATTATATGACATATAAAACATATTATCAGGTTAATA
AAAAAATTGAAGCTGATCCTGAATTCGAAAAATCCAGAACTTCAAAGGAGATTGCCAGATTTGTGAGCCTGCACCCTCAT
AATATATCACAGAAAACAGAAATTATGATTGAGCATTTCCGGGATAAGACAATGCATAAAATTGGGGGAGAAGCTAAAGC
AATGTTAGTTACCTCTTCTCGCCTACATGCAGTGAGATATAAAAATGCTTTTGATAAATACATTAGAGACAAAGGCTACA
AGAATTTAAAAAGTCTAGTCGCTTTTTCAGGCACAGTTAAAGATGATGGCTTTGAATACACTGAACCTAAGCTGAATAAC
GGTATCCCTGAATCAGAAACAGCCAAAGAATTTGATAAAGATGAATACCAGATCCTTTTAGTTGCCAATAAATATCAGAC
TGGTTTTGACCAGCCAAAACTGCACACAATGTTCGTTGATAAGAGGCTGCAGGGAGTTAATGCTGTCCAGACTTTATCTC
GTTTAAACAGAACCTACAAAGGGATTAAAGAAGATACCTTTGTTCTTGATTTTGTTAATGAAGCTGATGATATTAAAAAT
GCTTTTGAACCATATTATGACCTAACAAAGCTAGATTCAGATAATATAGATCCTAATCAGATGTATACTCTTTATGATGA
GATAATGGATTCCATGTTGATTGATAAAGCTGATATTGATGCTTTTGCTCACTGTTATTATGAGAATGATTCTACAGAAG
AAATAATAGCAGCTGGAGATAATGCTCTCTCACATAGTACAGCCAGAATTGAGAATTTATCTAAAGAGGATAAATTAGAA
TTTAGATCTCAAATGAAGCGTTTTATCAACCTCTATAATTTAGTGCTGCAGGTCCATCCAATTAAAGATATTGAGCTGCA
TAAACTGAATATTTATTTAAAATTTCTGCTGAAAAGAATTGATGTTGAAACTCCAAACAATGTAGATATTTCGGATAAAG
TTGTCTTGGAATATTATCAGCTGGAGAATAAAGGTCAGCAGAGTATCGGCTTAATTGGGGAAAAAGAACTCACTGGGCCA
GCTCTGGGTAGTGGCAGCTATCAAGAGGAAGAAAAAGAGCATTTGAGTGTAATTATTGAGCGTTTAAACGAAAAATTCCA
GACCAATTTTTCAGATTCAGCTAAAGTTGCTATTGATCAGATGAAAAATAAGTTGGAGAAGAATAATAATTTGAAGAAAT
GGGCTCAAGCAAATAGTTTTGAGGACTTTAAGATACCAGTACAAAAGAAATTTGAAGACACAGTTGTTGAATCTTATAAT
GAAAATACTGAGTTCTATGGTAAAGTGCTTAATGACAAAGATTTCAAAGAAAAGCTGATGGATTTAATTATGATTGATCT
GTATCAGAGTTTGAGGGCCGAGTGA

Protein sequence :

MLSTGTPAQLTEKEFQNLIKKHLISENAYLESSNQNYDKYHALDTEILFEFLETTQEKTMQELKNIYGPEYKQKIVKRLN
AELARRSMIDVIKHGIKDYGKKLDLAYFKPPTDFNAKLNKLYQQNIFSVIDELNYQDNKRLDIVLFLNGLPIITMELKNQ
DTSQGYKDAIKQYKTERSPNEKIFRFKQRSIVNFAVDKAEVYMTTELKGKDTFFLPFNKGQGKGKAKRAGNPTVAGKIKT
HYLWEDIFKKDQLLEILQKFVFIDQEEDIDQQGNLKQDEKIIFPRYHQLDVVSKILGDVKEKKAGSKYLIQHSAGSGKTY
SITWLAHRLSSLHDRENNPIFSSVIVVTDRVSLDQQLQETIYQIDHKLGVVAPIKKDSHQLAAELNAGTKIIISTIQKFP
FILDKVSDTKVKNFAIIIDEAHSSTSGKNILALKESLSLEEAAELDRQAEMNSDDVEDKINKELKRVQSLDSLSFFGFTA
TPKPATLELFGSTNQAGKKEAFHLYSMRQAIEEGFILDVLENYMTYKTYYQVNKKIEADPEFEKSRTSKEIARFVSLHPH
NISQKTEIMIEHFRDKTMHKIGGEAKAMLVTSSRLHAVRYKNAFDKYIRDKGYKNLKSLVAFSGTVKDDGFEYTEPKLNN
GIPESETAKEFDKDEYQILLVANKYQTGFDQPKLHTMFVDKRLQGVNAVQTLSRLNRTYKGIKEDTFVLDFVNEADDIKN
AFEPYYDLTKLDSDNIDPNQMYTLYDEIMDSMLIDKADIDAFAHCYYENDSTEEIIAAGDNALSHSTARIENLSKEDKLE
FRSQMKRFINLYNLVLQVHPIKDIELHKLNIYLKFLLKRIDVETPNNVDISDKVVLEYYQLENKGQQSIGLIGEKELTGP
ALGSGSYQEEEKEHLSVIIERLNEKFQTNFSDSAKVAIDQMKNKLEKNNNLKKWAQANSFEDFKIPVQKKFEDTVVESYN
ENTEFYGKVLNDKDFKEKLMDLIMIDLYQSLRAE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
SAS0025	YP_042158.1	type I restriction enzyme protein	Not tested	SCC476	Protein	3e-170	42