Name : Hprae_2037 (Hprae_2037) Accession : YP_005837319.1 Strain : Halanaerobium praevalens DSM 2228 Genome accession: NC_017455 Putative virulence/resistance : Unknown Product : type III restriction protein res subunit Function : - COG functional category : - COG ID : - EC number : - Position : 2228821 - 2231805 bp Length : 2985 bp Strand : - Note : COGs: COG0610 Type I site-specific restriction-modification system R (restriction) subunit and related helicase; InterPro IPR014001:IPR007409:IPR006935:IPR014021; KEGG: type III restriction protein res subunit; PFAM: type III restriction protein res subun DNA sequence : TTGCTGAGCACAGGCACACCAGCCCAATTGACAGAGAAAGAATTTCAGAACTTAATTAAAAAGCATCTAATTAGTGAAAA TGCTTATCTTGAAAGCAGTAATCAAAACTATGATAAATATCATGCTCTAGATACAGAAATCTTATTTGAATTTCTGGAAA CAACACAGGAAAAAACCATGCAGGAATTAAAAAATATTTATGGACCTGAATATAAGCAAAAAATAGTTAAAAGATTAAAT GCAGAATTAGCCAGAAGAAGTATGATTGATGTAATTAAGCATGGAATTAAAGATTATGGTAAAAAATTAGATTTAGCCTA TTTTAAGCCCCCGACAGATTTTAATGCAAAGCTAAATAAATTATATCAACAGAACATTTTTTCTGTAATTGATGAACTAA ATTATCAGGATAATAAACGACTTGATATAGTTCTTTTTCTAAATGGTCTCCCGATTATCACAATGGAGCTCAAAAATCAG GATACAAGTCAGGGCTACAAAGATGCTATTAAACAATATAAAACTGAGAGGTCTCCCAATGAAAAAATATTTAGATTTAA ACAGCGCTCAATAGTAAATTTTGCTGTTGATAAAGCTGAAGTCTATATGACAACTGAGCTTAAGGGAAAAGATACCTTCT TTTTACCTTTTAACAAAGGTCAAGGCAAGGGTAAAGCCAAAAGAGCAGGGAATCCTACAGTTGCAGGCAAAATAAAAACT CATTATCTCTGGGAGGATATTTTCAAAAAAGATCAGCTTTTAGAGATTCTGCAGAAATTTGTTTTCATTGATCAAGAAGA AGATATTGATCAACAGGGTAATCTTAAACAAGATGAGAAAATAATTTTTCCTCGCTATCACCAATTAGATGTAGTCTCTA AAATTTTGGGGGATGTCAAAGAAAAAAAAGCGGGCTCTAAATATTTAATTCAACATAGTGCAGGCTCAGGTAAAACCTAT TCCATCACCTGGCTGGCCCATCGATTATCCAGTTTACATGATAGAGAAAATAACCCCATTTTTAGCAGTGTCATAGTTGT GACAGATAGAGTTTCCCTAGACCAGCAGCTGCAGGAAACGATTTATCAGATAGATCATAAACTGGGAGTAGTCGCTCCGA TTAAAAAAGATTCACATCAATTAGCTGCTGAATTAAATGCTGGCACCAAGATTATTATCAGTACAATCCAGAAGTTTCCC TTTATCTTAGATAAGGTTTCAGATACTAAAGTTAAAAACTTTGCCATTATAATTGATGAGGCCCATTCTTCTACTAGTGG CAAAAATATTTTAGCTTTAAAAGAATCACTATCTCTAGAAGAAGCAGCTGAATTAGATAGACAGGCAGAAATGAATTCTG ATGATGTTGAGGATAAGATTAATAAAGAGTTAAAGCGGGTCCAGAGTCTTGATTCCTTGAGCTTCTTTGGCTTTACCGCT ACTCCTAAACCAGCCACTTTAGAGCTTTTTGGTTCTACTAATCAGGCAGGTAAAAAAGAGGCTTTTCACCTTTATTCAAT GCGGCAGGCTATTGAAGAAGGTTTTATTTTAGATGTTTTAGAAAATTATATGACATATAAAACATATTATCAGGTTAATA AAAAAATTGAAGCTGATCCTGAATTCGAAAAATCCAGAACTTCAAAGGAGATTGCCAGATTTGTGAGCCTGCACCCTCAT AATATATCACAGAAAACAGAAATTATGATTGAGCATTTCCGGGATAAGACAATGCATAAAATTGGGGGAGAAGCTAAAGC AATGTTAGTTACCTCTTCTCGCCTACATGCAGTGAGATATAAAAATGCTTTTGATAAATACATTAGAGACAAAGGCTACA AGAATTTAAAAAGTCTAGTCGCTTTTTCAGGCACAGTTAAAGATGATGGCTTTGAATACACTGAACCTAAGCTGAATAAC GGTATCCCTGAATCAGAAACAGCCAAAGAATTTGATAAAGATGAATACCAGATCCTTTTAGTTGCCAATAAATATCAGAC TGGTTTTGACCAGCCAAAACTGCACACAATGTTCGTTGATAAGAGGCTGCAGGGAGTTAATGCTGTCCAGACTTTATCTC GTTTAAACAGAACCTACAAAGGGATTAAAGAAGATACCTTTGTTCTTGATTTTGTTAATGAAGCTGATGATATTAAAAAT GCTTTTGAACCATATTATGACCTAACAAAGCTAGATTCAGATAATATAGATCCTAATCAGATGTATACTCTTTATGATGA GATAATGGATTCCATGTTGATTGATAAAGCTGATATTGATGCTTTTGCTCACTGTTATTATGAGAATGATTCTACAGAAG AAATAATAGCAGCTGGAGATAATGCTCTCTCACATAGTACAGCCAGAATTGAGAATTTATCTAAAGAGGATAAATTAGAA TTTAGATCTCAAATGAAGCGTTTTATCAACCTCTATAATTTAGTGCTGCAGGTCCATCCAATTAAAGATATTGAGCTGCA TAAACTGAATATTTATTTAAAATTTCTGCTGAAAAGAATTGATGTTGAAACTCCAAACAATGTAGATATTTCGGATAAAG TTGTCTTGGAATATTATCAGCTGGAGAATAAAGGTCAGCAGAGTATCGGCTTAATTGGGGAAAAAGAACTCACTGGGCCA GCTCTGGGTAGTGGCAGCTATCAAGAGGAAGAAAAAGAGCATTTGAGTGTAATTATTGAGCGTTTAAACGAAAAATTCCA GACCAATTTTTCAGATTCAGCTAAAGTTGCTATTGATCAGATGAAAAATAAGTTGGAGAAGAATAATAATTTGAAGAAAT GGGCTCAAGCAAATAGTTTTGAGGACTTTAAGATACCAGTACAAAAGAAATTTGAAGACACAGTTGTTGAATCTTATAAT GAAAATACTGAGTTCTATGGTAAAGTGCTTAATGACAAAGATTTCAAAGAAAAGCTGATGGATTTAATTATGATTGATCT GTATCAGAGTTTGAGGGCCGAGTGA Protein sequence : MLSTGTPAQLTEKEFQNLIKKHLISENAYLESSNQNYDKYHALDTEILFEFLETTQEKTMQELKNIYGPEYKQKIVKRLN AELARRSMIDVIKHGIKDYGKKLDLAYFKPPTDFNAKLNKLYQQNIFSVIDELNYQDNKRLDIVLFLNGLPIITMELKNQ DTSQGYKDAIKQYKTERSPNEKIFRFKQRSIVNFAVDKAEVYMTTELKGKDTFFLPFNKGQGKGKAKRAGNPTVAGKIKT HYLWEDIFKKDQLLEILQKFVFIDQEEDIDQQGNLKQDEKIIFPRYHQLDVVSKILGDVKEKKAGSKYLIQHSAGSGKTY SITWLAHRLSSLHDRENNPIFSSVIVVTDRVSLDQQLQETIYQIDHKLGVVAPIKKDSHQLAAELNAGTKIIISTIQKFP FILDKVSDTKVKNFAIIIDEAHSSTSGKNILALKESLSLEEAAELDRQAEMNSDDVEDKINKELKRVQSLDSLSFFGFTA TPKPATLELFGSTNQAGKKEAFHLYSMRQAIEEGFILDVLENYMTYKTYYQVNKKIEADPEFEKSRTSKEIARFVSLHPH NISQKTEIMIEHFRDKTMHKIGGEAKAMLVTSSRLHAVRYKNAFDKYIRDKGYKNLKSLVAFSGTVKDDGFEYTEPKLNN GIPESETAKEFDKDEYQILLVANKYQTGFDQPKLHTMFVDKRLQGVNAVQTLSRLNRTYKGIKEDTFVLDFVNEADDIKN AFEPYYDLTKLDSDNIDPNQMYTLYDEIMDSMLIDKADIDAFAHCYYENDSTEEIIAAGDNALSHSTARIENLSKEDKLE FRSQMKRFINLYNLVLQVHPIKDIELHKLNIYLKFLLKRIDVETPNNVDISDKVVLEYYQLENKGQQSIGLIGEKELTGP ALGSGSYQEEEKEHLSVIIERLNEKFQTNFSDSAKVAIDQMKNKLEKNNNLKKWAQANSFEDFKIPVQKKFEDTVVESYN ENTEFYGKVLNDKDFKEKLMDLIMIDLYQSLRAE |
Gene | GenBank Accn | Product | Virulance or Resistance | PAI or REI | Alignment Type | E-val | Identity |
SAS0025 | YP_042158.1 | type I restriction enzyme protein | Not tested | SCC476 | Protein | 3e-170 | 42 |