Gene Information

Name : SCE94.24c (SCO3373)
Accession : NP_627581.1
Strain : Streptomyces coelicolor A3(2)
Genome accession: NC_003888
Putative virulence/resistance : Virulence
Product : Clp-family ATP-binding protease
Function : -
COG functional category : O : Posttranslational modification, protein turnover, chaperones
COG ID : COG0542
EC number : -
Position : 3736431 - 3738956 bp
Length : 2526 bp
Strand : -
Note : SCE94.24c, probable Clp-family ATP-binding protease, len: 841aa; highly similar to many egs. SW:MECB_BACSU MecB/ClpC pleiotropic regulator controlling competence gene expression and growth at high temperature in Bacillus subtilis (810 aa) fasta scores; op

DNA sequence :

ATGTTCGAGAGGTTCACCGACCGCGCGCGGCGGGTTGTCGTCCTGGCTCAGGAAGAAGCCCGGATGCTCAACCACAACTA
CATCGGCACCGAGCACATCCTCCTGGGCCTGATCCACGAGGGTGAGGGTGTCGCCGCCAAGGCCCTTGAGAGCCTCGGGA
TTTCGCTCGAGGCGGTCCGCCAGCAGGTGGAGGAGATCATCGGCCAGGGCCAGCAGGCCCCGTCCGGCCACATCCCCTTC
ACCCCCCGTGCCAAGAAGGTTCTGGAGCTGTCGCTCCGCGAGGCCCTCCAGCTGGGCCACAACTACATCGGCACGGAGCA
CATCCTGCTCGGCCTGATCCGCGAGGGCGAGGGCGTCGCCGCCCAGGTCCTGGTCAAGCTGGGCGCAGATCTGAACCGGG
TGCGGCAGCAGGTCATCCAGCTGCTCTCCGGTTACCAGGGCAAGGAGACCGCCACCGCCGGCGGTCCTGCGGAGGGCACC
CCCTCCACGTCCCTGGTCCTCGACCAGTTCGGCCGGAACCTCACCCAGGCCGCTCGCGAGTCCAAGCTCGACCCGGTCAT
CGGGCGCGAGAAGGAGATCGAGCGGGTCATGCAGGTGCTGTCCCGCCGTACGAAGAACAACCCGGTGCTGATCGGTGAGC
CCGGCGTCGGCAAGACCGCCGTCGTCGAGGGCCTCGCGCAGGCCATCGTCAAGGGCGAGGTGCCCGAGACCCTCAAGGAC
AAGCACCTCTACACCCTGGACCTCGGTGCCCTGGTCGCCGGCTCCCGCTACCGCGGTGACTTCGAGGAGCGCCTGAAGAA
GGTGCTCAAGGAGATCCGCACCCGCGGCGACATCATCCTGTTCATCGACGAGCTGCACACGCTGGTCGGTGCCGGTGCCG
CCGAGGGCGCCATCGACGCCGCGTCGATCCTCAAGCCGATGCTGGCCCGCGGTGAGCTCCAGACCATCGGTGCGACCACG
CTGGACGAGTACCGCAAGCACCTGGAGAAGGACGCGGCCCTCGAGCGCCGCTTCCAGCCGATCCAGGTCGCGGAGCCGTC
GCTGCCGCACACGATCGAGATCCTCAAGGGCCTGCGCGACCGCTACGAGGCCCACCACCGCGTCTCCATCACGGACGAGG
CCCTGGTCCAGGCGGCGACGCTCGCCGACCGCTACATCTCGGACCGCTTCCTGCCGGACAAGGCGATCGACCTGATCGAC
GAGGCCGGATCCCGGATGCGCATCCGCCGGATGACCGCGCCGCCGGACCTCCGCGAGTTCGACGAGAAGATCGCCGGCGT
CCGCCGCGACAAGGAGTCCGCGATCGACTCGCAGGACTTCGAGAAGGCCGCTTCCCTCCGCGACAAGGAGAAGCAGCTCC
TGGCCGCCAAGGCCAAGCGGGAGAAGGAGTGGAAGGCCGGCGACATGGACGTCGTCGCGGAGGTGGACGGCGAGCTGATC
GCCGAGGTCCTCGCCACGGCGACCGGCATCCCGGTCTTCAAGCTCACGGAGGAGGAGTCGTCCCGCCTGCTGCGCATGGA
GGACGAGCTCCACAAGCGGGTCATCGGCCAGAAGGACGCCGTCAAGGCGCTCTCCAAGGCGATCCGCCGTACCCGTGCCG
GCCTGAAGGACCCGAAGCGTCCCGGTGGCTCGTTCATCTTCGCCGGCCCGTCCGGTGTCGGTAAGACCGAGCTGTCCAAG
GCACTCGCCGAGTTCCTCTTCGGTGACGAGGACGCGCTGATCTCCCTCGACATGTCGGAGTTCAGCGAGAAGCACACGGT
CTCGCGCCTCTTCGGTTCGCCCCCCGGCTACGTGGGCTACGAGGAGGGCGGCCAGCTGACGGAGAAGGTCCGCCGCAAGC
CGTTCTCGGTCGTCCTCTTCGACGAGGTCGAGAAGGCCCACCCGGACATCTTCAACAGCCTTCTCCAGATCCTGGAGGAC
GGTCGCCTGACCGACTCCCAGGGCCGGGTCGTGGACTTCAAGAACACGGTCATCATCATGACGACCAACCTCGGCACCCG
GGACATCTCCAAGGGCTTCAACCTCGGCTTCGCCGCCGCGGGCGACACGAAGTCCAACTACGAGCGCATGAAGAACAAGG
TCCAGGACGAGCTGAAGCAGCACTTCCGGCCCGAGTTCCTCAACCGTGTCGACGACGTGGTCGTCTTCCCGCAGCTCAGC
CAGGACGACATCCTGCAGATCGTCGACCTGATGATCCAGAAGGTCGACGAGCGCCTCAAGGACCGGGACATGGGCATCGA
GCTCTCCCAGTCCGCCAAGGAGCTGCTGTCCAAGCGGGGCTACGACCCGGTGCTGGGCGCGCGTCCGCTGCGCCGCACGA
TCCAGCGCGAGGTCGAGGACTCGCTGTCGGAGAAGATCCTCTTCGGCGAGCTGCGTCCCGGTCACATCGTGGTCGTGGAC
ACCGAGGGCGAGGGCGACGCGGCGACCTTCACCTTCCGGGGTGAGGAGAAGTCGACCCTCCCCGACGTCCCGCCGATCGA
GCAGGCGGCGGGCGGCGCGGGGCCCAACCTGAGCAAGGAGGCCTAG

Protein sequence :

MFERFTDRARRVVVLAQEEARMLNHNYIGTEHILLGLIHEGEGVAAKALESLGISLEAVRQQVEEIIGQGQQAPSGHIPF
TPRAKKVLELSLREALQLGHNYIGTEHILLGLIREGEGVAAQVLVKLGADLNRVRQQVIQLLSGYQGKETATAGGPAEGT
PSTSLVLDQFGRNLTQAARESKLDPVIGREKEIERVMQVLSRRTKNNPVLIGEPGVGKTAVVEGLAQAIVKGEVPETLKD
KHLYTLDLGALVAGSRYRGDFEERLKKVLKEIRTRGDIILFIDELHTLVGAGAAEGAIDAASILKPMLARGELQTIGATT
LDEYRKHLEKDAALERRFQPIQVAEPSLPHTIEILKGLRDRYEAHHRVSITDEALVQAATLADRYISDRFLPDKAIDLID
EAGSRMRIRRMTAPPDLREFDEKIAGVRRDKESAIDSQDFEKAASLRDKEKQLLAAKAKREKEWKAGDMDVVAEVDGELI
AEVLATATGIPVFKLTEEESSRLLRMEDELHKRVIGQKDAVKALSKAIRRTRAGLKDPKRPGGSFIFAGPSGVGKTELSK
ALAEFLFGDEDALISLDMSEFSEKHTVSRLFGSPPGYVGYEEGGQLTEKVRRKPFSVVLFDEVEKAHPDIFNSLLQILED
GRLTDSQGRVVDFKNTVIIMTTNLGTRDISKGFNLGFAAAGDTKSNYERMKNKVQDELKQHFRPEFLNRVDDVVVFPQLS
QDDILQIVDLMIQKVDERLKDRDMGIELSQSAKELLSKRGYDPVLGARPLRRTIQREVEDSLSEKILFGELRPGHIVVVD
TEGEGDAATFTFRGEEKSTLPDVPPIEQAAGGAGPNLSKEA

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
clpC	YP_005163377.1	ATP-dependent Clp protease ATP-binding subunit	Not tested	Not named	Protein	0.0	75

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
SCE94.24c	NP_627581.1	Clp-family ATP-binding protease	VFG0079	Protein	0.0	62
SCE94.24c	NP_627581.1	Clp-family ATP-binding protease	VFG0080	Protein	6e-152	52