Gene Information

Name : clpB (ERGA_CDS_06620)
Accession : YP_196588.1
Strain : Ehrlichia ruminantium Gardel
Genome accession: NC_006831
Putative virulence/resistance : Virulence
Product : ClpB protein
Function : -
COG functional category : O : Posttranslational modification, protein turnover, chaperones
COG ID : COG0542
EC number : -
Position : 1045645 - 1048236 bp
Length : 2592 bp
Strand : -
Note : Similar to sp|P44403|CLPB_HAEIN sp|P03815|CLPB_ECOLI sp|O53719|CLPB_MYCTU sp|O83110|CLPB_TREPA sp|Q9RA63|CLPB_THETH sp|P03815|CLPB_ECOLI sp|P53533|CLPB_SYNP7 sp|O53719|CLPB_MYCTU sp|P44403|CLPB_HAEIN rc||clpB; Ortholog to ERWE_CDS_06710

DNA sequence :

ATGAAGTTAGTTATGGATTTAAATAAATTTACTGATATATCAAAGAATTTCATAGTGCAAGCGCAAACTTCAGCTGTTGC
ATTAGGGCATCAGTCTTTAGTACCTGAGCATTTGCTTAAGGTAATGTTGGATGATAAAGATGAGATAGTTGAAGTTTTGC
TTACTTCTTGTGGGTGTGATGTAGAGACGTTACGTAATGATGTGGTATCGGCTTTAAATAAATTACCAGTTGTAAGTGGT
CCAGGTAGTGGTCATATACATTTATCAAAGGAAATGGCGCAAGTTTTACAAGAGGCTGTTAATCTTGCAAAAAGACATCA
GGACTCTTATGTTACTGTCGAAAGATTACTGCAAGCTCTGACAATAATAAAGGACAGTAATGTTTCTAGGATATTAATTG
CACATGGTGTGACTCCTCAGAAGTTGGAATCATTAATAGTAAACATGCGTAATGGTGCTAAAGCTGATAGTGTAAATTCT
GAGCAAAGGTTTAATGCACTAAAAAAATATGCTAAAGATGTGACTGAAGTTGCTAGAGCAGGAAAATTAGATCCAGTAAT
TGGAAGAGATGAGGAAATTAGACGTACAATACAGGTATTATTGAGAAGAACAAAAAATAATCCTGTATTAATTGGAGAGC
CTGGTGTTGGTAAAACAGCAATTATTGAAGGGTTAGCACATAAGATAGTGAAGGGAGATGTTCCAATTGGATTGCGAGAT
ATGAGAATAATGTCATTAGATCTTGGTATGCTTGTTGCTGGGACTAAATATAGAGGTGAATTTGAAGAAAGGTTGAAAGC
TGTAGTTAATGAAATTGTTTCTTCAAATGGTAGTATTATATTATTCATTGATGAGTTGCATACATTAGTTGGTGCTGGTG
CAACAGATGGAGCAATGGATGCATCAAATTTGTTGAAGCCAGCATTAGCTAGAGGTGAAATACATTGTATAGGTGCAACA
ACATTGGATGAATATAGAAAGCATATAGAAAAAGATGTAGCACTTGCTAGAAGATTTCAAACTATATTTATTTCTGAGCC
AACTTGTGATGATACAATTTCTATGTTACGTGGGTTAAAAGAGAGATATGAAGGACATCATGGTATAGATATTCCTGACA
GATCAATAATTGCTGCTGTAGCTTTATCGCAGCGTTATATTACGGATAGGTATTTACCAGATAAAGCTATAGATCTTATT
GATGAAGCAGCAAGTCGTGCGAGAATGGAGATTGATAGTAAACCTGAGGTTATTGATAAGTTAGATAGAAAGATAATGCA
GCTAAAAATCGAGATAGGAGTATTAGAAAAAGAAAGTGATGAATCCTCAAAACAGAGGTTAATGAAGTTAAAAGATGAAC
TAGAAAAACTAAATGTTCAGTCTGCTGAGCTAAGTAGTAAATGGCAAGCGGAAAAAATGAAAATGTCAAAGATGAAAGCA
TGTAAGGAAAAGCTTGATATTGCTAGAAGTGATTTAGAAAGAGCACAAAGATCTGGTGATTTGGCAAAAGCTGGTGAGTT
AATGTATGGTGTAATACCAGAAATTGAAAAAGAGTTAAAAGAACATGAAAAATTTACAAGTAGCCTTTTTAAGAAGGAAA
TTACAGAACATGACATAGCAAGTATTGTATCAAAATGGACTGGTATTCCTATTGAGAACATAATGAGTAGTGAAAGAGAA
AAATTACTGCGTATGGAGGAGGAGATAGGCAAAACAGTTATTGGTCAGGATAGTGCTGTAAAAGCAGTAAGTGATGCTGT
CCGGAGATCACGTGCAGGGGTACAAGATGCACAGAAACCATTGGGGTCTTTTTTATTTCTTGGGCCAACTGGAGTAGGTA
AAACTGAGTTGGTTAAAACATTAGCTGAGTTTTTATTTTGTGATAAGTCTGCACTTTTAAGATTTGACATGTCAGAATTC
ATGGAAAAGCATGCTGTTTCACGATTAATAGGAGCTCCTCCAGGATATGTTGGATATGACCAAGGTGGTGCATTAACTGA
AGCTGTGAGAAGAAGGCCTTATCAAGTAATATTATTTGATGAAATTGAAAAAGCACATGGAGATATTTTCAATATTTTAT
TGCAAGTATTAGATGAAGGAAGATTGACTGATAATCATGGGAAGTTAGTGGATTTCCGTAATACAATACTGGTATTAACT
TCAAATTTAGGACAAGAAATATTAATGAACAATGAATCTGGAAATATCAATGAAGAGTCAGTTAAAGAGTCTATTACTAA
TGTGTTGCGTAGTCATTTTCGGCCAGAATTTTTAAATAGATTGGATGAAATTATTATATTCCATAGGTTAACTAAAGAAC
ATATTGAAAGAATTATTGATGTGCAATTTTCTATATTACAAAAAATTGTTGCTCAAAGAAAATTAGAGATTACTTTATCT
TCAGATGCAAAAACATGGTTGATAAATAATGGTTATGATTCCTTATATGGAGCAAGACCTTTAAAGAGGTTAATACAACA
GCAAATACAGAATAACTTGGCAAAGTTAATACTTGCTAATCAGGTAGCTGAGGGTAATAAATTAAGGGTAGATTTATTGG
ATGATAATCTTGTTATTCATAAGATTAGTTAA

Protein sequence :

MKLVMDLNKFTDISKNFIVQAQTSAVALGHQSLVPEHLLKVMLDDKDEIVEVLLTSCGCDVETLRNDVVSALNKLPVVSG
PGSGHIHLSKEMAQVLQEAVNLAKRHQDSYVTVERLLQALTIIKDSNVSRILIAHGVTPQKLESLIVNMRNGAKADSVNS
EQRFNALKKYAKDVTEVARAGKLDPVIGRDEEIRRTIQVLLRRTKNNPVLIGEPGVGKTAIIEGLAHKIVKGDVPIGLRD
MRIMSLDLGMLVAGTKYRGEFEERLKAVVNEIVSSNGSIILFIDELHTLVGAGATDGAMDASNLLKPALARGEIHCIGAT
TLDEYRKHIEKDVALARRFQTIFISEPTCDDTISMLRGLKERYEGHHGIDIPDRSIIAAVALSQRYITDRYLPDKAIDLI
DEAASRARMEIDSKPEVIDKLDRKIMQLKIEIGVLEKESDESSKQRLMKLKDELEKLNVQSAELSSKWQAEKMKMSKMKA
CKEKLDIARSDLERAQRSGDLAKAGELMYGVIPEIEKELKEHEKFTSSLFKKEITEHDIASIVSKWTGIPIENIMSSERE
KLLRMEEEIGKTVIGQDSAVKAVSDAVRRSRAGVQDAQKPLGSFLFLGPTGVGKTELVKTLAEFLFCDKSALLRFDMSEF
MEKHAVSRLIGAPPGYVGYDQGGALTEAVRRRPYQVILFDEIEKAHGDIFNILLQVLDEGRLTDNHGKLVDFRNTILVLT
SNLGQEILMNNESGNINEESVKESITNVLRSHFRPEFLNRLDEIIIFHRLTKEHIERIIDVQFSILQKIVAQRKLEITLS
SDAKTWLINNGYDSLYGARPLKRLIQQQIQNNLAKLILANQVAEGNKLRVDLLDDNLVIHKIS

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
clpC	YP_005163377.1	ATP-dependent Clp protease ATP-binding subunit	Not tested	Not named	Protein	8e-172	43
STY0294	NP_454876.1	ClpB-like protein	Not tested	SPI-6	Protein	9e-105	41

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
clpB	YP_196588.1	ClpB protein	VFG2076	Protein	2e-112	41