Gene Information

Name : YpsIP31758_1362 (YpsIP31758_1362)
Accession : YP_001400341.1
Strain : Yersinia pseudotuberculosis IP 31758
Genome accession: NC_009708
Putative virulence/resistance : Virulence
Product : Clp protease-associated protein ClpB
Function : -
COG functional category : O : Posttranslational modification, protein turnover, chaperones
COG ID : COG0542
EC number : -
Position : 1595191 - 1597848 bp
Length : 2658 bp
Strand : +
Note : identified by similarity to GB:AAG00524.1; match to protein family HMM PF00004; match to protein family HMM PF02861; match to protein family HMM PF07724; match to protein family HMM PF07728; match to protein family HMM TIGR03345

DNA sequence :

GTGGCTATTACAAGGAAACATCTCTTCGGCAAGCTGGACGCCACTCTTTTCAAAGGTATTGAAAGCGCAACAACGATTTG
TAAATTACGCGGCAATCCTTACGTAGAGTTAGTTCACTGGTTGAATCAGCTTTGGCATCAGGAAGATAACGACCTTAAGC
AGATTATTCGGTATTTTGCGGTGGATGTGGATGCCTTTGAGCGTGAGCTGGCTCAGGCACTTGCGAAGTTACCTGTCGGG
GCAACTAGCATTTCAGATTTTTCGTATCATATTGAGTTGGCCACGGAACGGGCTTGGATCTATGCCAGCCTGGAGTGTTT
AGATACCCGTATCCGGAGTGGACACCTGCTGCTTGCGCTATTAACAACAATGGAACTGCGGAGAGCTTTCTTTGCGATTG
CGCCAAGCATGGAAAAAATTCCATTAGAGCATTTAAGCAAAGATTTGAACTTCATTACGCAGGCATCACCAGAAGCGAAT
GAAGCAGCCAGTGATGGCAGCCCGTTGTACGATGGAGCTTTACCTGGCGAAGCCAGTAATGCCATCGGTGCGGCAAAAAG
TGGTGGCACACTGGCTCAATACACCACAGACCTCACGGCATTAGCACGTGAAGGCAAGATAGATCCGGTATTGGGACGTA
ATCACGAAATCAACACAATGGTTGATATTCTCTTGCGCCGTCGGCAGAACAACCCATTACTGACCGGTGACGCAGGGGTG
GGTAAAACCGCCATTGTTGAAGGGCTAGCATTGGCCATTGCTGCAGGCTCAATGCCGCCAGCATTAAGCCAGGTAAGCCT
GTTGTCATTAGATATTGTGGCGCTCTCAGCGGGTGCCAGCATGAAAGGTGAATTTGAAGCGCGCCTGAAGAGTGTCTTGG
ATGAAGCGATAGCGGCAGAAAAGCCCGTTATTTTGTTTATCGATGAAGTTCACACACTTATTGGCGCGGGTGGCAATGCC
GGGACCGGCGATGCGGCGAACTTATTGAAACCTGCATTGGCGCGTGGCCAATTACGTACCATTGGTGCGACAACGTGGAG
CGAGTTCAAGCGTCACATTGAGAAGGATCCGGCACTCACCCGTCGTTTCCAAGTACTTCAAGTTGATGAGCCCGATGAGA
ACACGGCGATCTCCATGTTACGGGGCCTGATACCTGCGCTAGAAAAGCACCATGGCGTGTGGATTATGGACGAAGCCTTA
CAGGCGGCAGTACGGTTGTCTCATCGTTATATCCCTGCGCGTCAGTTGCCGGATAAAGCGATAAGTCTGCTTGATACGGC
TTGTGCCCGGATCGCTGTTGCACAGCATTCACAACCAATAGAGTTGCAGCACTTAACCTTCCAGAGTGAGACCGCGCAAA
CTGAGCTGGTTTCCTTAGAGAAAGCGCGGCACTTTGGTAAAGCGCAGGATGCGCGTACTGAGCAGTTGAAAACATCCATT
GCTGAACATGGCGAGGCTGCAGATAAACTTGATCAGCGTTGGCAGGCAGAACGCGAGTTGGTATCAGCGATTACGACCAT
AAGAACCGCACTTTATGACTTGGTTTCTCAGCCAGAGCCTGATGAGGAAAAACGTCGGGCTTATCAAGCGCAATTAGTCC
AGTTGGAAGCGCAGCTTTCTCAGGTTCGCACTTCACTGCCGTTAGTGCAGACAGAAGTCAACGCTGAAGTGATCGCCAGT
ATCGTTGCAGATTGGACCGGCATCCCGGTTGGGCAAATGCTCAAAGACGATATTCGGGCGGTAATGGAGTTGCCACAGCG
CCTTGAAGCACGTGTTATTGGTCAGCCCCATGCATTGATGCAACTGGGTGAGAATATTATGACCGCACGCGCCGGTCTGT
CAGACCCAAGGAAACCATTGGGGGTCTTTATGTTAGTGGGGCCTTCAGGTGTGGGTAAAACAGAGACGGCCTTAGCGATT
GCCGAGAGCATGTATGGTGGTGAACAGAATATGATCACTATCAATATGAGCGAATATCAGGAATCGCATACCGTTTCCTC
TTTAAAAGGTTCTCCACCGGGATATGTTGGATACGGTGAAGGCGGTGTATTAACGGAAGCCGTGCGCCGTAAGCCATATA
GTGTTGTGTTATTAGATGAAATCGAAAAAGCGCACTCTGATGTACATGAATTATTCTTCCAAGTGTTTGATAAAGGCCAA
ATGGAAGATGGTGAAGGGCGCTTTATCGATTTCAAAAACACTATTTTGCTGTTAACCAGTAATGTGGGCAGCGAGTTACT
GAGTAACTTATTAGCTGATCCAGATACTGCACCGGATCAGGATGGAATATTAACTGCGTTGCAACCTGAATTGCTGAAAG
TTTTCCCAGCAGCATTTTTAGGGCGAGTCACGGTTATTCCTTATCTTCCGTTACAGCAAGATGCATTGCAGCATATTGTA
CGGTTACATCTTGACCGGATTGGCGCTCGTTTATACTCGCAGCATCAATTGACACTGAAATACAGTGATGAAGTGGTTGA
CGATGTTGTTAGTCGCTGTGCGGTCTCAGAGACCGGTGCGCGTATGCTGATCCGTTACATTGAACAAAATATTACGCCAA
AAATAGGTAAATATATTTTAGGTGATAGTGATGTGAAGCCTGAGCAAATTATTTTCGTTCATAAAAATGAAAATGGATTC
GTGATCGCTTTACAATGA

Protein sequence :

MAITRKHLFGKLDATLFKGIESATTICKLRGNPYVELVHWLNQLWHQEDNDLKQIIRYFAVDVDAFERELAQALAKLPVG
ATSISDFSYHIELATERAWIYASLECLDTRIRSGHLLLALLTTMELRRAFFAIAPSMEKIPLEHLSKDLNFITQASPEAN
EAASDGSPLYDGALPGEASNAIGAAKSGGTLAQYTTDLTALAREGKIDPVLGRNHEINTMVDILLRRRQNNPLLTGDAGV
GKTAIVEGLALAIAAGSMPPALSQVSLLSLDIVALSAGASMKGEFEARLKSVLDEAIAAEKPVILFIDEVHTLIGAGGNA
GTGDAANLLKPALARGQLRTIGATTWSEFKRHIEKDPALTRRFQVLQVDEPDENTAISMLRGLIPALEKHHGVWIMDEAL
QAAVRLSHRYIPARQLPDKAISLLDTACARIAVAQHSQPIELQHLTFQSETAQTELVSLEKARHFGKAQDARTEQLKTSI
AEHGEAADKLDQRWQAERELVSAITTIRTALYDLVSQPEPDEEKRRAYQAQLVQLEAQLSQVRTSLPLVQTEVNAEVIAS
IVADWTGIPVGQMLKDDIRAVMELPQRLEARVIGQPHALMQLGENIMTARAGLSDPRKPLGVFMLVGPSGVGKTETALAI
AESMYGGEQNMITINMSEYQESHTVSSLKGSPPGYVGYGEGGVLTEAVRRKPYSVVLLDEIEKAHSDVHELFFQVFDKGQ
MEDGEGRFIDFKNTILLLTSNVGSELLSNLLADPDTAPDQDGILTALQPELLKVFPAAFLGRVTVIPYLPLQQDALQHIV
RLHLDRIGARLYSQHQLTLKYSDEVVDDVVSRCAVSETGARMLIRYIEQNITPKIGKYILGDSDVKPEQIIFVHKNENGF
VIALQ

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
STY0294	NP_454876.1	ClpB-like protein	Not tested	SPI-6	Protein	0.0	59
aec27	YP_851418.1	ATPase	Not tested	PAI II APEC-O1	Protein	3e-130	46
aec27	AAQ96721.1	Aec27	Not tested	AGI-1	Protein	3e-130	46

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
YpsIP31758_1362	YP_001400341.1	Clp protease-associated protein ClpB	VFG2076	Protein	0.0	55
YpsIP31758_1362	YP_001400341.1	Clp protease-associated protein ClpB	VFG2084	Protein	1e-138	44