Gene Information

Name : clpV (SeHA_C0310)
Accession : YP_002044255.1
Strain : Salmonella enterica SL476
Genome accession: NC_011083
Putative virulence/resistance : Virulence
Product : type VI secretion ATPase, ClpV1 family
Function : -
COG functional category : O : Posttranslational modification, protein turnover, chaperones
COG ID : COG0542
EC number : -
Position : 318961 - 321600 bp
Length : 2640 bp
Strand : +
Note : identified by match to protein family HMM PF00004; match to protein family HMM PF07724; match to protein family HMM PF07728; match to protein family HMM TIGR03345

DNA sequence :

ATGGAAACTCCTGTTTCACGCAGTGCGTTGTATGGAAAACTGGCCGGCCCACTATTCCGGTCGCTGGAATCGGCAACGGC
ATTTTGCAAACTACGCTCTAATCCCTGGGTTGAGCTGACTCACTGGCTGCACCAGTTAACACAGCAGCCCGATAACGATA
TTCTCCACGTTCTTCGGCATTACCAGATCCCTCTTTCTGATGTGGAGAAAGCGTTACTCCGGCAACTGGATATGCTGCCC
GCCGGGGCCAGCGCCATTAGTGATTTTTCTCACCATATCGATCTCAGCGTTGAAAAGGCCTGGATGCTGGCGAGCGTCCG
TTACGGCGATAACAAAATTCGCAGCGGCTGGTTGCTGCTGGCCTTGTTGACCACGCCAGAACTGCGTCGGGTACTGAGCA
GTATCTGCGCGCCGCTGGCCACGCTTCCGGTTGATGAACTGACGGAAATACTGCCCTCGTTGATCGAAACATCGCCGGAA
GCGCAGGAGCGCCCTTACGACGGCTCCGGCCTGGCATCAGCCATTCCCGGTGAAAGCAGTCAGGCGATTCCCAACGGCGG
GCAGGACGGTAAATCCGCGCTGGCAAAATACTGTCAGGACATGACGGCACAGGCGCGCGACGGCAAAATCGACCCGGTGA
CGGGGCGTGAGCATGAAATCCGCACCATGACGGATATTCTGCTGCGCCGTCGCCAGAATAATCCACTACTGACTGGTGAG
GCGGGCGTCGGGAAAACGGCGGTCGTCGAAGGTTTTGCCCTCGCGATTGCGCAGGGGGAAGTGCCGCCCGCGCTGCGGGA
AGTACGGCTACTGGCGCTGGACGTTGGCGCTCTGTTGGCCGGAGCCAGCATGAAAGGCGAGTTTGAATCGCGTCTGAAAG
GGTTACTGGAAGAGGCCGGGCGCTCGCCGCAGCCGGTTATTCTGTTTGTCGATGAAGTTCACACTCTGGTGGGCGCGGGC
GGCGCATCCGGCACGGGCGATGCCGCTAACCTGCTGAAACCGGCGCTGGCGCGCGGCACCCTGCGGACTATCGGCGCCAC
CACCTGGAGCGAATACAAGCGCCATATTGAGAAAGATCCGGCGCTGACCCGGCGTTTTCAGGTGTTGCAGATTGCCGAAC
CGGAAGAGATCCCCGCAATGGAAATGGTGCGTGGTCTGGTGGATACGCTGGAAAAACACCATAACGTACTGATTCTGGAT
GAGGCGGTACGTGCGGCGGTACAGCTTTCTCACCGCTACATTCCCGCCCGGCAGTTGCCGGATAAGGCCATCAGCCTGCT
GGATACCGCCGCGGCCCGCGTGGCGCTGACGCTGCACACGCCGCCTGCCAGCGTACAGTTCCTGCGCCAGCAGCTAAAAG
CGGCGGAAATGGAACGGTCGCTGTTGCAGAAGCAGGAAAAAATGGGGATTCAGTCAGATGAGCGGCGCGATGCGCTGACG
GCGCGAATTTTCTCGCTCAACAATGAACTGACTGCATCCGAATCTCGCTGGCAGCGGGAGCTGGAACTGGTACATACGTT
GCAGGAACTGCGTGTCGCAGAGTCTGATGCTGATGACAAAACCACGCTGCAACAGGCCGAAACGGCGCTAAGGGAGTGGC
AGGGCGACGCGCCGGTGGTGTTCCCGGAAGTCAGCGCGGCGGTTGTCGCGGCGATTGTCGCCGACTGGACCGGTATTCCT
GCCGGGCGCATGGTGAAAGATGAGGCCAGCCAGGTGCTGGAACTGCCTGCCCGACTGGCGCAACGCGTTACCGGGCAAGA
CGGCGCGCTGGCGCAGATTGGTGAACGTATTCAGACCGCCAGGGCGGGACTGGGCGATCCACGCAAACCGGTGGGCGTGT
TTATGCTGGCCGGGCCGTCCGGTGTCGGTAAAACCGAAACCGCGCTGGCGCTGGCGGAGGCTATCTACGGCGGTGAGCAG
AACCTGGTAACCATCAATATGAGCGAGTTCCAGGAGGCTCACACCGTTTCCACGCTGAAAGGCGCGCCCCCCGGCTATGT
GGGCTATGGCGAGGGTGGTGTGCTGACGGAAGCAGTGCGTCGCCACCCCTGGAGCGTAGTGCTGCTCGACGAGATCGAAA
AAGCGCACCATGACGTCCATGAACTCTTCTATCAGGTGTTTGACAAGGGCGGGATGGAGGACGGTGAGGGAACACATGTC
GATTTCAAAAACACCACGCTATTACTCACCACCAACGTGGGTTCCGACCTCATCAGCCAGATGTGTGAAGATCCGGCCTT
AATGCCCGATGCTACGGGGCTTAAAGAGGCGCTAATGCCGGAATTGCGCAAGCATTTCCCGGCGGCATTTCTGGGCCGCG
TGACGGTGATCCCTTACCTGCCGCTGGATGAACCGTCGCGTGGCGTGATTGCCCGTCTGCACCTTGACCGGCTGGTGGCG
CGGATGGGTGAACAGCACGGCGTGACGCTGACGTATAGCGAGGAACTGGTCGCACATATTGTGGCGTGCTGTCCAATGCA
TGAAACGGGCGCGCGGTTGCTGATTGGCTACATCGAACAGCACATTCTGCCACGACTGTCGCGCTACTGGTTGCAGGCCA
TGACGGAAAAAGCCGCTATCAGGCAGATTGATATCGGCGTTAATGGTGATGAGCAGATTGTTTTTGAGATCGTTTGCTGA

Protein sequence :

METPVSRSALYGKLAGPLFRSLESATAFCKLRSNPWVELTHWLHQLTQQPDNDILHVLRHYQIPLSDVEKALLRQLDMLP
AGASAISDFSHHIDLSVEKAWMLASVRYGDNKIRSGWLLLALLTTPELRRVLSSICAPLATLPVDELTEILPSLIETSPE
AQERPYDGSGLASAIPGESSQAIPNGGQDGKSALAKYCQDMTAQARDGKIDPVTGREHEIRTMTDILLRRRQNNPLLTGE
AGVGKTAVVEGFALAIAQGEVPPALREVRLLALDVGALLAGASMKGEFESRLKGLLEEAGRSPQPVILFVDEVHTLVGAG
GASGTGDAANLLKPALARGTLRTIGATTWSEYKRHIEKDPALTRRFQVLQIAEPEEIPAMEMVRGLVDTLEKHHNVLILD
EAVRAAVQLSHRYIPARQLPDKAISLLDTAAARVALTLHTPPASVQFLRQQLKAAEMERSLLQKQEKMGIQSDERRDALT
ARIFSLNNELTASESRWQRELELVHTLQELRVAESDADDKTTLQQAETALREWQGDAPVVFPEVSAAVVAAIVADWTGIP
AGRMVKDEASQVLELPARLAQRVTGQDGALAQIGERIQTARAGLGDPRKPVGVFMLAGPSGVGKTETALALAEAIYGGEQ
NLVTINMSEFQEAHTVSTLKGAPPGYVGYGEGGVLTEAVRRHPWSVVLLDEIEKAHHDVHELFYQVFDKGGMEDGEGTHV
DFKNTTLLLTTNVGSDLISQMCEDPALMPDATGLKEALMPELRKHFPAAFLGRVTVIPYLPLDEPSRGVIARLHLDRLVA
RMGEQHGVTLTYSEELVAHIVACCPMHETGARLLIGYIEQHILPRLSRYWLQAMTEKAAIRQIDIGVNGDEQIVFEIVC

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
STY0294	NP_454876.1	ClpB-like protein	Not tested	SPI-6	Protein	0.0	99
aec27	YP_851418.1	ATPase	Not tested	PAI II APEC-O1	Protein	5e-113	42
aec27	AAQ96721.1	Aec27	Not tested	AGI-1	Protein	4e-113	42
clpC	YP_005163377.1	ATP-dependent Clp protease ATP-binding subunit	Not tested	Not named	Protein	5e-90	42

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
clpV	YP_002044255.1	type VI secretion ATPase, ClpV1 family	VFG2076	Protein	0.0	52
clpV	YP_002044255.1	type VI secretion ATPase, ClpV1 family	VFG2084	Protein	2e-126	42
clpV	YP_002044255.1	type VI secretion ATPase, ClpV1 family	VFG0079	Protein	2e-89	41