Gene Information

Name : Nhal_2318 (Nhal_2318)
Accession : YP_003527793.1
Strain : Nitrosococcus halophilus Nc 4
Genome accession: NC_013960
Putative virulence/resistance : Virulence
Product : ATP-dependent chaperone ClpB
Function : -
COG functional category : O : Posttranslational modification, protein turnover, chaperones
COG ID : COG0542
EC number : -
Position : 2389624 - 2392221 bp
Length : 2598 bp
Strand : +
Note : KEGG: noc:Noc_2381 ATP-dependent Clp protease; TIGRFAM: ATP-dependent chaperone ClpB; PFAM: ATPase AAA; ATPase AAA central domain protein; Torsin; ATPase associated with various cellular activities AAA_5; Clp domain protein; SMART: ATPase AAA

DNA sequence :

ATGCGACAGGACAAGTTAACCACCAAGTTTCAGGAGGCCCTGGCTGATGCCCAAAGCCTGGCTGTGGGGCAGGACCATCA
ATTTCTGGAACCGCTGCATGTAATGTTTGCCCTGCTAGAACAGCAAGGCGGGACCGCAGCCCCCTTATTGATGCAGGCAG
GAGTGAATGTCAACAATTTCCATGCCCAGCTCAGCGAGGCTCTGAAACGGCTTCCCCAAGTACAGGGCGTTCCGGGAGAG
ATACATATCTCTCAAGATTTGATGCGGTTGCTCAATGTGACCGATAAGCTGGCCCAGCAGCGCCATGATCAATATATCTC
CAGTGAATTATTCATGCTTGCCGCTGTGGAGGATAGGGGCCAGGTGGGCGAGTTGTTGCGTAAAAATGGCGCCACTAAGG
CGAGTATAGAGGCGGCTATCAATACCATCCGTGGGGGGCGACAAGTGAATGAACCGGGGGCCGAGGACCAACGCCAGGCC
CTAGAGCGCTATACCATCGATCTCACGGAGCGGGCCGAGCAGGGTAAATTAGATCCGGTCATTGGCCGTGATGATGAGAT
ACGCCGCACTATTCAGGTGCTGCAACGCCGGACTAAAAATAATCCCGTGCTGATTGGTGAACCGGGGGTGGGTAAAACTG
CCATTGTCGAGGGATTAGCCCAGCGTATTGTCAACAGCGAGGTCCCAGAAGGACTCAAGCATAGGCGTTTGCTTGCGCTG
GATATGGGGGCCCTGATTGCCGGTGCCAAGTTCCGGGGCGAGTTTGAGGAGCGCCTTAAGGCGGTGCTCAAGGACATCAG
CAAGGCAGAAGGGAATATTATTTTATTTATTGACGAACTCCATACAGTGGTGGGGGCGGGTAAGGCGGAAGGAGCCATGG
ATGCCAGTAACATGCTCAAACCGGCCTTGGCTCGCGGTGAACTTCACTGCATTGGGGCAACGACCCTGGATGAGTATCGT
CAATACATAGAAAAAGACGCGGCTTTGGAACGGCGTTTCCAAAAGGTGCTGGTGGATGAGCCAAGCTTAGAAGATACCAT
TGCTATCCTGCGGGGCTTGAATGAGCGCTATGAAGTCCATCATGGGGTGGAGATCACCGATCCTGCCATTGTGGCGGCAG
CCACTTTATCCCACCGTTATATTACCGATCGCAAACTTCCAGACAAGGCCATTGATCTCATCGACGAGGCTGCCAGCCGC
ATTCGGATGGAGATCGATTCCAAGCCGGAGCCCATGGACCGGATGGAAAGACGCTTGGTTCAATTGAAAATTGAGCGGGA
AGCTTTACGGAAGGAAACTGACGAAGCCTCTAAAAAGCGTCTGGAGACTTTGGAAACCGAGATTAACCATTTGGAAAAAG
AATATGCCGATCTAGAAGAGATTTGGAAGGCGGAGAAAGCCGCCCTAAGCGGTGCCCAGGGGATCAAGGAAAAACTGGAA
CAGGCTCGATTGGAGCTGGACTCCGCCCGCCGTGCCGGAGATTTAACTCGGATGTCGGAGTTACAGTATGGCCAGATCCC
GGAACTCCAAAAACAGCTCGATGCGGCCACCGCGGCTGAACAGCAGGATTTTAAATTACTGCGCAACAAGGTGACTGAGG
AAGAAATTGCCGAGGTGGTTTCCAAATGGACGGGAATTCCGGTTTCCAAAATGCTGGAAGGAGAGCGGGAGAAATTATTA
AAAATGGAAGAGGCGTTGCATCGGCGAGTGGTGGGCCAGGAAGAAGCCATCGAAGTGGTAAGTAACGCGATTCGCCGTTC
CCGGGCCGGGCTAGCTGATCCTAACCGGCCGAATGGTTCCTTCCTCTTTCTCGGGCCTACGGGGGTAGGAAAGACTGAGC
TTTGTAAGGCCCTGGCGGCTTTCTTGTTTGATACGGAGGAAGCCATGGTTCGCATCGACATGTCCGAGTTTATGGAGAGG
CACTCCGTGGCCCGGCTCATCGGGGCTCCTCCCGGTTATGTGGGGTTTGAAGAGGGGGGCTACCTCACCGAGGCGGTACG
CCGCAAGCCCTATTCGGTCATCTTGCTCGACGAGGTGGAGAAGGCCCACCCGGATGTATTTAATATTTTGCTCCAAGTTT
TGGATGATGGACGGCTGACAGATGGCCACGGTCGCACGGTAGATTTTCGCAATACAGTGGTGGTCATGACTTCTAACCTC
GGTTCCCATGTGATTCAGGAAATGGCCGGGGAGGAACATTACCAGGAAATGAAAAATGCGGTAATGGAGATTGTCGGGCA
GCATTTCCGTCCGGAATTTATTAACCGAGTGGACGATGTGGTGGTGTTCCATCCCCTGTTGAAAGGGCAGATCCGGGCGA
TTGCCAAACTTCAGATTGGCCATCTCCAGCAGCGACTGCGAGAGCGGGATATGGATTTAGCCGTGTCCGAAACTGCTCTG
GATAAATTGGCAGAAGTGGGTTTCGATCCGGTTTATGGAGCTAGGCCCCTCAAGCGGGCGATTCAGCAACAAATCGAGAA
CCCCCTAGCCCAGGAAATCCTAGGGGGAAAATTTGAGCCTGGGGATCTGATTGAAGTGGGAGTTGAAGGCGAACATTTCG
TTTTCGAGCGCAAAGCAAGGGCAGCTTCTGCCGCCTAG

Protein sequence :

MRQDKLTTKFQEALADAQSLAVGQDHQFLEPLHVMFALLEQQGGTAAPLLMQAGVNVNNFHAQLSEALKRLPQVQGVPGE
IHISQDLMRLLNVTDKLAQQRHDQYISSELFMLAAVEDRGQVGELLRKNGATKASIEAAINTIRGGRQVNEPGAEDQRQA
LERYTIDLTERAEQGKLDPVIGRDDEIRRTIQVLQRRTKNNPVLIGEPGVGKTAIVEGLAQRIVNSEVPEGLKHRRLLAL
DMGALIAGAKFRGEFEERLKAVLKDISKAEGNIILFIDELHTVVGAGKAEGAMDASNMLKPALARGELHCIGATTLDEYR
QYIEKDAALERRFQKVLVDEPSLEDTIAILRGLNERYEVHHGVEITDPAIVAAATLSHRYITDRKLPDKAIDLIDEAASR
IRMEIDSKPEPMDRMERRLVQLKIEREALRKETDEASKKRLETLETEINHLEKEYADLEEIWKAEKAALSGAQGIKEKLE
QARLELDSARRAGDLTRMSELQYGQIPELQKQLDAATAAEQQDFKLLRNKVTEEEIAEVVSKWTGIPVSKMLEGEREKLL
KMEEALHRRVVGQEEAIEVVSNAIRRSRAGLADPNRPNGSFLFLGPTGVGKTELCKALAAFLFDTEEAMVRIDMSEFMER
HSVARLIGAPPGYVGFEEGGYLTEAVRRKPYSVILLDEVEKAHPDVFNILLQVLDDGRLTDGHGRTVDFRNTVVVMTSNL
GSHVIQEMAGEEHYQEMKNAVMEIVGQHFRPEFINRVDDVVVFHPLLKGQIRAIAKLQIGHLQQRLRERDMDLAVSETAL
DKLAEVGFDPVYGARPLKRAIQQQIENPLAQEILGGKFEPGDLIEVGVEGEHFVFERKARAASAA

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
clpC	YP_005163377.1	ATP-dependent Clp protease ATP-binding subunit	Not tested	Not named	Protein	1e-174	44
STY0294	NP_454876.1	ClpB-like protein	Not tested	SPI-6	Protein	3e-108	42
aec27	YP_851418.1	ATPase	Not tested	PAI II APEC-O1	Protein	2e-106	42
aec27	AAQ96721.1	Aec27	Not tested	AGI-1	Protein	1e-106	42

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
Nhal_2318	YP_003527793.1	ATP-dependent chaperone ClpB	VFG2076	Protein	4e-121	44