Gene Information

Name : RHECIAT_PC0000937 (RHECIAT_PC0000937)
Accession : YP_001985557.1
Strain :
Genome accession: NC_010997
Putative virulence/resistance : Virulence
Product : putative ATP-dependent Clp protease
Function : -
COG functional category : O : Posttranslational modification, protein turnover, chaperones
COG ID : COG0542
EC number : -
Position : 1027753 - 1030485 bp
Length : 2733 bp
Strand : -
Note : ypc00530

DNA sequence :

ATGCAGCAGAACGTGTCTTCTCACAGCTTCAAACGTAAGGAACTCGTCGGCAAGCTCGATCCAATCTGTCTGCGTGCATT
CAGGGCGGCAGCCGACGCCGCCAAGCTTCGCGGCAATCCCTATGTCGAACTCGTGCATTGGATCGAGCAACTGGCGCTGG
TCGACCGAGCGGATTTCCAGCTGATCCTCGCCGATGCCGGCGTGGATCTCGGCCGCCTTGCAGCCGACATGGCGCGGTCG
ATCGACAAGCTGCCCTATGGCGCGACGTCTATTGAAGAGTTCTCAGACCACATATTCCACGCTGTCCAGGAGGCCTGGAG
TCTCGGAAGTCTTCAATTCGGCTCGGAAGAGGTGCGCGGCGCTTACGTCCTTCTGGCCTGTAGAAAGGTGCCGGTGCTTG
ATGGCTTGCTGTTGAAGATCAGCAGTGAGTTCGACCGGATCGAAGCCGATTCCGTCCTTGCTCGCCTCGACGACGTACTC
TCGCAATCGCTTGAGAATAGAGGCCGGCGCGAAGCTGGACAACCGGTGCGAAAGGAACGACCGGCTGGCGGCGAGTCCGC
TTTGGCCAAATATGCGACTGATCTGACGAGCCGTGCTCGAGAAGGAAAGATCGATCCGGTTGTCGGTCGCGATCCGGAAA
TTCGCCAGATTGTCGATATCCTCATGCGCCGACGGCAGAACAACCCGATCCTGACGGGCGAGGCCGGGGTCGGCAAGACC
GCGGTCGTTGAAGGCTTTGCGCTTCGCCTTGTTGCAGAGGACGTGCCGCCGCCACTCAAAGGGGTCGCGCTCCACATGCT
GGATGTTGGCCTGATGCAGGCCGGAGCGAGCGTCAAAGGCGAGTTCGAAAAGCGCCTCAAGATGGTGATTGACGAGGTGC
AGTCATCGGAAACGCCGATCATCCTCTTCATCGACGAAGCGCATACGCTGATCGGAGCGGGTGGGGCTGCTGGAACGGGA
GACGCCGCAAATCTTTTGAAGCCAGCATTGGCGCGCGGCGAGCTTCGCACAATCGCCGCCACGACATGGGCGGAGTATAA
ACAGCACATCGAAAAAGATCCGGCGCTGACTCGGCGCTTCCAAGTGGTCAAGATCGAGGAACCCAGCGAAGAAAGCGCCG
TTCTCATGCTGCGTGGCGTGGCGGGCACGCTCGAGAAACATCATCAGGTTCAGATCCTCGACGAGGCGATCGAAACGGCG
GTCAGCCTTTCACATCGTTACATTCCGGCCCGCCAGTTGCCCGACAAGGCAGTCAGCTTGCTCGATACCGCTTGCGCGCG
CGTGGCGGTATCTCAGCACGCAACGCCGGCCGAGGTTGAAGATCTTCTGCGACGCAAGCAGGCTCTCGAGATCGAGCAGG
GGATTATCGGCCGCGAAAGGTCGATCGGCATCGAGGTTGCGGAGCGTCAAGCTCGCGTCGACAACGCCCTTGGCGAGGTG
GAGACGACCCTAGCGGAGGCGCAAGCCCGCTGGGAAAAGGAACGTTCGCTGGTGTCTGATATTCTCGACCTGCGGGCCAG
GCTGCGCAGCGAGGGAGTTCCTCTCGATGCGGCGTTGTCGCAACAGGGCGCTACCGCGCCCAATCCGACGGTCGCCGACG
AAAATTCCTCAGCGACCCGGGAAGGCGAAAAAGAAGCTCCCGATGGAAATGCCGACCTTGCGCGCCTTAAGGCGATAACG
CAGGAACTCGCCGAAATGCAGGGCGAAACGCCATTGATGCTGCTGTCGGTAGACCGCAATGCTGTCGCCTCGGTGGTAAA
GGATTGGACCGGTATCCCCGTCGGGCGAATGCTCGCCGGCCAGACGGAAAGAGCGCTCAAGCTCGCCGGAATTCTCGGCG
AACGCGTTGTCGGCCAGGACCTTGCCATGGAAGCGATCGCACGCCGCGTCCGGACCAGCCGCGCGGGACTGGGGTCGCCG
GAAAAGCCGGTCGGCGTTTTCCTGCTTTGTGGACCGTCCGGTGTCGGCAAGACGGAAACGGCGCTTGCCCTTGCCGAAGC
ATTATACGGCGGCGAACAGAACCTGATCTCCATCAACATGTCGGAATTTCAGGAAGCCCATACGGTTTCGACGCTGAAGG
GAGCACCCCCCGGCTATGTCGGTTATGGCAAGGGAGGTATTCTGACCGAGGCCGTGCGCCGCAGGCCCTATTCCGTCATA
TTGCTCGACGAGGTCGAAAAAGCGCATCCCGATGTCCACGAGATTTTCTTTCAGGTCTTCGACAAGGGAATGATGGACGA
CAGTGAGGGTCGACGGATTGATTTTAGGAATACACTTATTTTGCTGACCTCCAATGTCGGTTCGGATGTCATCATGAGGC
TGACCGGCAACGGGGTCTCCCGCACGCCGACCGAAGAACTCGAAGCTGCATTGCGCACACCGTTGCTGCAGGTGTTCCCC
GCCGCCTTCCTCGGGCGCGTCATCGTTGTGCCCTATTATCCTCTCTCGGATTCCATGATCGAAGCAATCGCTCAGGCAAA
TTTTGCGAAGATCGCGCAGCGGCTGCGTAGGAGCCATAACGCCGAACTGATCATAGGCGAGGGCGTTATCGACTTGGTCA
AGGCGCGCTGCACTGAAGTGGAGTCGGGCGGTCGCATGATCGATGCGATCTTGACCAACACGCTTCTGCCGGCCCTCAGC
ACCGGCATATTGAACTGGGCGCTGGATGGCAGACGCCTGACGAAGGCGACGGTCGGAGCATCTGCGGAAGGCTTCACCTA
CGCTTTTGAATAG

Protein sequence :

MQQNVSSHSFKRKELVGKLDPICLRAFRAAADAAKLRGNPYVELVHWIEQLALVDRADFQLILADAGVDLGRLAADMARS
IDKLPYGATSIEEFSDHIFHAVQEAWSLGSLQFGSEEVRGAYVLLACRKVPVLDGLLLKISSEFDRIEADSVLARLDDVL
SQSLENRGRREAGQPVRKERPAGGESALAKYATDLTSRAREGKIDPVVGRDPEIRQIVDILMRRRQNNPILTGEAGVGKT
AVVEGFALRLVAEDVPPPLKGVALHMLDVGLMQAGASVKGEFEKRLKMVIDEVQSSETPIILFIDEAHTLIGAGGAAGTG
DAANLLKPALARGELRTIAATTWAEYKQHIEKDPALTRRFQVVKIEEPSEESAVLMLRGVAGTLEKHHQVQILDEAIETA
VSLSHRYIPARQLPDKAVSLLDTACARVAVSQHATPAEVEDLLRRKQALEIEQGIIGRERSIGIEVAERQARVDNALGEV
ETTLAEAQARWEKERSLVSDILDLRARLRSEGVPLDAALSQQGATAPNPTVADENSSATREGEKEAPDGNADLARLKAIT
QELAEMQGETPLMLLSVDRNAVASVVKDWTGIPVGRMLAGQTERALKLAGILGERVVGQDLAMEAIARRVRTSRAGLGSP
EKPVGVFLLCGPSGVGKTETALALAEALYGGEQNLISINMSEFQEAHTVSTLKGAPPGYVGYGKGGILTEAVRRRPYSVI
LLDEVEKAHPDVHEIFFQVFDKGMMDDSEGRRIDFRNTLILLTSNVGSDVIMRLTGNGVSRTPTEELEAALRTPLLQVFP
AAFLGRVIVVPYYPLSDSMIEAIAQANFAKIAQRLRRSHNAELIIGEGVIDLVKARCTEVESGGRMIDAILTNTLLPALS
TGILNWALDGRRLTKATVGASAEGFTYAFE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
STY0294	NP_454876.1	ClpB-like protein	Not tested	SPI-6	Protein	8e-166	49
aec27	AAQ96721.1	Aec27	Not tested	AGI-1	Protein	5e-132	46
aec27	YP_851418.1	ATPase	Not tested	PAI II APEC-O1	Protein	7e-132	46

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
RHECIAT_PC0000937	YP_001985557.1	putative ATP-dependent Clp protease	VFG2076	Protein	0.0	58
RHECIAT_PC0000937	YP_001985557.1	putative ATP-dependent Clp protease	VFG2084	Protein	6e-135	42