Gene Information

Name : yghJ (E2348C_3253)
Accession : YP_002330723.1
Strain : Escherichia coli E2348/69
Genome accession: NC_011601
Putative virulence/resistance : Virulence
Product : inner membrane lipoprotein
Function : -
COG functional category : M : Cell wall/membrane/envelope biogenesis
COG ID : COG0810
EC number : -
Position : 3380138 - 3384712 bp
Length : 4575 bp
Strand : -
Note : -

DNA sequence :

ATGAATAAGAAATTTAAATATAAGAAATCGCTTTTAGCGGCTATTTTGAGCGCAACCCTGTTAGCCGGTTGTGATGGCGG
TGGTTCCGGACCTTCCTCCGACACGCCGCCTGTAGATTCTGGAACAGGGTCTTTGCCGGAAGTGAAACCTGATCCAACAC
CAAACCCGGAGCCGACGCCTGAGCCAACGCCGGACCCAGAACCTACGCCGGATCCGACACCTGATCCAGAGCCAACACCA
GAACCGGAGCCAGAACCTGTTCCTACGAAAACCGGTTATCTGACCCTGGGCGGAAGCCAGCGGATAACTGGTGCTACTTG
TAATGGTGAATCCAGCGATGGCTTTACCTTTACGCCAGGCGACAAAGTCACCTGTGTGGCAGGGAACAACACGACAATTG
CTACCTTCGACACCCAGTCAGAAGCTGCGCGTAGCCTGCGTGCGGTTGAAAAAGTGTCGTTTAGTCTTGAGGACGCGCAA
GAACTGGCGGCTTCCGATGACAAGAAAAGCAATGCGGTTTCGCTGGTAACGTCCAGTAACAGCTGTCCGGCGGATACAGA
ACAGGTTTGCCTGACGTTCTCCTCGGTGATCGAGAGTAAACGTTTCGACTCGCTGTATAAGCAAATCGATCTGGCACCGG
AAGAGTTCAAAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCCGCGACCGATAAAGCGCCATCCACTCATACTTCACCG
GTCGTGCCCGTCACCACTCCGGGAACAAAACCGGATCTGAACGCTTCCTTCGTGTCGGCTAACGCGGAACAGTTTTATCA
GTATCAACCTACGGAAATCATTCTCTCTGAAGGCCGACTGGTAGATAGCCAGGGATATGGTGTTGCTGGCGTCAACTACT
ACACCAATTCAGGCCGTGGCGTGACAGGGGAAAATGGTGAATTTTCCTTTAGCTGGGGCGAAACCATCTCCTTTGGTATC
GATACCTTTGAACTGGGTTCAGTGCGCGGCAATAAGTCGACCATTGCATTGACTGAACTGGGTGATGAAGTTCGCGGGGC
GAATATCGATCAGCTTATTCATCGCTATTCGACGACCGGGCAAAATAATACCCGTGTTGTTCCGGACGATGTACGCAAGG
TCTTTGCCGAATATCCCAACGTGATCAACGAGATTATCAATCTCTCGTTATCCAATGGTGCGACGCTGGATGAAGGCGAT
CAAAACGTTGTGTTGCCTAACGAATTTATCGAGCAGTTTAAGACGGGTCAGGCCAAAGAGATCGATACCGCGATTTGTGC
GAAAACCGACGGTTGCAACGAGGCTCGCTGGTTCTCGCTGACAACGCGCAATGTTAATGACGGCCAGATTCAGGGCGTTA
TCAACAAGCTGTGGGGTGTGGATAAAGATTACAAATCAGTGACGAAATTCCACGTCTTCCATGACTCCACCAACTTCTAT
GGCAGTACCGGTAACGCGCGCGGTCAGGCGGTGGTAAATATCTCCAACGCGGCATTCCCGATTCTGATGGCGCGTAATGA
TAAAAACTACTGGCTGGCGTTTGGCGAAAAACGCGCCTGGGATAAAAATGAGCTGGCGTACATTACGGAAGCGCCTTCCA
TTGTGCAGCCAGAGAACGTTACGCGCGATACCGCCACCTTCAACCTGCCGTTTATTTCGCTGGGGCAAGTCGGTGAGGGC
AAACTGATGGTTATCGGTAACCCGCACTACAACAGCATTTTGCGTTGTCCGAACGGTTACAGCTGGAACGGGGGCGTTAA
TAAAGACGGGCAGTGTACGCTCAGCGGTGATTCAGATGACATGAAGCACTTCATGCAGAACGTACTGCGCTATCTGTCCG
ACGATAAATGGACGCCGGACGCGAAAGCCAGCATGACCGTAGGCACCAACCTGGATACTGTCTATTTCAAACGTCATGGT
CAGGTTACAGGAAACAGCGCTGAGTTCGGCTTTCATCCGGATTTTGCGGGTATCTCTGTTGAGCATTTAAGTAGCTATGG
CGATCTCGACCCGCAGGAAATGCCGCTGCTGATCCTCAACGGCTTTGAGTATGTGACTCAGGTTGGTAACGATCCTTATG
CAATCCCGCTGCGTGCAGATACCAGCAAACCGAAGCTGACTCAGCAGGATGTGACCGATCTGATCGCCTATCTGAACAAA
GGTGGATCGGTGCTGATCATGGAAAACGTGATGAGCAACCTTAAGGAAGAGAGTGCGTCTGGCTTTGTGCGTCTGTTGGA
TGCCGCGGGTCTGTCAATGGCGCTGAACAAGTCCGTGGTGAATACCGATCCGCAGGGGTACCCAAACCGCGTTCGCCAGC
AACGTGAAAAAGGTATCTGGGTTTATGAACGCTATCCTGCCGTAGATAGTGCTCAGCCGCCATATACCATCGATCCCGAT
ACCGGGAAGGTGACCTGGAAATATCAGGAAGAAGGCAAGCCTGATGATAAACCGAAACTGGAAGTTGCTAGCTGGCAGGA
AGACGTTGATGGTAAGCAGGTAACGCGTTATGCCTTTATTGATGAGGCAGAGCATTCAACAGAAGAATCTCTGGAAGCGG
CAAAGGCAAAAATCTTTGAGAAGTTTCCTGGGTTACAGGAGTGTAAGGACTCGACTTACCATTACGAGATTAACTGTTTG
GAGCGCCGCCCAGGCACGGATGTTCCGGTAACAGGTGGCATGTATGTTCCGCGCTATACGCAACTGAATCTTGACGCCGA
CACGGCAAAAGCGATGGTGCAGGCTGCGGATTTAGGCACCAACATTCAGCGTCTGTATCAGCATGAGCTCTACTTCCGGA
CCAATGGTCGCAAAGGTGAGCGTCTGAGCAGCGTCGATCTGGAACGTCTGTACCAGAACATGTCGGTCTGGTTGTGGAAT
AAAATTGAATATCGCTATGAAAACGACAAGGATGACGAGCTGGGCTTTAAAACGTTCACTGAGTTCCTGAATTGCTACGC
CAACAATGCCTATAGCGAAGGCACGCAGTGTTCTGCAGATCTGAAAAAATCGCTTGTCGATAACAACATGATCTACGGTG
ACGGTAGCAGCAAAGCAGGCATGATGAACCCGAGCTATCCGCTCAACTATATGGAAAAACCGCTGACGCGCCTGATGCTG
GGCCGTTCCTGGTGGGATCTGAACATCAAAGTTGATGTCGAGAAGTATCCGGGAGCGGTATCGGCAGAAGGTGAGAAGGT
TACTGAAACCATCAGCCTGTACTCGAATCCGACCAAATGGTTTGCGGGTAACATGCAGTCTACTGGCCTGTGGGCTCCGG
CTCAGCAAGAGGTCACCATTGAGTCTACTGCATCAGTTCCTGTGACTGTCACCGTGGCGCTGGCCGACGATCTGACCGGA
CGCGAGAAGCATGAAGTCGCGCTGAACCGTCCGCCAAAAGTGACGAAAACCTATGATCTGAAAGCCAATGATAAGGTGAC
CTTCAAGGTGCCTTACGGTGGTCTGATTTATATCAAGGGCAACAGCCCAAAGAATGAGTCAGCCGAATTCACCTTTACTG
GTGTGGTAAAAGCGCCGTTCTATAAAGACGGCGAATGGAAAAACGCTCTGAACTCCCCTGCGCCGTTGGGTGAGCTGGAG
TCAGATTCTTTCGTCTACACTGCACCGAAGAACAACCTGAACGCCAGCAATTACAGTAATTACACTGACGGCGTAGCAGA
ATTCGCTAAAGAACTGGATACCTTTGCCAGCTCGATGAATGACTTCTACGGTCGTGATGGCGAAAGTGGTAACCACCGGA
TGTTTACCTATAAGGCATTGACAGGTCACAAGCATCGTTTCGCCAACGATGTGCAGATCTCCATCGGTGATGCGCACTCG
GGTTATCCGGTAATGAACAGCAGCTTCTCGACGAACAGCACCACGCTGCCGACGACGCCGCTGAACGACTGGTTGATCTG
GCACGAAGTCGGTCATAACGCTGCAGAAACACCGCTGAACGTACCGGGTGCAACTGAAGTGGCGAACAACGTGCTGGCGC
TGTACATGCAGGATCGCTATCTCGGTAAGATGAACCGTGTCGCTGACGACATTACCGTCGCGCCGGAATATCTGGACGAG
AGCAACGGTCAGGCCTGGGCGCGCGGCGGTGCGGGTGACCGTCTGCTGATGTACGCACAGTTGAAGGAGTGGGCAGAGGA
AAACTTTGATATCAAACAGTGGTATCCAGATGGTGAGCTGCCTAAGTTCTACAGCGATCGTAAAGGGATGAAGGGCTGGA
ACCTGTTCCAGTTGATGCACCGTAAAGCGCGCGGCGATGATGTCAGCAATGACAAGTTTGGCGGCAGAAATTACTGTGCT
GAGTCAAACGGTAACGCAGCGGACACGCTGATGCTGTGTGCATCCTGGGTCGCTCAGGCGGATCTTTCGGAATTCTTTAA
GAAATGGAATCCGGGCGCAAATGCTTACCAGCTTCCGGGGGCAAGTGAGATGAGCTTCGAAGGCGGAGTGAGCCAGTCGG
CTTACAACACGCTCGCGGCGATGCACCTGTCGAAACCGGAAAAAGGGCCGGAAACCATTAATAAGGTTACCGAGTATTCG
ATGCCAGCCGAATAA

Protein sequence :

MNKKFKYKKSLLAAILSATLLAGCDGGGSGPSSDTPPVDSGTGSLPEVKPDPTPNPEPTPEPTPDPEPTPDPTPDPEPTP
EPEPEPVPTKTGYLTLGGSQRITGATCNGESSDGFTFTPGDKVTCVAGNNTTIATFDTQSEAARSLRAVEKVSFSLEDAQ
ELAASDDKKSNAVSLVTSSNSCPADTEQVCLTFSSVIESKRFDSLYKQIDLAPEEFKKLVNEEVENNAATDKAPSTHTSP
VVPVTTPGTKPDLNASFVSANAEQFYQYQPTEIILSEGRLVDSQGYGVAGVNYYTNSGRGVTGENGEFSFSWGETISFGI
DTFELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSTTGQNNTRVVPDDVRKVFAEYPNVINEIINLSLSNGATLDEGD
QNVVLPNEFIEQFKTGQAKEIDTAICAKTDGCNEARWFSLTTRNVNDGQIQGVINKLWGVDKDYKSVTKFHVFHDSTNFY
GSTGNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNELAYITEAPSIVQPENVTRDTATFNLPFISLGQVGEG
KLMVIGNPHYNSILRCPNGYSWNGGVNKDGQCTLSGDSDDMKHFMQNVLRYLSDDKWTPDAKASMTVGTNLDTVYFKRHG
QVTGNSAEFGFHPDFAGISVEHLSSYGDLDPQEMPLLILNGFEYVTQVGNDPYAIPLRADTSKPKLTQQDVTDLIAYLNK
GGSVLIMENVMSNLKEESASGFVRLLDAAGLSMALNKSVVNTDPQGYPNRVRQQREKGIWVYERYPAVDSAQPPYTIDPD
TGKVTWKYQEEGKPDDKPKLEVASWQEDVDGKQVTRYAFIDEAEHSTEESLEAAKAKIFEKFPGLQECKDSTYHYEINCL
ERRPGTDVPVTGGMYVPRYTQLNLDADTAKAMVQAADLGTNIQRLYQHELYFRTNGRKGERLSSVDLERLYQNMSVWLWN
KIEYRYENDKDDELGFKTFTEFLNCYANNAYSEGTQCSADLKKSLVDNNMIYGDGSSKAGMMNPSYPLNYMEKPLTRLML
GRSWWDLNIKVDVEKYPGAVSAEGEKVTETISLYSNPTKWFAGNMQSTGLWAPAQQEVTIESTASVPVTVTVALADDLTG
REKHEVALNRPPKVTKTYDLKANDKVTFKVPYGGLIYIKGNSPKNESAEFTFTGVVKAPFYKDGEWKNALNSPAPLGELE
SDSFVYTAPKNNLNASNYSNYTDGVAEFAKELDTFASSMNDFYGRDGESGNHRMFTYKALTGHKHRFANDVQISIGDAHS
GYPVMNSSFSTNSTTLPTTPLNDWLIWHEVGHNAAETPLNVPGATEVANNVLALYMQDRYLGKMNRVADDITVAPEYLDE
SNGQAWARGGAGDRLLMYAQLKEWAEENFDIKQWYPDGELPKFYSDRKGMKGWNLFQLMHRKARGDDVSNDKFGGRNYCA
ESNGNAADTLMLCASWVAQADLSEFFKKWNPGANAYQLPGASEMSFEGGVSQSAYNTLAAMHLSKPEKGPETINKVTEYS
MPAE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	91
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	49
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
yghJ	YP_002330723.1	inner membrane lipoprotein	VFG0106	Protein	0.0	49