Gene Information

Name : yghJ (ECDH1ME8569_2872)
Accession : YP_006130273.1
Strain : Escherichia coli DH1
Genome accession: NC_017638
Putative virulence/resistance : Virulence
Product : putative inner membrane lipoprotein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3092457 - 3096887 bp
Length : 4431 bp
Strand : -
Note : -

DNA sequence :

TTGCCGGAAGTGAAACCTGATCCAACACCAAACCCGGAGCCGACGCCTGAGCCAACGCCGGACCCAGAGCCTACGCCAGA
ACCGATACCTGATCCTGAACCAACACCAGAACCGGAGCCAGAACCTGTTCCTACGAAAACGGGTTATCTGACCCTGGGCG
GAAGCCAGCGGGTAACTGGTGCTACCTGTAATGGTGAATCCAGCGATGGCTTTACATTTAAACCTGGCGAGGACGTTACT
TGCGTGGCGGGTAACACGACAATTGCCACCTTCAACACTCAGTCAGAAGCTGCGCGTAGCTTGCGTGCGGTTGAAAAAGT
GTCGTTTAGCCTTGAGGACGCGCAAGAACTGGCGGGCTCCGATGACAAGAAAAGCAATGCGGTTTCGCTGGTAACGTCCA
GTAACAGCTGTCCGGCGAATACAGAACAGGTTTGTCTGACGTTCTCCTCGGTGATCGAGAGTAAACGCTTCGACTCGCTG
TATAAGCAAATCGATCTGGCACCGGAAGAGTTCAAAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCTGCGACCGATAA
AGCGCCATCCACTCATACTTCACCGGTCGTGCCCGTCACCACGCCGGGAACAAAACCGGATCTGAACGCTTCCTTCGTGT
CGGCTAACGCGGAACAGTTTTATCAGTATCAACCCACTGAAATCATTCTCTCTGAAGGTCGACTGGTCGATAGCCAGGGA
TATGGTGTTGCTGGCGTCAACTACTACACCAATTCAGGCCGTGGCGTGACAGGGGAAAATGGTGAATTTTCCTTTAGCTG
GGGCGAAACCATCTCCTTTGGTATCGATACCTTTGAACTGGGTTCAGTGCGCGGCAATAAGTCGACCATTGCGCTGACTG
AACTGGGTGATGAAGTTCGCGGGGCGAATATTGATCAGCTTATTCATCGCTATTCGACGACCGGGCAAAATAATACCCGT
GTTGTTCCGGACGATGTACGCAAGGTCTTTGCCGAATATCCCAACGTGATCAACGAGATTATCAATCTCTCGTTATCCAA
CGGTGCGACGCTGGGGGAAGGTGAGCAAGTCGTTAATCTGCCTAACGAATTTATTGAGCAGTTTAATACGGGTCAGGCCA
AAGAGATCGATACCGCGATTTGTGCGAAAACCGATGGTTGTAACGAGGCTCGCTGGTTCTCGCTGACGACGCGCAATGTT
AATGACGGCCAGATTCAGGGCGTTATCAACAAGCTGTGGGGCGTGGATACGAACTACAAATCTGTCAGCAAGTTCCATGT
ATTCCATGACTCCACCAACTTCTATGGCAGCACGGGTAATGCGCGCGGTCAGGCGGTGGTGAATATCTCCAACGCGGCCT
TCCCGATTCTGATGGCGCGTAATGATAAAAACTACTGGCTGGCCTTCGGCGAAAAACGCGCCTGGGATAAAAACGAGCTG
GCGTACATTACGGAAGCGCCTTCTCTTGTTGAGCCGGAAAACGTTACGCGCGATACCGCCACCTTTAACCTGCCGTTTAT
TTCGCTGGGGCAAGTCGGTGAGGGCAAACTGATGGTTATCGGTAACCCACACTACAACAGCATTTTGCGTTGCCCGAACG
GTTACAGCTGGAACGGGGGCGTTAATAAAGATGGGCAGTGTACGCTCAACAGCGACCCGGATGACATGAAGAACTTCATG
GAGAACGTGCTGCGCTATCTGTCCGACGATAAATGGAAGCCGGACGCGAAAGCCAGCATGACCGTAGGCACCAACCTGGA
TACTGTCTATTTTAAACGTCATGGTCAGGTTACAGGAAACAGCGCTGCGTTCGACTTCCATCCGGATTTTGCGGGCATCT
CTGTTGAGCATTTAAGTAGCTATGGCGATCTCGATCCGCAGGAAATGCCGCTGCTGATCCTTAACGGCTTTGAATATGTG
ACTCAGGTGGGTAACGATCCTTATGCAATCCCGCTGCGTGCAGATACCAGCAAACCGAAGCTGACTCAGCAGGATGTGAC
CGATCTGATCGCCTATCTGAACAAAGGTGGATCGGTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCG
CGTCTGGTTTTGTGCGTCTGTTGGATGCCGCAGGTCTGTCGATGGCACTGAACAAGTCGGTAGTAAATAACGATCCGCAA
GGGTATCCGAACCGCGTTCGTCAGCAGCGCGCAACGGGCATTTGGGTCTATGAACGTTATCCTGCCGTAGATGGTGCGCT
GCCGTACACCATCGATAGTAAGACAGGGGAAGTTAAGTGGAAATATCAGGTAGAAAACAAACCTGATGACAAACCGAAGC
TGGAAGTTGCCAGCTGGCTGGAAGATGTAGATGGCAAACAGGAAACGCGTTATGCCTTTATTGATGAGGCCGATCATAAA
ACAGAGGATTCTCTGAAGGCTGCGAAGGAGAAAATTTTCGCCGCGTTCCCGGGGCTGAAAGAGTGTACTAATCCGGCATA
TCACTATGAGGTCAACTGCCTGGAATATCGTCCTGGCACGGGGGTTCCGGTTACTGGTGGCATGTATGTTCCACAGTATA
CGCAACTAAGCCTTAACGCCGACACTGCAAAAGCGATGGTGCAGGCTGCGGATTTAGGCACCAACATTCAGCGTCTGTAT
CAGCATGAGCTCTACTTCCGGACCAATGGTCGCAAAGGTGAGCGTCTGAGCAGCGTCGATCTGGAACGTCTGTACCAGAA
CATGTCGGTCTGGCTGTGGAACGATACGAGCTATCGTTATGAAGAAGGCAAAAATGACGAGCTGGGCTTTAAAACGTTCA
CCGAGTTCCTGAACTGCTACGCCAATGATGCCTATGCAGGCGGCACCAAGTGTTCTGCAGATCTGAAAAAATCGCTGGTC
GATAACAACATGATCTACGGTGACGGTAGCAGCAAAGCGGGCATGATGAACCCGAGCTACCCGCTCAACTATATGGAAAA
ACCGCTGACACGCCTGATGCTGGGCCGTTCCTGGTGGGATCTGAACATCAAAGTTGATGTCGAGAAGTATCCGGGAGCAG
TATCGGAAGAGGGACAGAACGTTACTGAAACCATCAGCCTGTACTCGAATCCGACCAAATGGTTTGCAGGTAACATGCAG
TCAACTGGCCTGTGGGCACCGGCTCAGAAAGAGGTCACCATTAAGTCCAATGCGAACGTTCCTGTGACCGTCACCGTGGC
GCTGGCTGACGACCTGACCGGACGTGAGAAGCATGAAGTTGCGCTGAACCGTCCGCCAAGAGTGACTAAAACGTACTCTC
TGGACGCTAGCGGTACGGTGAAGTTCAAGGTGCCTTACGGTGGCCTGATTTATATCAAGGGCAATAGCTCTACCAATGAA
TCTGCCAGCTTCACCTTTACTGGCGTGGTAAAAGCACCGTTCTATAAAGACGGCGCATGGAAAAACGATCTGAACTCACC
GGCTCCGCTGGGTGAGCTGGAATCAGACGCTTTCGTCTATACCACACCGAAGAAGAACCTGAATGCCAGCAATTACACTG
GCGGACTGGAGCAATTCGCTAACGATCTGGATACCTTTGCCAGCTCGATGAATGACTTCTACGGCCGTGATAGCGAAGAC
GGTAAGCACCGGATGTTTACCTATAAAAACTTGCCGGGCCACAAACATCGTTTCACCAACGATGTGCAGATCTCCATCGG
TGATGCGCATTCGGGTTATCCGGTAATGAACAGCAGCTTCTCGCCGAACAGCACCACGCTGCCGACGACGCCGCTGAACG
ACTGGCTGATCTGGCATGAAGTCGGTCATAACGCCGCAGAAACGCCGTTGACTGTACCGGGTGCAACTGAAGTCGCTAAC
AACGTGCTGGCGCTGTACATGCAGGATCGTTATCTCGGCAAGATGAACCGTGTCGCTGACGATATTACCGTCGCACCGGA
ATATCTGGAGGAGAGCAACAACCAGGCATGGGCACGCGGCGGTGCGGGTGACCGTCTGCTGATGTACGCACAGCTGAAGG
AATGGGCAGAGAAAAACTTTGATATCAAGAAATGGTATCCAGATGGCACTCCTCTGCCAGAGTTTTACAGCGAGCGTGAA
GGGATGAAAGGCTGGAACCTGTTCCAGTTGATGCATCGTAAAGCACGCGGCGATGAGGTCAGCAATGACAAGTTTGGCGG
CAAGAATTACTGTGCTGAATCCAACGGTAACGCAGCGGACACGCTGATGCTGTGTGCCTCCTGGGTCGCCCAGACGGATC
TTTCGGAGTTCTTTAAGAAATGGAATCCGGGCGCGAATGCTTACCAGCTGCCGGGGGCGAGCGAGATGAGCTTCGAGGGC
GGTGTGAGCCAGTCGGCTTACAACACGCTCGCGTCACTCGATCTGCCGAAACCGGAACAGGGACCGGAAACCATTAATCA
GGTTACCGAGCATAAGATGTCTGCCGAGTAA

Protein sequence :

MPEVKPDPTPNPEPTPEPTPDPEPTPEPIPDPEPTPEPEPEPVPTKTGYLTLGGSQRVTGATCNGESSDGFTFKPGEDVT
CVAGNTTIATFNTQSEAARSLRAVEKVSFSLEDAQELAGSDDKKSNAVSLVTSSNSCPANTEQVCLTFSSVIESKRFDSL
YKQIDLAPEEFKKLVNEEVENNAATDKAPSTHTSPVVPVTTPGTKPDLNASFVSANAEQFYQYQPTEIILSEGRLVDSQG
YGVAGVNYYTNSGRGVTGENGEFSFSWGETISFGIDTFELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSTTGQNNTR
VVPDDVRKVFAEYPNVINEIINLSLSNGATLGEGEQVVNLPNEFIEQFNTGQAKEIDTAICAKTDGCNEARWFSLTTRNV
NDGQIQGVINKLWGVDTNYKSVSKFHVFHDSTNFYGSTGNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNEL
AYITEAPSLVEPENVTRDTATFNLPFISLGQVGEGKLMVIGNPHYNSILRCPNGYSWNGGVNKDGQCTLNSDPDDMKNFM
ENVLRYLSDDKWKPDAKASMTVGTNLDTVYFKRHGQVTGNSAAFDFHPDFAGISVEHLSSYGDLDPQEMPLLILNGFEYV
TQVGNDPYAIPLRADTSKPKLTQQDVTDLIAYLNKGGSVLIMENVMSNLKEESASGFVRLLDAAGLSMALNKSVVNNDPQ
GYPNRVRQQRATGIWVYERYPAVDGALPYTIDSKTGEVKWKYQVENKPDDKPKLEVASWLEDVDGKQETRYAFIDEADHK
TEDSLKAAKEKIFAAFPGLKECTNPAYHYEVNCLEYRPGTGVPVTGGMYVPQYTQLSLNADTAKAMVQAADLGTNIQRLY
QHELYFRTNGRKGERLSSVDLERLYQNMSVWLWNDTSYRYEEGKNDELGFKTFTEFLNCYANDAYAGGTKCSADLKKSLV
DNNMIYGDGSSKAGMMNPSYPLNYMEKPLTRLMLGRSWWDLNIKVDVEKYPGAVSEEGQNVTETISLYSNPTKWFAGNMQ
STGLWAPAQKEVTIKSNANVPVTVTVALADDLTGREKHEVALNRPPRVTKTYSLDASGTVKFKVPYGGLIYIKGNSSTNE
SASFTFTGVVKAPFYKDGAWKNDLNSPAPLGELESDAFVYTTPKKNLNASNYTGGLEQFANDLDTFASSMNDFYGRDSED
GKHRMFTYKNLPGHKHRFTNDVQISIGDAHSGYPVMNSSFSPNSTTLPTTPLNDWLIWHEVGHNAAETPLTVPGATEVAN
NVLALYMQDRYLGKMNRVADDITVAPEYLEESNNQAWARGGAGDRLLMYAQLKEWAEKNFDIKKWYPDGTPLPEFYSERE
GMKGWNLFQLMHRKARGDEVSNDKFGGKNYCAESNGNAADTLMLCASWVAQTDLSEFFKKWNPGANAYQLPGASEMSFEG
GVSQSAYNTLASLDLPKPEQGPETINQVTEHKMSAE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	92
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	49
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
yghJ	YP_006130273.1	putative inner membrane lipoprotein	VFG0106	Protein	0.0	49