Gene Information

Name : yghJ (CE10_3498)
Accession : YP_006145506.1
Strain : Escherichia coli CE10
Genome accession: NC_017646
Putative virulence/resistance : Virulence
Product : putative inner membrane lipoprotein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3562963 - 3567519 bp
Length : 4557 bp
Strand : -
Note : -

DNA sequence :

ATGAATAAGAAATTTAAATATAAGAAATCGCTTTTAGCGGCTATTTTGAGTGCAACCCTGTTAGCCGGTTGTGATGGCGG
TGGCTCCGGATCTTCCTCCGATACGCCGCCTGTAGATTCTGGAACAGGGTCTTTGCCGGAAGTGAAACCTGATCCAACAC
CAAACCCGGAGCCGACGCCTGAGCCAACGCCGGACCCAGAACCTACGCCGGAACCGACACCTGATCCTGAGCCAGAACCG
GAGCCAGAACCTGTTCCTACGAAAACGGGTTATCTGACCCTGGGCGGAAGCCAGCGGGTAACTGGTGCTACTTGTAATGG
TGAATCCAGCGATGGCTTTACATTTACACCTGGTGAGGACGTTACTTGCGTGGCGGGTAACACGACAATTGCTACCTTCG
ACACCCAGTCAGAAGCTGCGCGTAGCCTGCGTGCGGTTGAAAAAGTGTCGTTTAGTCTTGAGGACGCGCAAGAACTGGCA
GCTTCCGATGACAAGAAAAGCAATGCGGTTTCGCTGGTAACGTCCAGTAACAGCTGTCCGGCGAATACAGAACAGGTTTG
CCTGACGTTCTCCTCAGTGATCGAGAGTAAACGTTTCGACTCGCTGTATAAGCAAATCGATCTGGCACCGGAAGAGTTCA
AAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCCGCGACCGATAAAGCGCCATCCACTCATACTTCACCGGTTGTGCCC
GTCACCACGCCGGGAACAAAACCGGATCTGAACGCTTCCTTCGTGTCGGCTAACGCGGAACAGTTTTATCAGTATCAACC
CACTGAAATCATTCTCTCCGAAGGCCGACTGGTAGATAGCATGGGCAATGGTGTGGTTGGCGTAAATTACTACACCAGCT
CAGGCCGTGGCGTAACTGGCGAAAACGGCAAATTCAACTTCAGCTGGGGCGAAACCATCTCCTTTGGTATCGACACCTTT
GAACTGGGCTCAGTGCGCGGCAATAAGTCGACCATTGCGTTGACTGAACTGGGTGACGAAGTTCGCGGCGCGAATATTGA
TCAGCTTATTCATCGTTACTCCCAGGCCGGAAAAAATGATGAGCGTGAAGTGCCGGACGTAGTGCGCAAGGTCTTTGCCG
AGTATCCCAACGTAATCAACGAGATTATCAATCTCTCGTTATCCAATGGCGAGGCGTTGAGCGAAGGCGATCAAACCTTT
GAGCGGACAAACGAATTTCTTGAGCAGTTTGAATCCGGGCAGGCTAAAGAGATTGATACGGCGATTTGTGACTCCCTTGG
GGGCTGCAACTCTCAGCGTTGGTTCTCGTTGACAGCACGCAATGTTAACGAAGGTCAGATTCAGGGCGTTATCAACAAGC
TGTGGGGTGTGGATAAAGATTACAAATCAGTGACGAAATTCCACGTCTTCCATGACTCTACCAACTTCTATGGCAGTACC
GGTAATGCGCGCGGTCAGGCAGTGGTGAATATCTCCAACGCGGCCTTCCCGATTCTGATGGCGCGTAATGATAAAAACTA
CTGGCTGGCGTTTGGCGAAAAACGCGCCTGGGATAAAAACGAGCTGGCGTACATTACGGAAGCGCCTTCTCTCGTTGAGC
CGGAAAACGTTACGCGCGATACCGCCACCTTTAACCTGCCGTTTATTTCGCTGGGGCAAGTCGGTGAGGGCAAACTGATG
GTTATCGGTAACCCGCACTACAACAGCATTTTGCGTTGTCCGAACGGTTACAGCTGGGAAGGCGGTGTTGATAAAAACGG
TCAGTGTACGCGTAACAGTGATTCTAATGATATGAAGCACTTTATGCAGAACGTGTTGCGCTATCTGTCCGACGATAAAT
GGACGCCGGACGCGAAAGCCAGCATGACCGTAGGCACCAACCTGGATACTGTCTATTTCAAACGTCATGGTCAGGTTACA
GGAAACAGCGCTGAGTTCGGCTTTCATCCGGATTTTGCGGGTATCTCTGTTGAGCATTTAAGTAGCTATGGCGATCTCGA
CCCGCAGGAAATGCCGCTGCTGATCCTCAACGGCTTTGAGTATGTGACTCAGGTTGGTAACGATCCTTATGCAATCCCGC
TGCGAGCAGATACCAGCAAACCGAAGCTGACTCAGCAGGATGTGACCGATCTGATCGCCTATCTGAACAAAGGTGGATCG
GTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCGCGTCTGGCTTTGTACGTCTGCTTGATGCCGCAGG
TCTGTCGATGGCACTGAACAAGTCGGTAGTAAATAACGATCCGCAAGGGTATCCGAACCGCGTTCGTCAGCAGCGCGCAA
CGGGCATTTGGGTCTATGAACGTTATCCTGCCGTAGATGGTGCGCTGCCGTACACCATCGATAGTAAGACAGGGGAAGTT
AAGTGGAAATATCAGGTAGAAAACAAACCTGATGACAAACCGAAGCTGGAAGTTGCCAGCTGGCTGGAAGATGTAGATGG
CAAACAGGAAACGCGTTATGCCTTTATTGATGAGGCCGATCATAAAACAGAGGATTCTCTGAAGGCTGCGAAGGCAAAAA
TCTTTGAGAAGTTTCCTGGATTAAAGGAGTGTAAGGACCCAACTTACCACTACGAGGTCAACTGTCTGGAATATCGTCCT
GGCACGGGGGTTCCGGTTACTGGTGGCATGTATGTTCCACAGTATACGCAACTAAGCCTTAACGCCGACACGGCAAAAGC
GATGGTGCAGGCTGCGGATTTAGGCACCAACATTCAGCGTCTGTATCAGCATGAGCTCTACTTCCGGACCAATGGTCGCA
AAGGTGAGCGTCTGAGCAGCGTCGATCTGGAACGTCTGTACCAGAACATGTCGGTCTGGCTGTGGAATAAAATTGAATAT
CGCTATGAAAACGACAAGGATGACGAGCTGGGCTTTAAAACGTTCACCGAGTTCCTGAACTGCTACGCCAACGATGCCTA
TACTGGCGGCACGCAGTGTTCTGATGAGCTGAAAAAATCGCTGGTCGATAACAACATGATCTACGGCGAGAAGAGCGTTA
ATAAAGCGGGCATGATGAACCCGAGCTATCCGCTCAACTATATGGAAAAACCGCTGACGCGCCTGATGCTGGGTCGTTCC
TGGTGGGATCTGAACATCAAAGTTGATGTCGAGAAGTATCCGGGAGCGGTATCGGCAGAAGGTGAGAAGGTTACTGAAAC
CATCAGCCTGTACTCCAATCCGACCAAATGGTTTGCGGGTAACATGCAGTCTACTGGCCTGTGGGCTCCGGCTCAGAAAG
AGGTCACCATTGAGTCTTCTGCATCAGTTCCTGTGACTGTCACCGTGGCGCTGGCCGACGATCTGACCGGACGCGAGAAG
CATGAAGTCGCGCTGAACCGTCCGCCAAAAGTGACGAAAACCTATGATCTGAAAGCCAATGATAAGGTGACCTTCAAGGT
GCCTTACGGTGGTCTGATTTATATCAAGGGCAACAGCCCAAAGAATGAGTCAGCCGAATTCACCTTTACTGGTGTGGTAA
AAGCGCCGTTCTATAAAGACGGCGAATGGAAAAACGCTCTGAACTCCCCTGCGCCGCTGGGCGAGCTGGAATCAGACGCT
TTCGTTTATACCACGCCGAAGAAGAACCTTGAGGCTAGCAATTTCACTGGTGGTGTAGCAGAATTCGCTAAAGATCTGGA
TACCTTTGCCAGCTCGATGAATGACTTCTACGGTCGTAATGATGAAGACGGTAAGCACCGGATGTTTACCTATAAAAACT
TGACGGGGCACAAGCATCGTTTCACCAACGATGTGCAGATCTCCATCGGTGATGCGCACTCGGGTTATCCGGTAATGAAC
AGCAGCTTCTCGACGAACAGCACCACGCTGCCGACGACGCCGCTGAACGACTGGTTGATCTGGCACGAAGTAGGGCACAA
CGCCGCCGAAACGCCGCTGACTGTTCCTGGCGCAACTGAAGTAGCGAACAACGTTCTGGCGCTGTACATGCAGGATCGCT
ATCTCGGCAAGATGAACCGTGTCGCTGACGATATTACTGTCGCGCCGGAATATCTGGAGGAGAGCAACGGTCAGGCATGG
GCGCGCGGCGGTGCGGGCGACCGTCTGCTGATGTACGCGCAGCTGAAGGAGTGGGCAGAGAAAAACTTTGATATCAAACA
GTGGTATCCAGAAGGTGACCTGCCTAAGTTCTACAGCGATCGTGAAGGGATGAAAGGCTGGAACCTGTTCCAGTTGATGC
ACCGTAAAGCACGCGGCGATGATGTTGGCAAAACCAAGTTTGGCGAAAGAAATTACTGTGCCGAATCCAACGGTAACGCT
GCCGACAAGCTGATGCTGTGTGCCTCCTGGGTCGCTCAGACGGATCTTTCGGAGTTCTTTAAGAAATGGAATCCGGGCGC
GAATGCTTACCAGTTACCGGGAGCGAGCGAGATGAACTTCGAGGGCGGTGTGAGCCAGTCGGCTTACGAGACGCTGGCGG
CGCTTAATCTGCCGAAACCGCAGCAAGGGCCGGAAACCATTAATCAGGTTACCGAGCATAAGATGTCAGCTGAGTAA

Protein sequence :

MNKKFKYKKSLLAAILSATLLAGCDGGGSGSSSDTPPVDSGTGSLPEVKPDPTPNPEPTPEPTPDPEPTPEPTPDPEPEP
EPEPVPTKTGYLTLGGSQRVTGATCNGESSDGFTFTPGEDVTCVAGNTTIATFDTQSEAARSLRAVEKVSFSLEDAQELA
ASDDKKSNAVSLVTSSNSCPANTEQVCLTFSSVIESKRFDSLYKQIDLAPEEFKKLVNEEVENNAATDKAPSTHTSPVVP
VTTPGTKPDLNASFVSANAEQFYQYQPTEIILSEGRLVDSMGNGVVGVNYYTSSGRGVTGENGKFNFSWGETISFGIDTF
ELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSQAGKNDEREVPDVVRKVFAEYPNVINEIINLSLSNGEALSEGDQTF
ERTNEFLEQFESGQAKEIDTAICDSLGGCNSQRWFSLTARNVNEGQIQGVINKLWGVDKDYKSVTKFHVFHDSTNFYGST
GNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNELAYITEAPSLVEPENVTRDTATFNLPFISLGQVGEGKLM
VIGNPHYNSILRCPNGYSWEGGVDKNGQCTRNSDSNDMKHFMQNVLRYLSDDKWTPDAKASMTVGTNLDTVYFKRHGQVT
GNSAEFGFHPDFAGISVEHLSSYGDLDPQEMPLLILNGFEYVTQVGNDPYAIPLRADTSKPKLTQQDVTDLIAYLNKGGS
VLIMENVMSNLKEESASGFVRLLDAAGLSMALNKSVVNNDPQGYPNRVRQQRATGIWVYERYPAVDGALPYTIDSKTGEV
KWKYQVENKPDDKPKLEVASWLEDVDGKQETRYAFIDEADHKTEDSLKAAKAKIFEKFPGLKECKDPTYHYEVNCLEYRP
GTGVPVTGGMYVPQYTQLSLNADTAKAMVQAADLGTNIQRLYQHELYFRTNGRKGERLSSVDLERLYQNMSVWLWNKIEY
RYENDKDDELGFKTFTEFLNCYANDAYTGGTQCSDELKKSLVDNNMIYGEKSVNKAGMMNPSYPLNYMEKPLTRLMLGRS
WWDLNIKVDVEKYPGAVSAEGEKVTETISLYSNPTKWFAGNMQSTGLWAPAQKEVTIESSASVPVTVTVALADDLTGREK
HEVALNRPPKVTKTYDLKANDKVTFKVPYGGLIYIKGNSPKNESAEFTFTGVVKAPFYKDGEWKNALNSPAPLGELESDA
FVYTTPKKNLEASNFTGGVAEFAKDLDTFASSMNDFYGRNDEDGKHRMFTYKNLTGHKHRFTNDVQISIGDAHSGYPVMN
SSFSTNSTTLPTTPLNDWLIWHEVGHNAAETPLTVPGATEVANNVLALYMQDRYLGKMNRVADDITVAPEYLEESNGQAW
ARGGAGDRLLMYAQLKEWAEKNFDIKQWYPEGDLPKFYSDREGMKGWNLFQLMHRKARGDDVGKTKFGERNYCAESNGNA
ADKLMLCASWVAQTDLSEFFKKWNPGANAYQLPGASEMNFEGGVSQSAYETLAALNLPKPQQGPETINQVTEHKMSAE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	98
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	49
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
yghJ	YP_006145506.1	putative inner membrane lipoprotein	VFG0106	Protein	0.0	49