Gene Information

Name : yghJ (ECO111_3795)
Accession : YP_003236130.1
Strain : Escherichia coli 11128
Genome accession: NC_013364
Putative virulence/resistance : Virulence
Product : lipoprotein AcfD-like protein
Function : -
COG functional category : M : Cell wall/membrane/envelope biogenesis
COG ID : COG0810
EC number : -
Position : 3771551 - 3776116 bp
Length : 4566 bp
Strand : -
Note : -

DNA sequence :

ATGAATAAGAAATTTAAATATAAGAAATCGCTTTTAGCGGCTATTTTGAGTGCAACCCTGTTAGCCGGTTGTGATGGCGG
TGGCTCCGGATCTTCCTCCGATACGCCGCCTGTAGATTCTGGAACAGGGTCTTTGCCGGAAGTGAAACCTGATCCAACAC
CAAACCCGGAGCCGACGCCTGAGCCAACGCCGGACCCAGAACCTACGCCGGAACCGACACCTGATCCTGAGCCAACACCA
GAACCGGAGCCAGAACCTGTTCCTACGAAAACGGGTTATCTGACCCTGGGCGGAAGCCTGCGGGTAACTGGTGATATCAC
CTGTAATGATGAATCCAGCGATGGCTTTACCTTTACACCAGGCGACAAAGTCACCTGTGTGGCAGGGAACAACACGACAA
TTGCTACCTTCGACACCCAGTCAGAAGCTGCGCGTAGCCTGCGTGCGGTTGAAAAAGTGTCGTTTAGTCTTGAGGACGCG
CAAGAACTGGCGGGTTCCGACAACAAGAAAAGCAATGCGCTCTCGCTGGTCACCTCCATGAACAGTTGCCCGGCGAATAC
AGAACAGGTGTGCCTGGAGTTCTCCTCGGTGATCGAGAGTAAACGTTTCGACTCGCTGTATAAGCAAATCGATCTGGCAC
CGGAAGAGTTCAAAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCCGCGACTGATAAAGCGCCATCCACTCATACTTCA
CCGGTAGTCCCCGTCACGACTCCGGGAACAAAACCGGATCTGAACGCCTCCTTCGTGTCGGCTAACGCGGAACAGTTTTA
TCAGTATCAACCTTCGGAAATCATTCTCTCAGAAGGTCGCCTGGTGGATAGCCAGGGATATGGTGTTGCTGGCGTCAACT
ACTACACCAATTCAGGCCGTGGCGTGACAGGGGAAAATGGTGAATTTTCTTTTAGCTGGGGCGAAACCATCTCCTTTGGT
ATCGATACCTTTGAACTGGGTTCAGTGCGCGGCAATAAGTCGACCATTGCGCTGACTGAACTGGGTGATGAAGTTCGCGG
GGCGAATATCGATCAGCTTATTCATCGCTATTCGACGACCGGGCAAAATAATACCCGTGTTGTTCCGGATGATGTACGCA
AGGTCTTTGCCGAATATCCCAACGTGATTAACGAGATTATCAATCTCTCGTTATCCAACGGTGCGACGCTGGATGAAGGT
GAGCAAGTTGTTAATCTGCCAAACGAATTTATCGAGCAGTTTAAGACGGGTCAGGCCAAAGAGATCGATACCGCGATTTG
TGCGAAAACCGACGGTTGTAACGAGGCTCGCTGGTTCTCGCTGACGACGCGCAATGTTAATGACGGCCAGATTCAGGGCG
TTATCAACAAGCTGTGGGGCGTGGATACGAACTACAAATCTGTCAGCAAGTTCCATGTATTCCATGACTCTACTAACTTC
TATGGCAGCACGGGTAATGCGCGCGGTCAGGCGGTGGTGAATATCTCCAACGCGGCCTTCCCGATTCTGATGGCGCGTAA
TGATAAAAACTACTGGCTGGCGTTTGGCGAAAAACGCGCCTGGGATAAAAACGAGCTGGCGTACATTACGGAAGCGCCTT
CTCTTGTTGAGCCGGAAAACGTTACGCGCGATACCGCCACTTTCAACCTGCCGTTTATTTCGCTGGGGCAAGTCGGTGAG
GGCAAACTGATGGTTATCGGAAACCCACACTACAACAGCATTTTGCGTTGCCCGAACGGTTACAGCTGGAACGGGGGCGT
TAATAAAGATGGGCAGTGTACGCTCAACAGCGACCCGGATGACATGAAGAACTTCATGGAGAACGTGCTGCGCTATCTGT
CCGATGATAAATGGACGCCGGACGCGAAAGCCAGCATGACCGTAGGCACCAACCTGGATACTGTCTATTTTAAACGTCAT
GGTCAGGTTACAGGAAACAGCGCTGCGTTCGACTTCCATCCGGATTTTGCGGGCATCTCTGTTGAGCATTTAAGTAGCTA
TGGCGATCTCGATCCGCAGGAAATGCCGCTGCTGATCCTTAACGGCTTTGAATATGTGACTCAGGTGGGTAACGATCCTT
ATGCAATCCCGCTGCGTGCAGATACCAGCAAACCGAAGCTGACTCAGCAGGATGTGACCGATCTGATCGCCTATCTGAAC
AAAGGTGGATCGGTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCGCGTCTGGTTTTGTGCGTCTGTT
GGATGCCGCAGGTCTGTCGATGGCACTGAACAAGTCGGTAGTAAATAACGATCCGCAAGGGTATCCGAACCGCGTTCGTC
AGCAGCGCGCAACGGGCATTTGGGTCTATGAACGTTATCCTGCCGTAGATGGTGCGCTGCCGTACACCATCGATAGTAAG
ACAGGGGAAGTTAAGTGGAAATATCAGGTAGAAAACAAACCTGATGACAAACCGAAGCTGGAAGTTGCCAGCTGGCTGGA
AGATGTAGATGGCAAACAGGAAACGCGTTATGCCTTTATTGATGAGGCCGATCATAAAACAGAGGATTCTCTGAAGGCTG
CGAAGGAGAAAATTTTCGCCGCGTTCCCGGGGCTGAAAGAGTGTACTAATCCGGCATATCACTATGAGGTCAACTGCCTG
GAATATCGTCCTGGCACGGGGGTTCCGGTTACTGGTGGCATGTATGTTCCACAGTATACGCAACTAAGCCTTAACGCCGA
CACTGCAAAAGCGATGGTGCAGGCTGCGGATTTAGGCACCAACATTCAGCGTCTGTATCAGCATGAGCTCTACTTCCGGA
CCAATGGTCGCAAAGGTGAGCGTCTGAGCAGCGTCGATCTGGAACGTCTGTACCAGAACATGTCGGTCTGGCTGTGGAAC
GATACGAGCTATCGTTATGAAGAAGGCAAAAATGACGAGCTGGGCTTTAAAACGTTCACCGAGTTCCTGAACTGCTACGC
CAATGATGCCTATGCAGGCGGCACCAAGTGTTCTGCAGATCTGAAAAAATCGCTGGTCGATAACAACATGATCTACGGTG
ACGGTAGCAGCAAAGCGGGCATGATGAACCCGAGCTACCCGCTCAACTATATGGAAAAACCGCTGACACGCCTGATGCTG
GGCCGTTCCTGGTGGGATCTGAACATCAAAGTTGATGTCGAGAAGTATCCGGGAGCAGTATCGGAAGAGGGACAGAACGT
TACTGAAACCATCAGCCTGTACTCGAATCCGACCAAATGGTTTGCAGGTAACATGCAGTCAACTGGCCTGTGGGCACCGG
CTCAGAAAGAGGTCACCATTAAGTCCAATGCGAACGTTCCTGTGACCGTCACCGTGGCGCTGGCTGACGACCTGACCGGA
CGTGAGAAGCATGAAGTTGCGCTGAACCGTCCGCCAAGAGTGACTAAAACGTACTCTCTGGACGCTAGCGGTACGGTGAA
GTTCAAGGTGCCTTACGGTGGCCTGATTTATATCAAGGGCAATAGCTCTACCAATGAATCTGCCAGCTTCACCTTTACTG
GCGTGGTAAAAGCACCGTTCTATAAAGACGGCGCATGGAAAAACGATCTGAACTCACCGGCTCCGCTGGGTGAGCTGGAA
TCAGACGCTTTCGTCTATACCACACCGAAGAAGAACCTGAATGCCAGCAATTACACTGGCGGACTGGAGCAATTCGCTAA
CGATCTGGACACCTTTGCCAGCTCGATGAATGACTTCTACGGTCGTGATGAAACGAGCGGTAAGCACCGGATGTTTACCT
ATAAAGCATTGACGGGACATAAACATCGTTTCACAAACGATGTGCAGATCTCCATCGGTGATGCGCACTCGGGTTATCCG
GTAATGAACAGCAGCTTCTCGACGAACAGCACCACGCTGCCGACGACGCCGCTGAACGACTGGCTGATCTGGCACGAAGT
AGGGCACAACGCCGCAGAAACGCCGCTGACTGTTCCAGGCGCGACCGAAGTGGCGAACAACGTGCTGGCGCTGTACATGC
AGGATCGTTATCTCGGCAAGATGAACCGTGTCGCTGACGATATTACCGTCGCACCGGAATATCTGGAGGAGAGCAACGGT
CAGGCATGGGCGCGCGGCGGTGCGGGTGACCGTCTGCTGATGTACGCGCAGCTGAAGGAATGGGCAGAGAAAAACTTTGA
TATCAAGAAATGGTATCCAGAAGGTGAATTGCCGAAGTTCTTCAGCGATCGTGAAGGGATGAAAGGCTGGAACCTGTTCC
AGTTGATGCACCGTAAAGCGCGCGGCGATGACGTTGGTGACAAGACCTTTGGTGGCAAGAATTACTGTGCTGAATCCAAC
GGTAACGCTGCGGACACGCTGATGCTGTGTGCCTCCTGGGTCGCCCAGACGGATCTTTCGGAGTTCTTTAAGAAATGGAA
TCCGGGTGCGAATGCTTACCAGCTGCCGGGGGCGAGCGAGATGAGCTTCGAGGGCGGTGTGAGCCAGTCGGCGTACAACA
CGCTGGCGTCACTCAAGCTGCCGAAACCGGAACAGGGACCGGAAACCATTAACAAGGTTACCGAGCATAAGATGTCTGTC
GAGTAA

Protein sequence :

MNKKFKYKKSLLAAILSATLLAGCDGGGSGSSSDTPPVDSGTGSLPEVKPDPTPNPEPTPEPTPDPEPTPEPTPDPEPTP
EPEPEPVPTKTGYLTLGGSLRVTGDITCNDESSDGFTFTPGDKVTCVAGNNTTIATFDTQSEAARSLRAVEKVSFSLEDA
QELAGSDNKKSNALSLVTSMNSCPANTEQVCLEFSSVIESKRFDSLYKQIDLAPEEFKKLVNEEVENNAATDKAPSTHTS
PVVPVTTPGTKPDLNASFVSANAEQFYQYQPSEIILSEGRLVDSQGYGVAGVNYYTNSGRGVTGENGEFSFSWGETISFG
IDTFELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSTTGQNNTRVVPDDVRKVFAEYPNVINEIINLSLSNGATLDEG
EQVVNLPNEFIEQFKTGQAKEIDTAICAKTDGCNEARWFSLTTRNVNDGQIQGVINKLWGVDTNYKSVSKFHVFHDSTNF
YGSTGNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNELAYITEAPSLVEPENVTRDTATFNLPFISLGQVGE
GKLMVIGNPHYNSILRCPNGYSWNGGVNKDGQCTLNSDPDDMKNFMENVLRYLSDDKWTPDAKASMTVGTNLDTVYFKRH
GQVTGNSAAFDFHPDFAGISVEHLSSYGDLDPQEMPLLILNGFEYVTQVGNDPYAIPLRADTSKPKLTQQDVTDLIAYLN
KGGSVLIMENVMSNLKEESASGFVRLLDAAGLSMALNKSVVNNDPQGYPNRVRQQRATGIWVYERYPAVDGALPYTIDSK
TGEVKWKYQVENKPDDKPKLEVASWLEDVDGKQETRYAFIDEADHKTEDSLKAAKEKIFAAFPGLKECTNPAYHYEVNCL
EYRPGTGVPVTGGMYVPQYTQLSLNADTAKAMVQAADLGTNIQRLYQHELYFRTNGRKGERLSSVDLERLYQNMSVWLWN
DTSYRYEEGKNDELGFKTFTEFLNCYANDAYAGGTKCSADLKKSLVDNNMIYGDGSSKAGMMNPSYPLNYMEKPLTRLML
GRSWWDLNIKVDVEKYPGAVSEEGQNVTETISLYSNPTKWFAGNMQSTGLWAPAQKEVTIKSNANVPVTVTVALADDLTG
REKHEVALNRPPRVTKTYSLDASGTVKFKVPYGGLIYIKGNSSTNESASFTFTGVVKAPFYKDGAWKNDLNSPAPLGELE
SDAFVYTTPKKNLNASNYTGGLEQFANDLDTFASSMNDFYGRDETSGKHRMFTYKALTGHKHRFTNDVQISIGDAHSGYP
VMNSSFSTNSTTLPTTPLNDWLIWHEVGHNAAETPLTVPGATEVANNVLALYMQDRYLGKMNRVADDITVAPEYLEESNG
QAWARGGAGDRLLMYAQLKEWAEKNFDIKKWYPEGELPKFFSDREGMKGWNLFQLMHRKARGDDVGDKTFGGKNYCAESN
GNAADTLMLCASWVAQTDLSEFFKKWNPGANAYQLPGASEMSFEGGVSQSAYNTLASLKLPKPEQGPETINKVTEHKMSV
E

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	92
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	50
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	50
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	50
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
yghJ	YP_003236130.1	lipoprotein AcfD-like protein	VFG0106	Protein	0.0	50