Gene Information

Name : yghJ (WFL_15825)
Accession : YP_006174599.1
Strain : Escherichia coli W
Genome accession: NC_017664
Putative virulence/resistance : Virulence
Product : inner membrane lipoprotein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3320234 - 3324796 bp
Length : 4563 bp
Strand : -
Note : -

DNA sequence :

ATGAATAAGAAATTTAAATATAAGAAATCGCTTTTAGCGGCTATTTTGAGTGCAACCCTGTTAGCCGGTTGTGATGGCGG
TGGCTCCGGATCTTCCTCCGATACGCCGCCTGTAGATTCTGGAACAGGGTCTTTGCCGGAAGTGAAACCTGATCCAACAC
CAAACCCGGAGCCGACGCCTGAGCCAACGCCGGACCCAGAACCTACGCCGGAACCGACACCTGATCCTGAGCCAACACCA
GAACCGGAGCCAGAACCTGTTCCTACGAAAACGGGTTATCTGACTCTGGGCGGAAGCCTGCGGGTAACTGGTGATATCAC
CTGTAATGATGAATCCAGCGATGGCTTTACCTTTACACCAGGCGACAAAGTCACCTGTGTGGCAGGGAACAACACGACAA
TTGCTACCTTCGACACCCAGTCAGAAGCTGCGCGTAGCCTGCGTGCGGTTGAAAAAGTGTCGTTTAGTCTTGAGGACGCG
CAAGAACTGGCGGGTTCCGACAACAAGAAAAGCAATGCGCTCTCGCTGGTCACCTCCATGAACAGTTGCCCGGCGAATAC
AGAACAGGTGTGCCTGGAGTTCTCCTCGGTGATCGAGAGTAAACGTTTCGACTCGCTGTATAAGCAAATCGATCTGGCAC
CGGAAGAATTCAAAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCCGCGACCGATAAAGCGCCATCCACTCATACTTCA
CCGGTCGTGCCCGCCACCACTCCGGGAACAAAACCGGATCTAAACGCTTCCTTCGTGTCGGCTAACGCGGAACAGTTTTA
TCAGTATCAACCCACTGAAATCATTCTCTCTGAAGGTCGACTGGTCGATAGTCAGGGGGATGGTGTTGTTGGTGTCAACT
ATTACACCAATTCCGGCCGTGGTGTAACCGGAGAAAACGGGGAATTTTCCTTTAGTTGGGGGGAAACCATCTCCTTTGGC
ATCGACACTTTTGAGCTTGGTTCTGTGCGTGGTAACAAGTCGACTATTGCATTGACTGAACTGGGTGATGAAGTTCGCGG
GGCAAATATCGATCAGTTGATTCACCGCTATTCGAAGGCTGGACAAAATCACACGCGTGTAGTTCCGGATGAAGTGCGCA
AGGTTTTTGCTGAATATCCCAACGTGATTAACGAGATTATCAATCTCTCGTTATCCAATGGTGCGACGCTGGGGGAAGGT
GAGCAAGTCGTTAATCTGCCTAACGAATTTATCGAGCAGTTTAAGACGGGTCAGGCCAAAGAGATCGATACCGCGATTTG
TGCGAAAACCGATGGTTGTAACGAGGCTCGCTGGTTCTCGCTGACAACGCGCAATGTTAATGACGGCCAGATTCAGGGCG
TTATCAACAAGCTGTGGGGCGTGGATACGAACTACAAATCTGTCAGTAAGTTCCATGTATTCCATGACTCTACCAACTTC
TATGGCAGCACGGGTAATGCGCGCGGTCAGGCGGTGGTGAATATCTCCAACGCGGCCTTCCCGATTCTGATGGCGCGTAA
TGATAAAAACTACTGGCTGGCGTTTGGCGAAAAACGCGCCTGGGATAAAAATGAGCTGGCGTACATTACTGAAGCGCCTT
CCATTGTGCGACCAGAGAACGTGACACGCGAAACCGCCACCTTCAACCTGCCGTTTATCTCGCTGGGGCAAGTGGGCGAT
GGCAAGCTGATGGTTATCGGTAACCCACACTACAACAGCATCCTGCGTTGCCCGAACGGCTACAGCTGGAACGGGGGCGT
TAATAAAGACGGACAGTGTACGCTCAACAGCGACCCGGATGACATGAAGAACTTCATGGAGAACGTGCTGCGCTATCTGT
CAAATGATCGCTGGTTGCCGGATGCAAAATCCAGTATGACCGTGGGTACTAACCTGGACACGGTATATTTCAAAAAACAT
GGTCAGGTGCTGGGAAATAGCGCACCGTTTGCGTTCCACAAGGATTTCACTGGCATCACGGTCAAACCAATGACCAGCTA
TGGCAATCTGAATCCAGATGAAGTTCCTCTGTTGATCCTCAATGGCTTTGAATACGTCACACAATGGGGTAGCGATCCTT
ACTCCATTCCTCTGCGCGCAGATACCAGCAAACCGAAGCTGACCCAGCAGGATGTGACCGATTTGATCGCCTATATGAAC
AAAGGTGGATCGGTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCGCATCTGGCTTTGTACGTCTGCT
TGATGCCGCAGGTTTGTCGATGGCGCTTAACAAGTCGGTAGTAAATAACGATCCGCAAGGCTACCCTGACCGTGTTCGTC
AACGACGTTCAACGCCAATTTGGGTCTATGAGCGTTATCCGGCTGTCGATGGTAAACCACCGTATACCATTGATGACACC
ACGAAAGAAGTTATCTGGAAATATCAGCAAGAAAACAAACCTGATGACAAACCGAAGCTGGAAGTTGCCAGCTGGCAGGA
AGAAGTTGAGGGTAAACAGGTAACCCAATTCGCCTTTATTGATGAAGCCGACCACAAAACGCCTGAGTCACTGGCTGCGG
CAAAACAGAGAATTCTGGACGCGTTCCCAGGGCTGGAAGTGTGTAAGGATTCTGACTATCACTATGAGGTCAACTGTCTG
GAATACCGCCCAGGCACGGGTGTGCCGGTAACCGGTGGCATGTATGTTCCGCAGTATACGCAGCTGGATCTTGGAGCTGA
CACTGCGAAAGCGATGCTGCAGGCTGCGGATTTAGGCACCAATATTCAGCGCCTGTATCAGCATGAGCTTTATTTCCGTA
CCAATGGCCGCCAGGGTGAGCGTCTCAACAGCGTCGATCTGGAACGTTTATACCAAAACATGTCCGTCTGGCTGTGGAAC
GAGACGAAATATCGTTATGAAGAGGGTAAAGAAGACGAGCTGGGCTTTAAAACGTTCACTGAGTTTCTGAACTGCTACAC
CAACAATGCATACGTTGGCACGCAGTGTTCCGCTGAGCTGAAAAAATCGCTGATCGATAACAAGATGATTTACGGTGAAG
AAAGCAGCAAAGCGGGCATGATGAACCCGAGCTACCCGCTCAACTATATGGAAAAACCGCTGACACGCCTGATGCTGGGC
CGTTCCTGGTGGGATCTGAACATCAAAGTTGATGTTGAGAAGTATCCGGGAGCAGTATCGGAAGAGGGACAGAACGTTAC
TGAAACCATCAGCCTGTACTCGAATCCGACCAAATGGTTTGCAGGTAACATGCAGTCAACTGGCCTGTGGGCACCGGCTC
AGAAAGAGGTCACCATTAAGTCCAATGCGAACGTTCCTGTGACCGTCACCGTGGCGCTGGCTGACGACCTGACCGGAAGA
GAGAAGCATGAAGTCGCGCTGAACCGTCCGCCAAGAGTAACCAAAACGTACTCTCTGGACGCTAGTGGTACGGTGAAATT
CAAGGTGCCTTACGGTGGTCTGATTTATATCAAAGGCGACAGCAAAGACAATGAATCTGCCAGCTTCACCTTTACTGGTG
TGGTAAAAGCACCGTTCTATAAAGACGGCGCATGGAAAAACGATCTGAACTCACCGGCTCCGCTGGGTGAGCTGGAATCA
GACGCTTTCGTTTATACCGCACCGAAGAAGAACCTGAATGCCAGCAATTACACTGGCGGACTGAAGCAATTCGCTAACGA
TCTGGATACCTTTGCCAGCTCGATGAATGATTTCTACGGTCGTAATGAGGAAGACGGTAAGCACCGGATGTTTACCTATA
AAAACTTGACGGGCCACAAGCATCGTTTCGCCAACGATGTGCAGATCTCCATCGGTGATGCGCATTCGGGTTATCCGGTA
ATGAACAGCAGCTTCTCGACGAACAGCACCACGCTGCCGACGACGCCGCTGAACGACTGGCTGATCTGGCACGAAGTAGG
GCACAACGCCGCAGAAACGCCGCTGACTGTTCCAGGCGCGACCGAAGTGGCGAACAACGTGCTGGCGCTGTACATGCAGG
ATCGTTATCTCGGCAAGATGAACCGTGTCGCTGACGATATTACCGTCGCACCGGAATATCTGGAGGAGAGCAACGGTCAG
GCATGGGCGCGCGGCGGTGCGGGTGACCGTCTGCTGATGTACGCGCAGCTGAAGGAATGGGCAGAGAAAAACTTTGATAT
CAAGAAATGGTATCCAGAAGGTGAATTGCCGAAGTTCTTCAGCGATCGTGAAGGGATGAAAGGCTGGAACCTGTTCCAGT
TGATGCACCGTAAAGCGCGCGGCGATGACGTTGGTGACAAGACCTTTGGTGGCAAGAATTACTGTGCTGAATCCAACGGT
AACGCTGCGGACACGCTGATGCTGTGTGCCTCCTGGGTCGCCCAGACGGATCTTTCGGAGTTCTTTAAGAAATGGAATCC
GGGTGCGAATGCTTACCAGCTGCCGGGGGCGAGCGAGATGAGCTTCGAGGGCGGTGTGAGCCAGTCGGCGTACAACACGC
TGGCGTCACTCAAGCTGCCGAAACCGGAACAGGGACCGGAAACCATTAACAAGGTTACCGAGCATAAGATGTCTGTCGAG
TAA

Protein sequence :

MNKKFKYKKSLLAAILSATLLAGCDGGGSGSSSDTPPVDSGTGSLPEVKPDPTPNPEPTPEPTPDPEPTPEPTPDPEPTP
EPEPEPVPTKTGYLTLGGSLRVTGDITCNDESSDGFTFTPGDKVTCVAGNNTTIATFDTQSEAARSLRAVEKVSFSLEDA
QELAGSDNKKSNALSLVTSMNSCPANTEQVCLEFSSVIESKRFDSLYKQIDLAPEEFKKLVNEEVENNAATDKAPSTHTS
PVVPATTPGTKPDLNASFVSANAEQFYQYQPTEIILSEGRLVDSQGDGVVGVNYYTNSGRGVTGENGEFSFSWGETISFG
IDTFELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSKAGQNHTRVVPDEVRKVFAEYPNVINEIINLSLSNGATLGEG
EQVVNLPNEFIEQFKTGQAKEIDTAICAKTDGCNEARWFSLTTRNVNDGQIQGVINKLWGVDTNYKSVSKFHVFHDSTNF
YGSTGNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNELAYITEAPSIVRPENVTRETATFNLPFISLGQVGD
GKLMVIGNPHYNSILRCPNGYSWNGGVNKDGQCTLNSDPDDMKNFMENVLRYLSNDRWLPDAKSSMTVGTNLDTVYFKKH
GQVLGNSAPFAFHKDFTGITVKPMTSYGNLNPDEVPLLILNGFEYVTQWGSDPYSIPLRADTSKPKLTQQDVTDLIAYMN
KGGSVLIMENVMSNLKEESASGFVRLLDAAGLSMALNKSVVNNDPQGYPDRVRQRRSTPIWVYERYPAVDGKPPYTIDDT
TKEVIWKYQQENKPDDKPKLEVASWQEEVEGKQVTQFAFIDEADHKTPESLAAAKQRILDAFPGLEVCKDSDYHYEVNCL
EYRPGTGVPVTGGMYVPQYTQLDLGADTAKAMLQAADLGTNIQRLYQHELYFRTNGRQGERLNSVDLERLYQNMSVWLWN
ETKYRYEEGKEDELGFKTFTEFLNCYTNNAYVGTQCSAELKKSLIDNKMIYGEESSKAGMMNPSYPLNYMEKPLTRLMLG
RSWWDLNIKVDVEKYPGAVSEEGQNVTETISLYSNPTKWFAGNMQSTGLWAPAQKEVTIKSNANVPVTVTVALADDLTGR
EKHEVALNRPPRVTKTYSLDASGTVKFKVPYGGLIYIKGDSKDNESASFTFTGVVKAPFYKDGAWKNDLNSPAPLGELES
DAFVYTAPKKNLNASNYTGGLKQFANDLDTFASSMNDFYGRNEEDGKHRMFTYKNLTGHKHRFANDVQISIGDAHSGYPV
MNSSFSTNSTTLPTTPLNDWLIWHEVGHNAAETPLTVPGATEVANNVLALYMQDRYLGKMNRVADDITVAPEYLEESNGQ
AWARGGAGDRLLMYAQLKEWAEKNFDIKKWYPEGELPKFFSDREGMKGWNLFQLMHRKARGDDVGDKTFGGKNYCAESNG
NAADTLMLCASWVAQTDLSEFFKKWNPGANAYQLPGASEMSFEGGVSQSAYNTLASLKLPKPEQGPETINKVTEHKMSVE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	88
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	49
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
yghJ	YP_006174599.1	inner membrane lipoprotein	VFG0106	Protein	0.0	49