Gene Information

Name : yghJ (ECIAI1_3114)
Accession : YP_002388453.1
Strain : Escherichia coli IAI1
Genome accession: NC_011741
Putative virulence/resistance : Virulence
Product : inner membrane lipoprotein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3192399 - 3196976 bp
Length : 4578 bp
Strand : -
Note : Evidence 2b : Function of strongly homologous gene; PubMedId : 1644747; Product type lp : lipoprotein

DNA sequence :

ATGAATAAGAAATTTAAATATAAGAAATCGCTTTTAGCGGCTATTTTGAGCGCAACCCTGTTAGCCGGTTGTGATGGCGG
TGGTTCCGGATCTTCCTCCGATACGCCGCCTGTAGATTCTGGAACAGGGTCTTTGCCGGAAGTGAAACCTGATCCAACAC
CAAACCCGGAGCCGACGCCTGAGCCGACGCCTGAGCCAACGCCGGAGCCTGAACCTACGCCGGAACCGACACCTGATCCT
GAGCCAACACCAGAACCGGAGCCAGAACCTGTTCCTACGAAAACGGGTTATCTGACCCTGGGCGGAAGCCTGCGGGTAAC
TGGTGATATCACCTGTAATGATGAATCCAGCGATGGCTTTACCTTTACACCAGGCGACAAAGTCACCTGTGTGGCAGGGA
ACAACACGACAATTGCTACCTTCGACACCCAGTCAGAAGCTGCGCGTAGCCTGCGTGCGGTTGAAAAAGTGTCGTTTAGT
CTTGAGGACGCGCAAGAACTGGCGGGTTCCGACAACAAGAAAAGCAATGCGCTCTCGCTGGTCACCTCCATGAACAGTTG
CCCGGCGAATACAGAACAGGTGTGCCTGGAGTTCTCCTCGGTGATCGAGAGTAAACGTTTCGACTCGCTGTATAAGCAAA
TCGATCTGGCACCGGAAGAGTTCAAAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCCGCGACCGATAAAGCGCCATCC
ACTCATACTTCACCGGTCGTGCCCGCCACCACTCCGGGAACAAAACCGGATCTAAACGCTTCCTTCGTGTCGGCTAACGC
GGAACAGTTTTATCAGTATCAACCTTCGGAAATCATTCTCTCAGAAGGTCGCCTGGTCGATAGTCAGGGGGATGGTGTTG
TTGGTGTCAACTATTACACCAATTCCGGCCGTGGTGTAACCGGAGAAAACGGGGAATTTTCCTTTAGTTGGGGGGAAACC
ATCTCCTTTGGCATCGACACTTTTGAGCTTGGTTCTGTGCGTGGTAACAAGTCGACTATTGCATTGACTGAACTGGGTGA
TGAAGTTCGCGGGGCAAATATCGATCAGTTGATTCACCGCTATTCGAAGGCTGGACAAAATCACACGCGTGTAGTTCCGG
ATGAAGTACGCAAGGTTTTTGCTGAATATCCCAACGTGATTAACGAGATTATCAATCTCTCGTTATCCAATGGTGCGACG
CTGGGGGAAGGTGAGCAAGTCGTTAATCTGCCTAACGAATTTATCGAGCAGTTTAAGACGGGTCAGGCCAAAGAGATCGA
TACCGCGATTTGTGCGAAAAACGACGGTTGTAACGAGGCTCGCTGGTTCTCGCTGACGACGCGCAATGTTAATGACGGCC
AGATTCAGGGCGTTATTAACAAGCTGTGGGGCGTGGATACGAACTACAAATCTGTCAGCAAGTTCCATGTATTCCATGAC
TCTACTAACTTCTATGGCAGCACGGGTAATGCGCGCGGTCAGGCGGTGGTGAATATCTCCAACGCGGCCTTCCCGATTCT
GATGGCGCGTAATGATAAAAACTACTGGCTGGCGTTTGGCGAAAAACGCGCCTGGGATAAAAACGAGCTGGCGTACATTA
CGGAAGCGCCTTCTCTTGTTGAGCCGGAAAACGTTACGCGCGATACCGCCACCTTTAACCTGCCGTTTATTTCGCTGGGG
CAAGTGGGCGATGGCAAGCTGATGGTTATCGGTAACCCACACTACAACAGCATCCTGCGTTGCCCGAACGGTTACAGCTG
GAACGGGGGCGTTAATAAAGATGGGCAGTGTACGCTCAACAGCGACCCGGATGACATGAAGAACTTCATGGAGAACGTGC
TGCGCTATCTGTCAAATGATCGCTGGTTGCCGGATGCAAAATCCAGTATGACCGTGGGTACTAACCTGGAGACGGTGTAT
TTCAAAAAACATGGGCAGGTGCTGGGAAATAGCGCACCGTTTGCGTTCCACAAGGATTTCACTGGCATCACGGTCAAACC
GATGACCAGCTATGGCAATCTGAATCCAGATGAAGTTCCTCTGTTGATCCTCAATGGCTTTGAATACGTCACACAATGGG
GTAGCGATCCTTACTCCATTCCTCTGCGCGCAGATACCAGCAAACCGAAGCTGACCCAGCAGGATGTGACCGATTTGATC
GCCTATATGAACAAAGGTGGATCGGTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCGCATCTGGCTT
TGTACGTCTGCTTGATGCCGCAGGTTTGTCGATGGCGCTTAACAAGTCGGTAGTAAATAACGACCCGCAAGGCTACCCGG
ACCGCGTTCGTCAACGACGTTCAACGCCAATTTGGGTCTATGAGCGTTATCCGGCTGTCGATGGTAAACCACCGTATACC
ATTGATGACACCACGAAAGAAGTTATCTGGAAATATCAGCAAGAAAACAAACCTGATGACAAACCGAAGCTGGAAGTTGC
CAGCTGGCAGGAAGAAGTTGAGGGTAAACAGGTAACCCAATTCGCCTTTATTGATGAAGCCGACCACAAAACGCCTGAGT
CACTGGCTGCGGCAAAACAGAGAATTCTGGACGCGTTCCCAGGGCTGGAAGTGTGTAAGGATTCTGACTACCACTATGAG
GTCAACTGTCTGGAATACCGCCCAGGCACGGATGTGCCGGTAACCGGTGGCATGTATGTTCCGCAGTATACGCAGCTGGA
TCTGAGTGCCGACACCGCGAAAGCGATGCTGCAGGCTGCGGATTTAGGCACCAATATTCAGCGCCTGTATCAGCATGAGC
TTTATTTCCGTACCAATGGCCGCCAGGGTGAGCGTCTCAACAGCGTTGATCTGGAACGTTTATACCAAAACATGTCCGTC
TGGCTGTGGAACGAGACGAAATATCGTTATGAAGAGGGTAAAGAAGACGAGCTGGGCTTTAAAACGTTCACTGAGTTTCT
GAACTGCTACACCAACAATGCATACGTTGGCACGCAGTGTTCTGCTGAGCTGAAAAAATCGCTGATCGATAACAAGATGA
TTTATGGTGAAGAAAGCAGCAAAGCGGGCATGATGAACCCGAGCTACCCGCTCAACTATATGGAAAAACCGCTGACACGC
CTGATGCTGGGCCGTTCCTGGTGGGATCTGAACATCAAAGTTGATGTTGAGAAGTATCCGGGAGTGGTGAATACAAACGG
CGAAACCGTCACACAAAACATTAACTTGTACTCAGCTCCAACCAAATGGTTTGCAGGTAACATGCAGTCAACTGGCCTGT
GGGCACCTGCCCAGCAGGAAGTCAGCATTGAGTCAAAGGCGACAGTTCCTGTGACCGTGACTGTTGCGCTGGCCGACGAC
CTGACAGGACGAGAGAAGCATGAAGTTAGCCTGAATCGTCCACCCAGAGTGACAAAAACCTATGACCTGAAAGCCAATGA
TAAGGTGACGTTCAAAGTCCCTTACGGTGGTCTGATTTACATCAAGGGCGACAGCAAAGAGGTGCAATCAGCTGACTTCA
CCTTTACCGGTGTAGTAAAAGCGCCGTTCTATAAAGACGGTAAGTGGCAACACGATCTGAACTCCCCTGCCCCGCTGGGC
GAACTGGAGTCTGCCTCGTTCGTCTATACCACACCGAAGAAGAACCTGAATGCCAGCAATTACACTGGCGGACTGGAGCA
ATTCGCTAACGATCTGGATACCTTTGCCAGCTCGATGAATGACTTCTACGGCCGTGATAGCGAAGACGGTAAGCACCGGA
TGTTTACCTATAAAAACTTGCCGGGCCACAAACATCGTTTCGCCAACGATGTGCAGATCTCCATCGGTGATGCGCATTCG
GGTTATCCGGTAATGAACAGCAGCTTCTCGCCGAACAGCACCACGCTGCCGACGACGCCGCTGAACGACTGGCTGATCTG
GCATGAAGTCGGTCATAACGCCGCAGAAACGCCGTTGACTGTACCGGGTGCAACTGAAGTCGCTAACAACGTGCTGGCGC
TGTACATGCAGGATCGTTATCTCGGCAAGATGAACCGTGTCGCTGACGATATTACCGTCGCACCGGAATATCTGGAGGAA
AGCAACGGTCAGGCATGGGCGCGCGGCGGTGCGGGTGACCGTCTGCTGATGTACGCACAGCTGAAGGAATGGGCAGAGAA
AAACTTTGATATCAAGAAATGGTATCCAGATGGCACTCCTCTGCCAGAGTTTTACAGCGAGCGTGAAGGGATGAAAGGCT
GGAACCTGTTCCAGTTGATGCATCGTAAAGCATGCGGCGATGAGGTCAGCAATGACAAGTTTGGCGGCAAGAATTACTGT
GCTGAATCCAACGGTAACGCAGCGGACACGCTGATGCTGTGTGCCTCCTGGGTCGCCCAGACGGATCTTTCGGAGTTCTT
TAAGAAATGGAATCCGGGCGCGAATGCTTACCAGTTGCCGGGAGCGACGGAGATGAGCTTCGAAGGCGGTGTGAGCCAGT
CGGCGTACAACACGCTGGCGTCACTCAATCTGCCGAAACCGAAGCAAGGGCCGGAAACCATTAACAAGGTTACCGAGTAT
TCGATGCCTGCTGAATAA

Protein sequence :

MNKKFKYKKSLLAAILSATLLAGCDGGGSGSSSDTPPVDSGTGSLPEVKPDPTPNPEPTPEPTPEPTPEPEPTPEPTPDP
EPTPEPEPEPVPTKTGYLTLGGSLRVTGDITCNDESSDGFTFTPGDKVTCVAGNNTTIATFDTQSEAARSLRAVEKVSFS
LEDAQELAGSDNKKSNALSLVTSMNSCPANTEQVCLEFSSVIESKRFDSLYKQIDLAPEEFKKLVNEEVENNAATDKAPS
THTSPVVPATTPGTKPDLNASFVSANAEQFYQYQPSEIILSEGRLVDSQGDGVVGVNYYTNSGRGVTGENGEFSFSWGET
ISFGIDTFELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSKAGQNHTRVVPDEVRKVFAEYPNVINEIINLSLSNGAT
LGEGEQVVNLPNEFIEQFKTGQAKEIDTAICAKNDGCNEARWFSLTTRNVNDGQIQGVINKLWGVDTNYKSVSKFHVFHD
STNFYGSTGNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNELAYITEAPSLVEPENVTRDTATFNLPFISLG
QVGDGKLMVIGNPHYNSILRCPNGYSWNGGVNKDGQCTLNSDPDDMKNFMENVLRYLSNDRWLPDAKSSMTVGTNLETVY
FKKHGQVLGNSAPFAFHKDFTGITVKPMTSYGNLNPDEVPLLILNGFEYVTQWGSDPYSIPLRADTSKPKLTQQDVTDLI
AYMNKGGSVLIMENVMSNLKEESASGFVRLLDAAGLSMALNKSVVNNDPQGYPDRVRQRRSTPIWVYERYPAVDGKPPYT
IDDTTKEVIWKYQQENKPDDKPKLEVASWQEEVEGKQVTQFAFIDEADHKTPESLAAAKQRILDAFPGLEVCKDSDYHYE
VNCLEYRPGTDVPVTGGMYVPQYTQLDLSADTAKAMLQAADLGTNIQRLYQHELYFRTNGRQGERLNSVDLERLYQNMSV
WLWNETKYRYEEGKEDELGFKTFTEFLNCYTNNAYVGTQCSAELKKSLIDNKMIYGEESSKAGMMNPSYPLNYMEKPLTR
LMLGRSWWDLNIKVDVEKYPGVVNTNGETVTQNINLYSAPTKWFAGNMQSTGLWAPAQQEVSIESKATVPVTVTVALADD
LTGREKHEVSLNRPPRVTKTYDLKANDKVTFKVPYGGLIYIKGDSKEVQSADFTFTGVVKAPFYKDGKWQHDLNSPAPLG
ELESASFVYTTPKKNLNASNYTGGLEQFANDLDTFASSMNDFYGRDSEDGKHRMFTYKNLPGHKHRFANDVQISIGDAHS
GYPVMNSSFSPNSTTLPTTPLNDWLIWHEVGHNAAETPLTVPGATEVANNVLALYMQDRYLGKMNRVADDITVAPEYLEE
SNGQAWARGGAGDRLLMYAQLKEWAEKNFDIKKWYPDGTPLPEFYSEREGMKGWNLFQLMHRKACGDEVSNDKFGGKNYC
AESNGNAADTLMLCASWVAQTDLSEFFKKWNPGANAYQLPGATEMSFEGGVSQSAYNTLASLNLPKPKQGPETINKVTEY
SMPAE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	87
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	49
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
yghJ	YP_002388453.1	inner membrane lipoprotein	VFG0106	Protein	0.0	49