Gene Information

Name : yghJ (B21_02792)
Accession : YP_003000555.1
Strain : Escherichia coli BL21(DE3)
Genome accession: NC_012892
Putative virulence/resistance : Virulence
Product : yghJ
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 2974791 - 2979344 bp
Length : 4554 bp
Strand : -
Note : -

DNA sequence :

ATGAATAAGAAATTTAAATATAAGAAATCGCTTTTAGCGGCTATTTTGAGCGCAACCCTGTTAGCCGGTTGTGATGGCGG
TGGCTCCGGATCTTCCTCCGATACGCCGCCTGTAGATTCTGGAACAGGGTCTTTGCCGGAAGTGAAACCTGATCCAACAC
CAAACCCGGAGCCGACGCCTGAGCCAACGCCGGACCCAGAACCTACGCCGGAACCGACACCTGATCCAGAGCCAGAACCG
GAGCCAGAACCTGTTCCTACGAAAACGGGTTATCTGACCCTGGGCGGAAGCCAGCGGGTAACTGGTGCTACCTGTAATGG
TGAAACCAGCGATGGCTTTACATTTACACCTGGTGAGGACGTTACTTGCGTGGCGGGTAACACGACAATTGCCACCTTCA
ACACTCAGTCAGAAGCTGCGCGTAGCCTGCGTGCGGTTGAAAAAGTGTCGTTTAGTCTTGAGGACGCGCAAGAACTGGCG
GCTTCCGACAATAAGAAAAGCAATGCGGTTTCGCTGGTAACGTCCAGTAACAGCTGTCCGGCGGATACAGAACAGGTTTG
CCTGACGTTCTCCTCGGTGATCGAGAGTAAACGTTTCGACTCGCTGTATAAGCAAATCGATCTGGCACCGGAAGAGTTCA
AAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCTGCGACCGATAAAGCGCCATCCACTCATACCTCACCGGTCGTGCCT
GTCACCACGCCGGGAACAAAACCGGATCTGAACGCTTCCTTCGTGTCGGCTAACGCGGAACAGTTTTATCAGTATCAACC
TTCGGAAATCATTCTCTCCGAAGGCCGACTGGTCGATAGCCAGGGATATGGTGTTGCTGGCGTCAACTACTACACCAATT
CAGGCCGTGGCGTGACAGGGGAAAATGGTGAATTTTCCTTTAGCTGGGGCGAAACCATCTCCTTTGGTATCGATACCTTT
GAACTGGGGTCAGTGCGCGGCAATAAGTCGACCATTGCATTGACTGAACTGGGTGATGAAGTTCGCGGGGCGAATATTGA
TCAGCTTATTCATCGCTATTCGACGACCGGGCAAAATAATACCCGTGTTGTGCCGGACGATGTACGCAAGGTCTTTGCCG
AATATCCCAACGTGATCAACGAGATTATCAATCTCTCGTTATCCAACGGTGCGACGCTGGATGAAGGTGAGCAAGTTGTT
AATCTGCCAAACGAATTTATTGAGCAGTTTAAGACGGGTCAATCCAAAGAGATCGATACCGCGATTTGTGCGAAAACCGA
CGGTTGTAACGAGGCTCGCTGGTTCTCGCTGACGACGCGCAATGTTAATGACGGCCAGATTCAGGGCGTTATCAACAAGC
TGTGGGGTGTGGATACAAGTTACAAATCTGTCAGCAAGTTCCATGTATTCCATGACTCCACCAACTTCTATGGCAGCACC
GGTAATGCGCGCGGTCAGGCGGTGGTGAATATCTCTAACGCGGCCTTCCCGATTCTGATGGCGCGTAATGATAAAAACTA
CTGGCTGGCCTTCGGCGAGAAACGCGCCTGGGATAAAAACGAGCTGGCGTACATTACGGAAGCGCCTTCTCTTGTTGAGC
CGGAAAACGTTACGCGCGATACCGCCACCTTTAACCTGCCGTTTATTTCGCTGGGGCAAGTCGGTGAGGGCAAACTGATG
GTTATCGGTAACCCGCACTACAACAGCATTTTGCGTTGTCCGAACGGTTACAGCTGGAACGGGGGCGTTAATAAAGACGG
GCAGTGTACGCTCAGCGGTGATTCAGATGACATGAAGCACTTCATGCAGAACGTACTGCGCTATCTGTCCGACGATAAAT
GGACTCCGGACGCGAAAGCCAGCATGACCGTAGGCACCAACCTGGATACTGTCTATTTCAAACGTCATGGTCAGGTTACA
GGAAACAGTGCTGAGTTCGGCTTCCATCCGGATTTTGCGGGTATCTCTGTTGAGCATTTAAGTAGCTATGGCGATCTCGA
CCCACAGGAAATGCCGCTGCTGATCCTTAACGGCTTTGAATATGTGACTCAGGTGGGGGGCGATCCCTATGCAGTGCCTC
TGCGTGCAGATACCAGCAAACCGAAGCTGAGCCAGCAGGATGTGACCGATCTGATCGCCTATCTGAACAAAGGCGGTTCG
GTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCGCGTCTGGCTTTGTGCGTCTGCTGGATGCCGCGGG
TCTGTCAATGGCACTGAACAAGTCGGTGGTGAATAACGATCCGCAGGGTTATCCGAACCGCGAGCGCCAGCGCCGAGCGG
ATGGCATTTGGGTTTATGAACGTTATCCGGTTGTGGAAGGTGCGCTGCCGTACACCATTAATTCTGAGACAGGCGAAGTT
ACCTGGAAATATCAGATTGATAACAAACCTGATAAGAAACCGAAGCTGGAAGTTGCCAGTTGGCAAGAAGAGGTTGATGG
TGAACAAGTAACTCAATACGCGTTTATTGATGAAGCCGACTACAAAACGCCTGAGTTGCTGGCTGCGGCGAAGAAGAGAA
TTCTGGACGCGTTCCCTGGGCTGGAAGAGTGTAAGGATTCTGACTACCACTACGAGGTCAACTGTCTGGAATACCGTCCT
GGCACGGGGGTTCCGGTTACTGGTGGCATGTATGTTCCACAGTATACGCAACTAAGCCTTAACGCCGACACGGCAAAAGC
GATGGTGCAGGCTGCGGATTTAGGCACCAATATTCAGCGTCTTTATCAGCATGAGCTCTACTTCCGGACCAATGGTCGCA
AAGGTGAGCGTCTGAGCAGCGTCGATCTGGAACGTCTGTACCAGAACATGTCGGTCTGGCTGTGGAATAAAATTGAATAT
CGCTATGAAAACGACAAGGATGACGAGCTGGGCTTTAAAACGTTCACTGAGTTCCTGAACTGCTACGCCAACAATGCCTA
TAGCGAAGGCACGCAGTGTTCTGCAGATCTGAAAAAATCGCTTGTCGATAACAACATGATCTACGGTGACGGTAGCAGCA
AAGCAGGCATGATGAACCCAAGCTATCCGCTCAACTATATGGAAAAACCGCTGACGCGCCTGATGCTGGGTCGTTCCTGG
TGGGATCTGAACATCAAAGTTGATGTCGAGAAGTATCCGGGAGCGGTATCGGCAGAAGGTGAGAAGGTTACTGAAAGCAT
CAGCCTGTACTCGAACCCGACCAAATGGTTTGCGGGTAACATGCAGTCTACTGGCCTGTGGGCTCCGGCTCAGAAAGAGG
TCACCATTGAGTCTACTGCATCAGTTCCTGTGACTGTCACCGTGGCGCTGGCCGACGATCTGACCGGACGCGAGAAGCAT
GAAGTCGCGCTGAACCGTCCGCCAAAAGTGACGAAAACCTATGATCTGAAAGCCAATGATAAGGTGACCTTCAAGGTGCC
TTACGGTGGTCTGATTTATATCAAGGGCAACAGCCCAAAGAATGAGTCAGCCGAATTCACCTTTACTGGTGTGGTAAAAG
CGCCGTTCTATAAAGACGGCGAATGGAAAAACGCTCTGAACTCCCCTGCGCCGCTGGGCGAGCTGGAATCAGACGCTTTC
GTTTATACCACGCCGAAGAAGAACCTTGAGGCCAGCAATTTCACTGGTGGTGTAGCAGAATTCGCTAACGATCTGGATAC
CTTTGCCAGCTCGATGAATGACTTCTACGGTCGTGATGGCGAAAGCGGTAAGCACCGGATGTTTACCTATAAAGCATTGA
CGGGGCATAAACATCGTTTCGCCAACGATGTGCAGATCTCCATCGGTGATGCGCACTCGGGTTACCCGGTAATGAACAGC
AGCTTCTCGACGAACAGCACCACGCTGCCGACGACGCCGCTGAACGACTGGCTGATTTGGCACGAAGTCGGTCATAACGC
TGCAGAAACACCGCTGAACGTACCGGGTGCAACTGAAGTGGCGAACAACGTGCTGGCGCTGTACATGCAGGATCGCTATC
TCGGTAAGATGAACCGTGTCGCTGACGACATTACCGTCGCGCCGGAATATCTGGACGAGAGCAACGGTCAGGCATGGGCG
CGCGGCGGTGCGGGTGACCGTCTGCTGATGTACGCACAACTGAAGGAATGGGCAGAGAAAAACTTTGATATCAAGAAATG
GTATCCAGAAGGCTCTCTGCCAGCGTTCTACAGCGATCGTGAAGGGATGAAAGGCTGGAACCTGTTCCAGTTGATGCACC
GTAAAGCACGCGGCGATGATGTTGGTAAAACCAAGTTTGGCGAAAGAAATTACTGTGCTGAGTCAAACGGTAACGCTGCC
GACACGCTGATGCTGTGCGCCTCCTGGGTCGCCCAGACGGATCTTTCGGAGTTCTTTAAGAAATGGAATCCAGGTGCGAA
TGCTTACCAGCTGCCGGGGGCGAGCGAGATGAGCTTCGAGGGCGGTGTGAGCCAGTCGGCTTACAACACGCTCGCGTCGC
TCAAGCTGCCGAAACCGGAACAGGGGCCGGAAACCATTAATAAGGTTACCGAGCATAAGATGTCTGCCGAGTAA

Protein sequence :

MNKKFKYKKSLLAAILSATLLAGCDGGGSGSSSDTPPVDSGTGSLPEVKPDPTPNPEPTPEPTPDPEPTPEPTPDPEPEP
EPEPVPTKTGYLTLGGSQRVTGATCNGETSDGFTFTPGEDVTCVAGNTTIATFNTQSEAARSLRAVEKVSFSLEDAQELA
ASDNKKSNAVSLVTSSNSCPADTEQVCLTFSSVIESKRFDSLYKQIDLAPEEFKKLVNEEVENNAATDKAPSTHTSPVVP
VTTPGTKPDLNASFVSANAEQFYQYQPSEIILSEGRLVDSQGYGVAGVNYYTNSGRGVTGENGEFSFSWGETISFGIDTF
ELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSTTGQNNTRVVPDDVRKVFAEYPNVINEIINLSLSNGATLDEGEQVV
NLPNEFIEQFKTGQSKEIDTAICAKTDGCNEARWFSLTTRNVNDGQIQGVINKLWGVDTSYKSVSKFHVFHDSTNFYGST
GNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNELAYITEAPSLVEPENVTRDTATFNLPFISLGQVGEGKLM
VIGNPHYNSILRCPNGYSWNGGVNKDGQCTLSGDSDDMKHFMQNVLRYLSDDKWTPDAKASMTVGTNLDTVYFKRHGQVT
GNSAEFGFHPDFAGISVEHLSSYGDLDPQEMPLLILNGFEYVTQVGGDPYAVPLRADTSKPKLSQQDVTDLIAYLNKGGS
VLIMENVMSNLKEESASGFVRLLDAAGLSMALNKSVVNNDPQGYPNRERQRRADGIWVYERYPVVEGALPYTINSETGEV
TWKYQIDNKPDKKPKLEVASWQEEVDGEQVTQYAFIDEADYKTPELLAAAKKRILDAFPGLEECKDSDYHYEVNCLEYRP
GTGVPVTGGMYVPQYTQLSLNADTAKAMVQAADLGTNIQRLYQHELYFRTNGRKGERLSSVDLERLYQNMSVWLWNKIEY
RYENDKDDELGFKTFTEFLNCYANNAYSEGTQCSADLKKSLVDNNMIYGDGSSKAGMMNPSYPLNYMEKPLTRLMLGRSW
WDLNIKVDVEKYPGAVSAEGEKVTESISLYSNPTKWFAGNMQSTGLWAPAQKEVTIESTASVPVTVTVALADDLTGREKH
EVALNRPPKVTKTYDLKANDKVTFKVPYGGLIYIKGNSPKNESAEFTFTGVVKAPFYKDGEWKNALNSPAPLGELESDAF
VYTTPKKNLEASNFTGGVAEFANDLDTFASSMNDFYGRDGESGKHRMFTYKALTGHKHRFANDVQISIGDAHSGYPVMNS
SFSTNSTTLPTTPLNDWLIWHEVGHNAAETPLNVPGATEVANNVLALYMQDRYLGKMNRVADDITVAPEYLDESNGQAWA
RGGAGDRLLMYAQLKEWAEKNFDIKKWYPEGSLPAFYSDREGMKGWNLFQLMHRKARGDDVGKTKFGERNYCAESNGNAA
DTLMLCASWVAQTDLSEFFKKWNPGANAYQLPGASEMSFEGGVSQSAYNTLASLKLPKPEQGPETINKVTEHKMSAE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	91
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	48
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
yghJ	YP_003000555.1	yghJ	VFG0106	Protein	0.0	48