Gene Information

Name : ECO55CA74_17575 (ECO55CA74_17575)
Accession : YP_006160631.1
Strain : Escherichia coli RM12579
Genome accession: NC_017656
Putative virulence/resistance : Virulence
Product : lipoprotein acfD-like protein precursor
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3645950 - 3650377 bp
Length : 4428 bp
Strand : -
Note : -

DNA sequence :

TTGCCGGAAGTGAAACCTGATCCAACACCAAACCCGGAGCCGACGCCTGAGCCAACGCCGGACCCAGAGCCTACGCCAGA
ACCGACACCTGATCCTGAACCAACACCAGAACCGGAGCCAGAACCTGTTCCTACGAAAACGGGTTATCTGACCCTGGGCG
GAAGCCAGCGGGTAACTGGTGCTACCTGTAATGGTGAATCCAGCGATGGCTTTACATTTAAACCTGGCGAGGACGTTACT
TGCGTGGCGGGTAACACGACAATTGCCACCTTCAACACTCAGTCAGAAGCTGCGCGTAGCCTGCGTGCGGTTGAAAAAGT
GTCGTTTAGTCTTGAGGACGCGCAAGAACTGGCGGCTTCCGACAATAAGAAAAGCAATGCGGTTTCGCTGGTAACGTCCA
GTAACAGCTGTCCGGCGGATACAGAACAGGTTTGCCTGGAGTTCTCCTCAGTGATCGAGAGTAAACGCTTCGACTCGCTG
TATAAGCAAATCGATCTGGCACCGGAAGAGTTCAAAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCCGCGACCGATAA
AGCGCCATCCACTCATACTTCACCGGTCGTGCCCGCCACCACTCCGGGAACAAAACCGGATCTAAACGCTTCCTTCGTGT
CGGCTAACGCGGAACAGTTTTATCAGTATCAACCTACTGAAATTATTCGCTCCGAAGGCCGACTGGTAGATAGCCAGGGA
TATGGTGTTGCTGGCGTCAACTACTACACCAATTCAGGCCGTGGCGTGACAGGGGAAAATGGTGAATTTTCCTTTAGCTG
GGGCGAAACCATCTCCTTTGGTATCGATACCTTTGAACTGGGGTCAGTGCGCGGCAATAAGTCGACCATTGCATTGACTG
AACTGGGTGATGAAGTTCGCGGGGCGAATATCGATCAGCTTATTCATCGCTATTCGACGACCAGGCAAAATAATACCCGT
GTTGTGCCGGACGATGTACGCAAGGTCTTTGCCGAATATCCCAACGTGATCAACGAGATTATCAATCTCTCGTTATCCAA
CGGTGCGACGCTGGATGAAGGTGAGCAAGTTGTTAATCTGCCAAACGAATTTATTGAGCAGTTTAATACGGGTCAGGCCA
AAGAGATCGATACCGCGATTTGTGCGAAAACCGACGGTTGTAACGAGGTTCGCTGGTTCTCGCTGACGACGCGCAATGTT
AATGACGGCCAGATTCAGGGCGTTATTAACAAGCTGTGGGGTGTGGATGAAGATTACAAATCGGTGACGAAATTCCACGT
CTTTCATGACTCTACCAACTTCTATGGTAGCACCGGTAATGCGCGCGGTCAGGCGGTGGTGAATATCTCCAACGCGGCAT
TCCCGATTCTGATGGCGCGTAATGATAAAAACTACTGGCTGGCCTTCGGCGAAAAACGCGCCTGGGATAAAAATGAGCTG
GCGTACATTACTGAAGCGCCTTCCATTGTGCAACCTGAGAACGTGACACGCGAAACTGCGACCTTCAACCTGCCGTTTAT
CTCGCTGGGGCAAGTCGGCAAAGGCAAGCTGATGGTTATCGGTAACCCGCACTACAACAGCATTTTGCGTTGCCCGAACG
GTTACAGCTGGAACGGGAGCGTTAATAAAGACGGACAGTGTACGCTCAACAGCGACTCGGATGACATGAAGAACTTCATG
GAGAACGTGTTGCGCTATCTGTCAAATGATCGCTGGTTGCCGGATGCAAAATCCAATATGACCGTGGGTACTAACCTGGA
CACGGTGTATTTCAAAAAACACGGGCAGGTTACAGGAAACAGTGCTGCGTTTGGCTTCCATCCGGATTTTGCGGGTATCT
CTGTTGAGCATTTAAGTAGCTATGGCGATCTCGATCCGCAGGACATGCCACTGCTGATCCTCAACGGCTTTGAGTATGTG
ACTCAGGTTGGGGGCGATCCCTATGCAGTGCCTCTGCGTGCAGATACCAGCAAACCGAAGCTGACCCAGCAGGATGTGAC
CGATCTGATCGCCTATCTGAACAAAGGTGGCTCGGTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCG
CGTCTGGCTTTGTGCGTCTGCTGGATGCCGCAGGCCTGTCAATGGCACTGAACAAGTCGGTGGTGAATAACGATCCGCAG
GGGTATCCGGATCGCGTACGCCAACAACGCGCAACGGGTATTTGGGTCTATGAACGTTATCCGTTTGTTGATGGTAAACC
GCCGTATACCATTGATGAAACAACGAAAGAAGTTATCTGGAAATACCAGCAAGACAACAAGCCTGATGATAAGCCGAAAC
TGGAAGTTGCCAGCTGGCAGGAGGAAGTTGAGGGCAAACAGGTAACGCGTTATGCCTTTATTGATGAGGCGGAGTTTAAA
ACAAAAGAGTCTCTGGAGGCTGCAAAGGCAAAAATCTTTGAGAAGTTTCCTGGATTAAAGGAGTGTAAGGACCCAACTTA
CCACTACGAGGTCAACTGTCTGGAATATCGTCCTGGCACGGGGGTTCCGGTTACTGGTGGCATGTATGTTCCACAGTATA
CGCAATTAAGCCTTAACGCCGACACGGCAAAAGCGATGGTGCAGGCTGCGGATTTAGGCACCAACATTCAGCGTCTGTAT
CAGCATGAGCTCTACTTCCGGACCAATGGTCGCAAAGGTGAGCGTCTGAGCAGCGTCGATCTGGAACGTCTGTACCAGAA
CATGTCGGTCTGGCTGTGGAACGATACGAGCTATCGTTATGAAGAAGGCAAAAATGACGAGCTGGGCTTTAAAACGTTCA
CCGAGTTCCTGAACTGCTATACCAACGATGCCTATACCGATGGCACACGGTGCTCCGCAGATCTGAAAAAATCGCTGGTC
GATAACAACATGATCTACGGTGACGGTAGCAGCAAAGCGGGCATGATGAACCCGAGCTATCCACTCAACTATATGGAAAA
ACCGCTGACGCGCCTGATGCTGGGCCGTTCCTGGTGGGATCTGAACATTAAGGTTGATGTGGAGAAGTACCCTGGAGCGG
TATCTGTAGGGGGAGAAGAGGTTACTGAAACCATCAGCCTGTACTCGAATCCGACCAAATGGTTTGCAGGTAACATGCAG
TCAACTGGCCTGTGGGCACCGGCTCAGAAAGAGGTCACCATTAAGTCCAATGCGAACGTTCCTGTGACCGTCACCGTGGC
GCTGGCTGACGACCTGACCGGACGTGAGAAGCATGAAGTTGCGCTGAACCGTCCGCCAAGAGTGACTAAAACGTACTCTC
TGGACGCTAGCGGTACGGTGAAGTTCAAGGTGCCTTACGGTGGCCTGATTTATATCAAGGGCAATAGCTCTACCAATGAA
TCTGCCAGCTTCACCTTTACTGGCGTGGTAAAAGCACCGTTCTATAAAGACGGCGCATGGAAAAACGATCTGAACTCACC
GGCTCCGCTGGGTGAGCTGGAATCAGACGCTTTCGTCTATACCACACCGAAGAAGAACCTGAATGCCAGCAATTACACTG
GCGGATTGGAGCAATTCGCTAACGATCTGGACACCTTTGCCAGCTCGATGAATGACTTCTACGGTCGTAATGATGAAGAC
GGTAAGCACCGGATGTTTACCTTTAAAAACTTGCCGGGTCACAAACACCGTTTCACCAACGATGTGCAGATCTCCATCGG
TGATGCGCACTCTGGTTACCCGGTGATGAACAGCAGCTTCTCGCCGAACAGCACCACGCTGCCGACGACGCCGCTGAACG
ACTGGCTGATCTGGCATGAAGTCGGTCATAACGCCGCAGAAACGCCGTTGACTGTACCGGGTGCTACTGAAGTTGCGAAC
AACGTGCTGGCGCTGTACATGCAGGATCGCTATCTCGGCAAGATGAACCGTGTCGCTGACGATATTACCGTTGCGCCGGA
ATATCTGGAGGAGAGCAACGGTCAGGCATGGGCGCGTGGCGGTGCGGGTGATCGTCTGCTGATGTACGCACAACTGAAGG
AATGGGCAGAGAAAAACTTTGATATCACGAAGTGGTATCCAGAAGGTAACCTGCCTAAGTTCTACAGCGAGCGTGAAGGG
ATGAAAGGCTGGAACCTGTTCCAGTTGATGCATCGTAAAGCACGCGGCGATGAGGTCAGCAATGACAAGTTTGGCGGCAG
AAATTACTGTGCTGAATCCAACGGTAACGCTGCAGACACGCTGATGCTGTGTGCCTCCTGGGTCGCCCAGACGGATCTTT
CGGAGTTCTTTAAGAAATGGAATCCAGGTGCGAATGCTTACCAGTTGCCGGGGGCGAGCGAGATGAGCTTCGAGGGCGGT
GTGAGCCAGTCGGCTTACAACACGCTCGCGTCACTCGATCTGCCGAAACCGAAGCAAGGGCCGGAAACCATTAACAAGGT
TACCGAGCATAAGATGTCTGTCGAGTAA

Protein sequence :

MPEVKPDPTPNPEPTPEPTPDPEPTPEPTPDPEPTPEPEPEPVPTKTGYLTLGGSQRVTGATCNGESSDGFTFKPGEDVT
CVAGNTTIATFNTQSEAARSLRAVEKVSFSLEDAQELAASDNKKSNAVSLVTSSNSCPADTEQVCLEFSSVIESKRFDSL
YKQIDLAPEEFKKLVNEEVENNAATDKAPSTHTSPVVPATTPGTKPDLNASFVSANAEQFYQYQPTEIIRSEGRLVDSQG
YGVAGVNYYTNSGRGVTGENGEFSFSWGETISFGIDTFELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSTTRQNNTR
VVPDDVRKVFAEYPNVINEIINLSLSNGATLDEGEQVVNLPNEFIEQFNTGQAKEIDTAICAKTDGCNEVRWFSLTTRNV
NDGQIQGVINKLWGVDEDYKSVTKFHVFHDSTNFYGSTGNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNEL
AYITEAPSIVQPENVTRETATFNLPFISLGQVGKGKLMVIGNPHYNSILRCPNGYSWNGSVNKDGQCTLNSDSDDMKNFM
ENVLRYLSNDRWLPDAKSNMTVGTNLDTVYFKKHGQVTGNSAAFGFHPDFAGISVEHLSSYGDLDPQDMPLLILNGFEYV
TQVGGDPYAVPLRADTSKPKLTQQDVTDLIAYLNKGGSVLIMENVMSNLKEESASGFVRLLDAAGLSMALNKSVVNNDPQ
GYPDRVRQQRATGIWVYERYPFVDGKPPYTIDETTKEVIWKYQQDNKPDDKPKLEVASWQEEVEGKQVTRYAFIDEAEFK
TKESLEAAKAKIFEKFPGLKECKDPTYHYEVNCLEYRPGTGVPVTGGMYVPQYTQLSLNADTAKAMVQAADLGTNIQRLY
QHELYFRTNGRKGERLSSVDLERLYQNMSVWLWNDTSYRYEEGKNDELGFKTFTEFLNCYTNDAYTDGTRCSADLKKSLV
DNNMIYGDGSSKAGMMNPSYPLNYMEKPLTRLMLGRSWWDLNIKVDVEKYPGAVSVGGEEVTETISLYSNPTKWFAGNMQ
STGLWAPAQKEVTIKSNANVPVTVTVALADDLTGREKHEVALNRPPRVTKTYSLDASGTVKFKVPYGGLIYIKGNSSTNE
SASFTFTGVVKAPFYKDGAWKNDLNSPAPLGELESDAFVYTTPKKNLNASNYTGGLEQFANDLDTFASSMNDFYGRNDED
GKHRMFTFKNLPGHKHRFTNDVQISIGDAHSGYPVMNSSFSPNSTTLPTTPLNDWLIWHEVGHNAAETPLTVPGATEVAN
NVLALYMQDRYLGKMNRVADDITVAPEYLEESNGQAWARGGAGDRLLMYAQLKEWAEKNFDITKWYPEGNLPKFYSEREG
MKGWNLFQLMHRKARGDEVSNDKFGGRNYCAESNGNAADTLMLCASWVAQTDLSEFFKKWNPGANAYQLPGASEMSFEGG
VSQSAYNTLASLDLPKPKQGPETINKVTEHKMSVE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	90
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	48
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	47
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	47

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
ECO55CA74_17575	YP_006160631.1	lipoprotein acfD-like protein precursor	VFG0106	Protein	0.0	48