Gene Information

Name : acfD (EC042_3255)
Accession : YP_006097548.1
Strain : Escherichia coli 042
Genome accession: NC_017626
Putative virulence/resistance : Virulence
Product : accessory colonization factor
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3471541 - 3476112 bp
Length : 4572 bp
Strand : -
Note : -

DNA sequence :

ATGAATAAGAAATTTAAATATAAGAAATCGCTTTTAGCGGCTATTTTGAGTGCAACCCTGTTAGCCGGTTGTGATGGCGG
TGGCTCCGGATCTTCCTCCGATACGCCGCCTGTAGATTCTGGAACAGGGTCTTTGCCGGAAGTGAAACCTGATCCAACAC
CAAACCCGGAGCCGACGCCTGAGCCAACGCCGGACCCAGAACCTACGCCGGAACCGACACCTGATCCTGAGCCAACACCA
GAACCGGAGCCAGAACCTGTTCCTACGAAAACGGGTTATCTGACCCTGGGCGGAAGCCAGCGGATAACTGGTGCTACTTG
TAATGGTGAATCCAGCGATGGCTTTACCTTTACGCCAGGCGACAAAGTCACCTGTGTGGCAGGGAACAACACGACAATTG
CTACCTTCGACACCCAGTCAGAAGCTGCGCGTAGCCTGCGTGCGGTTGAAAAAGTGTCGTTTAGTCTTGAGGACGCGCAA
GAACTGGCGGCTTCCGATGACAAGAAAAGCAATGCGGTTTCGCTGGTAACGTCCAGTAACAGCTGTCCGGCGAATACAGA
ACAGGTTTGCCTGACGTTCTCCTCAGTGATCGAGAGTAAACGTTTCGACTCGCTGTATAAGCAAATCGATCTGGCACCGG
AAGAGTTCAAAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCCGCGACCGATAAAGCGCCATCCACTCATACTTCACCG
GTTGTGCCCGTCACCACGCCGGGAACAAAACCGGATCTGAACGCTTCCTTCGTGTCGGCTAACGCGGAACAGTTTTATCA
GTATCAACCCACTGAAATCATTCTCTCCGAAGGCCGACTGGTAGATAGCATGGGCAATGGTGTGGTTGGCGTAAATTACT
ACACCAGCTCAGGCCGTGGCGTAACTGGCGAAAACGGCAAATTCAACTTCAGCTGGGGCGAAACCATCTCCTTTGGTATC
GACACCTTTGAACTGGGCTCAGTGCGCGGCAATAAGTCGACCATTGCGTTGACTGAACTGGGTGACGAAGTTCGCGGCGC
GAATATTGATCAGCTTATTCATCGTTACTCCCAGGCCGGAAAAAATGATGAGCGTGAAGTGCCGGACGTAGTGCGCAAGG
TCTTTGCCGCGTATCCCAACGTAATCAACGAGATTATCAATCTCTCGTTATCCAATGGCGAGGCGTTGAGCGAAGGCGAT
CAAACCTTTGAGCGGACAAACGAATTTCTTGAGCAGTTTGAATCCGGGCAGGCTAAAGAGATTGATACGGCGATTTGTGA
CTCCCTTGGGGGCTGCAACTCTCAGCGTTGGTTCTCGTTGACAGCACGCAATGTTAACGAAGGTCAGATTCAGGGCGTTA
TCAACAAGCTGTGGGGTGTGGATAAAGATTACAAATCAGTGACGAAATTCCACGTCTTCCATGACTCTACCAACTTCTAT
GGCAGTACCGGTAATGCGCGCGGTCAGGCAGTGGTGAATATCTCCAACGCGGCCTTCCCGATTCTGATGGCGCGTAATGA
TAAAAACTACTGGCTGGCGTTTGGCGAAAAACGCGCCTGGGATAAAAACGAGCTGGCGTACATTACGGAAGCGCCTTCTC
TCGTTGAGCCGGAAAACGTTACGCGCGATACCGCCACCTTTAACCTGCCGTTTATTTCGCTGGGGCAAGTCGGTGAGGGC
AAACTGATGGTTATCGGTAACCCGCACTACAACAGCATTCTGCGCTGTCCGAACGGTTACAGCTGGGAAGGCGGTGTTGA
TAAAAACGGTCAGTGTACGCGTAACAGTGATTCTAATGATATGAAGCACTTTATGCAGAACGTGTTGCGCTATCTGTCCA
ACGATAAATGGACGCCGGACGCGAAAGCCAGCATGACCGTAGGCACCAACCTGGATACTGTCTATTTCAAACGTCATGGT
CAGGTTACAGGAAACAGTGCTGAGTTCGGCTTCCATCCGGATTTTGCGGGTATCTCCGTTGAGCATTTAAGTAGCTATGG
CGATCTCGACCCGCAGAAAATGCCGCTGCTGATCCTTAACGGCTTTGAGTATGTGACTCAGGTGGGGGGCGATCCCTATG
CAGTGCCTCTGCGTGCAGATACCAGCAAACCGAAGCTGAGCCAGCAGGATGTGACCGATCTGATCGCCTATCTGAACAAA
GGCGGTTCGGTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCGCGTCTGGCTTTGTGCGTCTGCTGGA
TGCCGCAGGCCTGTCAATGGCACTGAACAAGTCGGTGGTGAATAACGATCCGCAGGGTTATCCAGACCGCGTGCGCCAGC
GTCGAGCGACTGGCATTTGGGTTTATGAACGTTATCCGGTTGTGGAGGGTGAGCTGCCGTACACCATTGATTCCAAAACA
GGAAAAGTTACCTGGAAATATCAGATTGATAACAAGCCTGATAAGAAACCGAAACTGGAAGTAGCCAGCTGGCAAGAAGA
GGTTGATGGTAAACAGGTAACTCAATTCGCCTTTATCGATGAAGCCGACCACAAAACGACTGAATCTCTGGATGCTGCGA
AGAAGAAAATTCTGGAAAAATTCAAGGGATTAGAGGAGTGTAAGGACTCGACATATCACTACGAAATCAACTGCCTGGAA
TACCGTCCTGGCACGAACGTTCCGGCTACTGGTGGCATGTATGTTCCGCGCTATACGCAACTGAATCTCAGCGCCGACAC
TGCAAAAGCGATGGTGCAGGCGGCGGATTTAGGCACCAACATTCAGCGTCTGTATCAGCATGAGCTCTACTTCCGGACCA
ATGGTCGCAAAGGTGAGCGTCTGAGCAGCGTCGATCTGGAACGTCTGTACCAGAACATGTCGGTCTGGCTGTGGAATGAA
ATTGAATACAGCTATGACAGCAGCAAGGAAGACGAGCTGGGCTTTAAAACGTTCACCGAGTTCCTGAACTGCTACGCCAA
CGATGCCTATACTGGCGGCACGCAGTGTTCTGATGAGCTGAAAAAATCGCTGGTCGATAACAACATGATCTACGGCGAGA
AGAGCGTTAATAAAGCGGGCATGATGAACCCGAGCTATCCGCTCAACTATATGGAAAAACCGCTGACACGTCTGATGCTG
GGTCGTTCCTGGTGGGATCTGAACATCAAAGTTGATGTCGAGAAGTATCCGGGAGCAGTATCGGAAGAGGGGCAGGAGGT
TACTGAAAGCATCAGCCTGTACTCGAATCCGACCAAATGGTTTGCGGGTAACATGCAGTCTACTGGTCTGTGGGCTCCGG
CTCAAAAAGAGGTCACCATTAAGTCCAATGCGGACGTTCCTGTGACTGTCACCGTGGCGCTAGCCGACGACCTTACCGGA
CGTGAGAAGCATGAAGTTGCTCTGAACCGTCCGCCAAAAGTGACGAAAACCTATGAGCTGAAAGCCAATGGTGAGGTGAA
GTTTACGGTTCCTTACGGTGGTCTGATTTATATCAAGGGCAACAGCAAGGAGAATAATAAATCTGCCAGCTTCACCTTTA
CCGGTGTGGTGAAAGCGCCGTTCTATAAAAATGGCGCATGGAAAAACGCTCTGAACTCCCCTGCGCCGTTGGGCGAGCTG
GAATCAGACGCTTTCGTCTACACCACGCCGAAGAAGAACCTTGAGGCCAGCAATTTCACTGGTGGTGTAGCAGAATTCGC
TAAAGATCTGGATACCTTTGCCAGCTCGATGAATGATTTCTACGGTCGTAATGATGAAGACGGTAAGCACCGGATGTTTA
CCTATAAAAACTTGACGGGCCACAAGCATCGTTTCACCAACGATGTGCAGATCTCCATCGGTGATGCGCACTCTGGTTAT
CCGGTAATGAACAGCAGCTTCTCGACGAACAGCACCACGCTGCCGACGACGCCGCTGAACGACTGGCTGATCTGGCACGA
AGTTGGTCACAACGCCGCCGAAACGCCGCTGACTGTTCCAGGCGCGACCGAAGTGGCGAACAACGTGCTGGCGCTGTACA
TGCAGGATCGCTATCTCGGCAAGATGAACCGTGTCGCTGACGATATTACCGTCGCACCGGAATATCTGGAGGAGAGCAAC
AACCAGGCATGGGCACGCGGCGGTGCGGGTGACCGTCTGCTGATGTACGCGCAGCTGAAGGAGTGGGCAGAGAAAAACTT
TGATATCAAGAAATGGTATCCAGATGGCACTCCTCTGCCAGAGTTTTACAGCGAGCGTGAAGGGATGAAAGGCTGGAACC
TGTTCCAGTTGATGCATCGTAAAGCACGCGGCGATGAGGTCAGCAATGACAAGTTTGGCGGCAGAAATTACTGTGCTGAA
TCTAACGGTAACACTGCCGACACGCTGATGCTGTGTGCCTCCTGGGTCGCCCAGACGGATCTTTCGGAGTTCTTTAAGAA
ATGGAATCCGGGCGCGAATGCTTACCAGTTGCCGGGAGCGACGGAGATGAGCTTCGAAGGCGGTGTGAGCCAGTCGGCTT
ACAACACGCTCGCGTCACTCGATCTGCCGAAACCGAAGCAAGGGCCGGAAACCATTAATAAGGTTACCGAATATTCGATG
CCTGCTGAATAA

Protein sequence :

MNKKFKYKKSLLAAILSATLLAGCDGGGSGSSSDTPPVDSGTGSLPEVKPDPTPNPEPTPEPTPDPEPTPEPTPDPEPTP
EPEPEPVPTKTGYLTLGGSQRITGATCNGESSDGFTFTPGDKVTCVAGNNTTIATFDTQSEAARSLRAVEKVSFSLEDAQ
ELAASDDKKSNAVSLVTSSNSCPANTEQVCLTFSSVIESKRFDSLYKQIDLAPEEFKKLVNEEVENNAATDKAPSTHTSP
VVPVTTPGTKPDLNASFVSANAEQFYQYQPTEIILSEGRLVDSMGNGVVGVNYYTSSGRGVTGENGKFNFSWGETISFGI
DTFELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSQAGKNDEREVPDVVRKVFAAYPNVINEIINLSLSNGEALSEGD
QTFERTNEFLEQFESGQAKEIDTAICDSLGGCNSQRWFSLTARNVNEGQIQGVINKLWGVDKDYKSVTKFHVFHDSTNFY
GSTGNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNELAYITEAPSLVEPENVTRDTATFNLPFISLGQVGEG
KLMVIGNPHYNSILRCPNGYSWEGGVDKNGQCTRNSDSNDMKHFMQNVLRYLSNDKWTPDAKASMTVGTNLDTVYFKRHG
QVTGNSAEFGFHPDFAGISVEHLSSYGDLDPQKMPLLILNGFEYVTQVGGDPYAVPLRADTSKPKLSQQDVTDLIAYLNK
GGSVLIMENVMSNLKEESASGFVRLLDAAGLSMALNKSVVNNDPQGYPDRVRQRRATGIWVYERYPVVEGELPYTIDSKT
GKVTWKYQIDNKPDKKPKLEVASWQEEVDGKQVTQFAFIDEADHKTTESLDAAKKKILEKFKGLEECKDSTYHYEINCLE
YRPGTNVPATGGMYVPRYTQLNLSADTAKAMVQAADLGTNIQRLYQHELYFRTNGRKGERLSSVDLERLYQNMSVWLWNE
IEYSYDSSKEDELGFKTFTEFLNCYANDAYTGGTQCSDELKKSLVDNNMIYGEKSVNKAGMMNPSYPLNYMEKPLTRLML
GRSWWDLNIKVDVEKYPGAVSEEGQEVTESISLYSNPTKWFAGNMQSTGLWAPAQKEVTIKSNADVPVTVTVALADDLTG
REKHEVALNRPPKVTKTYELKANGEVKFTVPYGGLIYIKGNSKENNKSASFTFTGVVKAPFYKNGAWKNALNSPAPLGEL
ESDAFVYTTPKKNLEASNFTGGVAEFAKDLDTFASSMNDFYGRNDEDGKHRMFTYKNLTGHKHRFTNDVQISIGDAHSGY
PVMNSSFSTNSTTLPTTPLNDWLIWHEVGHNAAETPLTVPGATEVANNVLALYMQDRYLGKMNRVADDITVAPEYLEESN
NQAWARGGAGDRLLMYAQLKEWAEKNFDIKKWYPDGTPLPEFYSEREGMKGWNLFQLMHRKARGDEVSNDKFGGRNYCAE
SNGNTADTLMLCASWVAQTDLSEFFKKWNPGANAYQLPGATEMSFEGGVSQSAYNTLASLDLPKPKQGPETINKVTEYSM
PAE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	95
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	49
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
acfD	YP_006097548.1	accessory colonization factor	VFG0106	Protein	0.0	49