Gene Information

Name : UM146_01530 (UM146_01530)
Accession : YP_006109247.1
Strain : Escherichia coli UM146
Genome accession: NC_017632
Putative virulence/resistance : Virulence
Product : putative lipoprotein AcfD-like precursor
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 319834 - 324264 bp
Length : 4431 bp
Strand : +
Note : -

DNA sequence :

TTGCCGGAAGTGAAACCCGATCCAACACCAACCCCGGAGCCGACACCTGAGCCGACGCCGGACCCAGAACCTACGCCGGA
TCCAACACCTGATCCTGAGCCGACACCAGAACCGGAGCCAGAACCTGTTCCTACGAAAACGGGTTATCTGACCCTGGGCG
GAAGCCAGCGGGTAACTGGTGCTACCTGTAATGGTGAATCCAGCGATGGCTTTACCTTTACGCCAGGCAATACCGTGAGT
TGTGTGGTGGGCAGTACGACCATTGCAACATTCAACACCCAGTCAGAAGCTGCGCGTAGCCTGCGTGCGGTTGACAAAGT
GTCGTTTAGCCTGGAGGACGCGCAGGAGCTGGCGAATTCTGAAAATAAGAAAACCAACGCCATCTCTCTGGTGACGTCCA
GCGACAGTTGCCCCGCAGATGCAGAACAGCTTTGTCTTACTTTCTCGTCAGTGGTTGATCGCGCGCGATTTGAAAAACTG
TATAAGCAAATTGATCTGGCAACAGACAATTTCAGCAAGCTGGTCAATGAAGAGGTGGAAAACAATGCTGCGACTGATAA
AGCGCCGTCCACCCATACCTCAACGGTAGTGCCAGTCACGACAGAGGGAACAAAACCGGATCTGAACGCGTCCTTCGTGT
CGGCTAACGCGGAACAGTTTTATCAGTATCAACCCACTGAAATCATTCTTTCCGAAGGCCAACTGGTGGATAGCCTGGGG
AACGGTGTTGCTGGCGTTGACTACTACACCAATTCAGGCCGTGGCGTAACTGACGAAAACGGTAAATTTTCCTTTAGCTG
GGGCGAAACCATCTCCTTTGGTATCGATACCTTTGAACTGGGCTCAGTACGTGGCAATAAGTCGACCATTGCGCTGACTG
AATTGGGTGATGAAGTTCGCGGGGCAAATATCGATCAGCTCATTCATCGTTATTCGACGACTGGTCAAAATAATACTCGT
GTTGTTCCGGACGATGTACGCAAGGTCTTTGCCGAATATCCCAACGTGATCAACGAGATAATCAATCTTTCGTTATCCAA
CGGTGCGACGCTGGATGAAGGCGATCAAAACGTTGTGCTGCCTAACGAATTTATCGAGCAGTTTAAGACGGGTCAGGCCA
AAGAGATCGATACCGCGATTTGTGCGAAAACCGACGGTTGTAACGAGGCTCGCTGGTTCTCGCTGACAACGCGCAATGTT
AATGACGGCCAGATTCAGGGCGTTATTAACAAGCTGTGGGGCGTGGATACGAACTATCAGTCTGTCAGCAAGTTCCACGT
CTTCCATGACTCTACCAACTTCTATGGCAGCACCGGTAACGCGCGCGGTCAGGCGGTGGTAAATATCTCCAACTCGGCAT
TCCCGATTCTGATGGCGCGTAATGATAAAAACTACTGGCTGGCGTTTGGCGAAAAACGCGCCTGGGATAAAAATGAGCTG
GCGTACATTACGGAAGCGCCTTCCATTGTGCAGCCAGAGAACGTTACGCGCGATACTGCGACTTTCAACCTGCCGTTTAT
TTCGCTGGGGCAAGTCGGTGAAGGCAAACTGATGGTTATCGGTAACCCGCACTACAACAGCATCCTGCGTTGCCCGAACG
GTTACAGTTGGGGCGGTGGTGTTAATAGTAAAGGTGAGTGTACGCTCAGCGGTGATTCTGATGACATGAAGCACTTTATG
CAGAACGTACTGCGCTACTTGTCAAATGACATCTGGCAGCCAAATACCAAGAGCATCATGACTGTCGGCACCAACCTGGA
GAACGTTTATTTCAAAAAAGCGGGCCAGGTATTGGGAAATAGTGCACCATTTGCTTTCCATGAGGATTTCACTGGTATCA
CGGTTAAACAGTTGACCAGCTATGGCGATCTGAATCCGGAAGAGATTCCGTTGCTGATCCTCAACGGCTTTGAATATGTG
ACTCAGTGGTCTGGCGATCCCTATGCTGTGCCTCTGCGTGCAGATACCAGCAAACCGAAGCTGACTCAGCAGGATGTGAC
CGATCTGATCGCTTATCTGAACAAAGGTGGCTCGGTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCG
CGTCCAGTTTTGTGCGTCTGCTGGATGCCGCGGGTCTGTCAATGGCTCTGAACAAATCGGTGGTGAACAACGATCCGCAA
GGGTATCCGGATCGCGTTCGTCAGCGTCGCGCGACTGGCATTTGGGTTTATGAACGTTATCCTGCTGCAGACGGCGCGCA
ACCGCCGTACACCATCGACCCAAATACAGGGGAAGTGACCTGGAAATACCAGCAAGACAACAAGCCTGATGACAAGCCGA
AACTGGAAGTTGCGAGCTGGCAGGAGGAAGTTGAGGGCAAACAGGTAACGCGTTATGCCTTTATTGATGAAGCGGAATAC
ACAACAGAAGAATCTCTGGAAGCGGCAAAGGCAAAAATCTTTGAGAAGTTTCCTGGGTTACAGGAGTGTAAGGACTCGAC
TTACCATTACGAGATTAACTGTTTGGAGCGCCGCCCAGGCACGGATGTTCCGGTAACAGGTGGCATGTATGTTCCGCGCT
ATACGCAACTGAATCTTGACGCCGACACCGCGAAAGCGATGGTGCAGGCGGCGGATTTAGGCACCAACATTCAGCGCCTG
TATCAGCATGAGCTTTATTTCCGTACCAAAGGCAGTAAAGGTGAGCGTCTGAACAGTGTTGATCTGGAACGTCTGTACCA
GAACATGTCGGTCTGGCTGTGGAACGATACGAAATATCGTTACGAAGAGGGCAAGGAAGATGAGCTGGGCTTTAAAACGT
TCACCGAGTTCCTGAACTGCTACGCCAATGATGCCTATGCAGGCGGCACCAAGTGCTCCGCAGATCTGAAAAAATCGCTG
GTCGATAACAACATGATCTACGGTGACGGTAGCAGCAAAGCGGGCATGATGAACCCAAGCTATCCGCTCAACTATATGGA
AAAACCGCTGACGCGTCTGATGCTGGGCCGTTCCTGGTGGGATCTGAACATTAAGGTTGATGTGGAGAAGTACCCAGGAT
CCGTATCGGCAAAGGGTGAGAGCGTTACGGAAAACATCAGCCTGTACTCGAATCCGACCAAATGGTTTGCGGGTAACATG
CAGTCAACCGGCCTGTGGGCACCGGCCCAGCAGGACGTCACCATTAAGTCTTCGGCGTCAGTCCCAGTGACTGTTACCGT
GGCGCTGGCTGACGACCTGACTGGACGTGAGAAGCATGAAGTTGCGCTGAACCGTCCGCCAAGAGTGACTAAAACGTATA
CTCTGGAGGCTAACGGTGAAGTGACCTTCAAGGTGCCTTATGGTGGTCTGATTTATATCAAGGGCGACAGTAAGGATGAT
GTTTCTGCTAACTTCACCTTTACCGGTGTAGTAAAAGCGCCGTTCTATAAAGACGGCGAATGGAAAAACGATCTGGACTC
ACCGGCGCCGCTGGGCGAGCTGGAGTCTGCGTCGTTCGTCTATACCACGCCGAAGAAGAACCTTGAGGCCAGCAATTTCA
CTGGTGGTGTAGCAGAATTCGCTAAAGATCTGGATACCTTTGCCAGCTCGATGAATGACTTCTACGGTCGTAATGATGAA
GACGGTAAGCACCGGATGTTTACCTATAAAAACTTGACGGGGCACAAGCATCGTTTCACCAACGATGTGCAGATCTCCAT
CGGTGATGCGCACTCGGGTTATCCGGTAATGAACAGCAGCTTCTCGACGAACAGCACCACGCTGCCGACGACGCCGCTGA
ACGACTGGCTGATTTGGCACGAAGTCGGTCATAACGCTGCAGAAACACCGCTGAACGTACCGGGTGCAACTGAAGTGGCG
AACAACGTGCTGGCGCTGTACATGCAGGATCGCTATCTCGGTAAGATGAACCGTGTCGCTGACGACATTACCGTCGCGCC
GGAATATCTGGACGAGAGCAACGGTCAGGCCTGGGCGCGCGGCGGTGCGGGTGACCGTCTGCTGATGTACGCACAGTTGA
AGGAGTGGGCAGAGGAAAACTTTGATATCAAACAGTGGTATCCAGATGGTGAGCTGCCTAAGTTCTACAGCGATCGTAAA
GGGATGAAGGGCTGGAACCTGTTCCAGTTGATGCACCGTAAAGCGCGCGGCGATGATGTTGGTAACAGCACCTTTGGTGG
CAAGAATTACTGTGCTGAATCCAATGGTAACGCTGCCGACACGCTGATGCTGTGTGCATCCTGGGTCGCTCAGGCGGATC
TTTCGGAATTCTTTAAGAAATGGAATCCGGGTGCAAGTGCTTACCAGTTGCCGGGAGCAACGGAGATGAGTTTCCAGGGC
GGTGTGAGCTCTTCGGCTTACAGCACGCTGGCGTCACTCAAGCTGCCGAAACCGGAAAAAGGGCCGGAAACCATTAACAA
GGTTACCGAGCATAAGATGTCTGCCGAGTAA

Protein sequence :

MPEVKPDPTPTPEPTPEPTPDPEPTPDPTPDPEPTPEPEPEPVPTKTGYLTLGGSQRVTGATCNGESSDGFTFTPGNTVS
CVVGSTTIATFNTQSEAARSLRAVDKVSFSLEDAQELANSENKKTNAISLVTSSDSCPADAEQLCLTFSSVVDRARFEKL
YKQIDLATDNFSKLVNEEVENNAATDKAPSTHTSTVVPVTTEGTKPDLNASFVSANAEQFYQYQPTEIILSEGQLVDSLG
NGVAGVDYYTNSGRGVTDENGKFSFSWGETISFGIDTFELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSTTGQNNTR
VVPDDVRKVFAEYPNVINEIINLSLSNGATLDEGDQNVVLPNEFIEQFKTGQAKEIDTAICAKTDGCNEARWFSLTTRNV
NDGQIQGVINKLWGVDTNYQSVSKFHVFHDSTNFYGSTGNARGQAVVNISNSAFPILMARNDKNYWLAFGEKRAWDKNEL
AYITEAPSIVQPENVTRDTATFNLPFISLGQVGEGKLMVIGNPHYNSILRCPNGYSWGGGVNSKGECTLSGDSDDMKHFM
QNVLRYLSNDIWQPNTKSIMTVGTNLENVYFKKAGQVLGNSAPFAFHEDFTGITVKQLTSYGDLNPEEIPLLILNGFEYV
TQWSGDPYAVPLRADTSKPKLTQQDVTDLIAYLNKGGSVLIMENVMSNLKEESASSFVRLLDAAGLSMALNKSVVNNDPQ
GYPDRVRQRRATGIWVYERYPAADGAQPPYTIDPNTGEVTWKYQQDNKPDDKPKLEVASWQEEVEGKQVTRYAFIDEAEY
TTEESLEAAKAKIFEKFPGLQECKDSTYHYEINCLERRPGTDVPVTGGMYVPRYTQLNLDADTAKAMVQAADLGTNIQRL
YQHELYFRTKGSKGERLNSVDLERLYQNMSVWLWNDTKYRYEEGKEDELGFKTFTEFLNCYANDAYAGGTKCSADLKKSL
VDNNMIYGDGSSKAGMMNPSYPLNYMEKPLTRLMLGRSWWDLNIKVDVEKYPGSVSAKGESVTENISLYSNPTKWFAGNM
QSTGLWAPAQQDVTIKSSASVPVTVTVALADDLTGREKHEVALNRPPRVTKTYTLEANGEVTFKVPYGGLIYIKGDSKDD
VSANFTFTGVVKAPFYKDGEWKNDLDSPAPLGELESASFVYTTPKKNLEASNFTGGVAEFAKDLDTFASSMNDFYGRNDE
DGKHRMFTYKNLTGHKHRFTNDVQISIGDAHSGYPVMNSSFSTNSTTLPTTPLNDWLIWHEVGHNAAETPLNVPGATEVA
NNVLALYMQDRYLGKMNRVADDITVAPEYLDESNGQAWARGGAGDRLLMYAQLKEWAEENFDIKQWYPDGELPKFYSDRK
GMKGWNLFQLMHRKARGDDVGNSTFGGKNYCAESNGNAADTLMLCASWVAQADLSEFFKKWNPGASAYQLPGATEMSFQG
GVSSSAYSTLASLKLPKPEKGPETINKVTEHKMSAE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	86
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	49
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
UM146_01530	YP_006109247.1	putative lipoprotein AcfD-like precursor	VFG0106	Protein	0.0	49