Gene Information

Name : EcSMS35_3251 (EcSMS35_3251)
Accession : YP_001745231.1
Strain : Escherichia coli SMS-3-5
Genome accession: NC_010498
Putative virulence/resistance : Virulence
Product : hypothetical protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3322667 - 3327223 bp
Length : 4557 bp
Strand : -
Note : -

DNA sequence :

ATGAATAAGAAATTTAAATATAAGAAATCGCTTTTAGCGGCTATTTTGAGCGCAACCCTGTTAGCCGGTTGTGATGGCGG
TGGTTCCGGATCTTCCTCCGATACGCCGCCTGTAGATTCTGGAACAGGGTCTTTGCCGGAAGTGAAACCTGATCCAACAC
CAAACCCGGAGCCGACGCCTGAGCCAACGCCGGACCCAGAGCCTACGCCAGAACCGATACCTGATCCTGAACCAACACCA
GAACCGGAGCCAGAACCTGTTCCTACGAAAACGGGTTATCTGACCCTGGGCGGAAGCCAGCGGGTAACTGGTGCTACCTG
TAATGGTGAATCCAGCGATGGCTTTACATTTAAACCTGGCGAGGACGTTACTTGCGTGGCGGGTAACACGACAATTGCCA
CCTTCAACACTCAGTCAGAAGCTGCGCGTAGCTTGCGTGCGGTTGAAAAAGTGTCGTTTAGCCTTGAGGACGCGCAAGAA
CTGGCGGGCTCCGATGACAAGAAAAGCAATGCGGTTTCGCTGGTAACGTCCAGTAACAGCTGTCCGGCGAATACAGAACA
GGTTTGTCTGACGTTCTCCTCGGTGATCGAGAGTAAACGCTTCGACTCGCTGTATAAGCAAATCGATCTGGCACCGGAAG
AGTTCAAAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCTGCGACCGATAAAGCGCCATCCACTCATACTTCACCGGTC
GTGCCCGTCACCACGCCGGGAACAAAACCGGATCTGAACGCTTCCTTCGTGTCGGCTAACGCGGAACAGTTTTATCAGTA
TCAACCCACTGAAATCATTCTCTCTGAAGGTCGACTGGTCGATAGCCAGGGATATGGTGTTGCTGGCGTCAACTACTACA
CCAATTCAGGCCGTGGCGTGACAGGGGAAAATGGTGAATTTTCCTTTAGCTGGGGCGAAACCATCTCCTTTGGTATCGAT
ACCTTTGAACTGGGTTCAGTGCGCGGCAATAAGTCGACCATTGCGCTGACTGAACTGGGTGATGAAGTTCGCGGGGCGAA
TATTGATCAGCTTATTCATCGCTATTCGACGACCGGGCAAAATAATACCCGTGTTGTTCCGGAGGATGTACGCAAGGTCT
TTGCCGAATATCCCAACGTGATCAACGAGATTATCAATCTCTCGTTATCCAACGGTGCGACGCTGGGGGAAGGTGAGCAA
GTCGTTAATCTGCCTAACGAATTTATTGAGCAGTTTAATACGGGTCAGGCCAAAGAGATCGATACCGCGATTTGTGCGAA
AACCGATGGTTGTAACGAGGCTCGCTGGTTCTCGCTGACGACGCGCAATGTTAATGACGGCCAGATTCAGGGCGTTATCA
ACAAGCTGTGGGGCGTGGATACGAACTACAAATCTGTCAGCAAGTTCCATGTATTCCATGACTCCACCAACTTCTATGGC
AGCACGGGTAATGCGCGCGGTCAGGCGGTGGTGAATATCTCCAACGCGGCCTTCCCGATTCTGATGGCGCGTAATGATAA
AAACTACTGGCTGGCCTTCGGCGAGAAACGGGCCTGGGATAAAAATGAGCTGGCGTACATTACTGAAGCGCCTTCCATTG
TGCGACCAGAGAACGTGACACGCGAAACAGCCACCTTCAACCTGCCGTTTATTTCGCTGGGGCAAGTGGGCGATGGCAAG
CTGATGGTTATCGGTAACCCACACTACAACAGCATCCTGCGTTGCCCGAACGGTTACAGCTGGAACGGGGGCGTTAATAA
AGATGGGCAGTGTACGCTCAACAGCGACCCGGATGACATGAAGAACTTCATGGAGAACGTGCTGCGCTATCTGTCAAATG
ATCGCTGGTTGCCGGATGCAAAATCCAATATGACCGTGGGTACTAACCTGGACACGGTGTATTTCAAAAAACACGGGCAG
GTTACAGGAAATAGTGCTGCGTTCGGCTTTCATCCGGATTTTGCGGGTATCTCTGTTGAGCATTTAAGTAGCTATGGCGA
TCTCGACCCGCAGGAAATGCCGCTGCTGATCCTCAACGGCTTTGAGTATGTGACTCAGGTTGGTAACGATCCTTATGCAA
TCCCGCTGCGTGCAGATACCAGCAAACCGAAGCTGACCCAGCAGGATGTGACCGATTTGATCGCCTATATGAACAAAGGT
GGATCGGTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCGCATCTGGCTTTGTACGTCTGCTTGATGC
CGCAGGTTTGTCGATGGCGCTTAACAAGTCGGTAGTAAATAACGATCCGCAAGGCTACCCGGACCGCGTTCGTCAACGAC
GTTCAACGCCAATTTGGGTCTATGAGCGTTATCCGGCTGTCGATGGTAAACCACCGTATACCATTGATGACACCACGAAA
GAAGTTATCTGGAAATATCAGCAAGAAAACAAACCTGATGACAAACCGAAGCTGGAAGTTGCCAGCTGGCAGGAAGAAGT
TGAGGGTAAACAGGTAACTCAATTCGCCTTTATCGATGAAGCCGACCACAAAACGCCTGAGTCACTGGCTGCGGCGAAGA
AGAGAATTCTGGACGCGTTCCCAGGGCTGGAAGAGTGTAAGGATTCTGACTACCACTATGAGGTCAACTGTCTGGAATAT
CGTCCTGGCACGGGGGTTCCGGTTACTGGTGGCATGTATGTTCCACAGTATACGCAACTAAGCCTTAACGCCGACACTGC
GAAAGCGATGGTGCAGGCTGCGGATTTAGGCACCAACATTCAGCGTCTGTATCAGCATGAGCTTTACTTCCGTACCAATG
GTCGCAAAGGTGAGCGTCTGAGCAGCGTCGATCTGGAACGTCTGTACCAGAACATGTCGGTCTGGCTGTGGAATAAAATT
GAATATCGCTATGAAAACGACAAGGATGACGAGCTGGGCTTTAAAACGTTCACCGAGTTCCTGAACTGTTACGCCAACAA
TGCTTATGATGGTGGCACGCAGTGCTCCGCAGAGCTGAAACAATCGCTGATCGATAACAAGATGATCTACGGTGAAGGCA
GCAAAGCGGGCATGATGAACCCGAGCTATCCGCTTAACTATATGGAAAAACCGCTGACGCGCCTGATGCTGGGGCGTTCC
TGGTGGGATCTGAACATCAAGGTTGATGTCGAGAAGTATCCGGGGGCGGTATCGGCTGAAGGTGAGGAGGTTACTGAAAC
CATCAACCTGTACTCGAATCCGACCAAATGGTTTGCGGGTAACATGCAGTCTACTGGCCTGTGGGCTCCGGCTCAGCAGG
AAGTCAGCATTAAGTCCAATGCGAAAGTCCCTGTGACTGTTACCGTGGCGCTGGCTGACGACCTGACCGGGCGTGAGAAG
CATGAGGTTGCGCTGAACCGTCCGCCAAGAGTGACTAAAACATACTCTCTGGATGCTAGCGGCACGGTGAAGTTCAAGGT
TCCTTACGGTGGTCTGATTTATATCAAGAGCGACAGTAAAGAGGAGAAATCAGCCAACTTCACCTTTACTGGCGTGGTAA
AAGCGCCGTTCTATAAAGACGGTAAATGGAAAAACGACCTGAAATCCCCTGCGCCGTTGGGTGAGCTGGAGTCTGCGTCG
TTCGTCTATACCACGCCGAAGAAGAACCTTGAGGCCAGCAATTACAAGGGCGGTCTGAAACAATTCGCTGAGGATCTGGA
TACCTTTGCCAGCTCGATGAATGACTTCTACGGTCGTGATGGCGAAAGCGGTAAGCACCGGATGTTTACCTATGAAGCAT
TGACGGGGCACAAACATCGTTTCACCAACGATGTGCAGATCTCCATCGGTGATGCGCACTCTGGTTATCCGGTGATGAAC
AGCAGCTTCTCGCCGAACAGCACCACGCTGCCGACGACGCCGCTGAACGACTGGCTGATCTGGCACGAAGTAGGGCACAA
CGCTGCAGAAACGCCGCTGACTGTACCGGGCGCAACTGAAGTGGCGAACAACGTGCTGGCGCTGTACATGCAGGATCGTT
ATCTCGGCAAGATGAACCGTGTCGCTGACGATATTACCGTTGCGCCGGAATATCTGGAGGAGAGCAACGGTCAGGCATGG
GCGCGTGGCGGTGCGGGTGACCGTCTGCTGATGTACGCGCAGCTGAAGGAATGGGCAGAGAAAAACTTTGATATCAAACA
GTGGTATCCAGAAGGCTCTCTGCCAGCGTTCTACAGCGAGCGTGAAGGGATGAAAGGCTGGAACCTGTTCCAGTTGATGC
ACCGTAAAGCACGCGGCGATGATGTTGGCAATGACAAATTTGGCAACAGAAACTACTGTGCCGAATCCAACGGTAACGCT
GCCGACACGCTGATGCTGTGTGCATCCTGGGTCGCTCAGACGGACCTTTCCGCATTCTTTAAGAAATGGAATCCGGGCGC
GAATGCTTACCAGTTGCCGGGAGCGACAGAGATGAGCTTCGAGGGCGGTGTGAGCCAGTCGGCTTACAACACGCTCGCGT
CACTCGATCTGCCGAAACCGGAACAGGGACCGGAAACCATTAATCAGGTTACCGAGCATAAGATGTCTGCCGAGTAA

Protein sequence :

MNKKFKYKKSLLAAILSATLLAGCDGGGSGSSSDTPPVDSGTGSLPEVKPDPTPNPEPTPEPTPDPEPTPEPIPDPEPTP
EPEPEPVPTKTGYLTLGGSQRVTGATCNGESSDGFTFKPGEDVTCVAGNTTIATFNTQSEAARSLRAVEKVSFSLEDAQE
LAGSDDKKSNAVSLVTSSNSCPANTEQVCLTFSSVIESKRFDSLYKQIDLAPEEFKKLVNEEVENNAATDKAPSTHTSPV
VPVTTPGTKPDLNASFVSANAEQFYQYQPTEIILSEGRLVDSQGYGVAGVNYYTNSGRGVTGENGEFSFSWGETISFGID
TFELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSTTGQNNTRVVPEDVRKVFAEYPNVINEIINLSLSNGATLGEGEQ
VVNLPNEFIEQFNTGQAKEIDTAICAKTDGCNEARWFSLTTRNVNDGQIQGVINKLWGVDTNYKSVSKFHVFHDSTNFYG
STGNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNELAYITEAPSIVRPENVTRETATFNLPFISLGQVGDGK
LMVIGNPHYNSILRCPNGYSWNGGVNKDGQCTLNSDPDDMKNFMENVLRYLSNDRWLPDAKSNMTVGTNLDTVYFKKHGQ
VTGNSAAFGFHPDFAGISVEHLSSYGDLDPQEMPLLILNGFEYVTQVGNDPYAIPLRADTSKPKLTQQDVTDLIAYMNKG
GSVLIMENVMSNLKEESASGFVRLLDAAGLSMALNKSVVNNDPQGYPDRVRQRRSTPIWVYERYPAVDGKPPYTIDDTTK
EVIWKYQQENKPDDKPKLEVASWQEEVEGKQVTQFAFIDEADHKTPESLAAAKKRILDAFPGLEECKDSDYHYEVNCLEY
RPGTGVPVTGGMYVPQYTQLSLNADTAKAMVQAADLGTNIQRLYQHELYFRTNGRKGERLSSVDLERLYQNMSVWLWNKI
EYRYENDKDDELGFKTFTEFLNCYANNAYDGGTQCSAELKQSLIDNKMIYGEGSKAGMMNPSYPLNYMEKPLTRLMLGRS
WWDLNIKVDVEKYPGAVSAEGEEVTETINLYSNPTKWFAGNMQSTGLWAPAQQEVSIKSNAKVPVTVTVALADDLTGREK
HEVALNRPPRVTKTYSLDASGTVKFKVPYGGLIYIKSDSKEEKSANFTFTGVVKAPFYKDGKWKNDLKSPAPLGELESAS
FVYTTPKKNLEASNYKGGLKQFAEDLDTFASSMNDFYGRDGESGKHRMFTYEALTGHKHRFTNDVQISIGDAHSGYPVMN
SSFSPNSTTLPTTPLNDWLIWHEVGHNAAETPLTVPGATEVANNVLALYMQDRYLGKMNRVADDITVAPEYLEESNGQAW
ARGGAGDRLLMYAQLKEWAEKNFDIKQWYPEGSLPAFYSEREGMKGWNLFQLMHRKARGDDVGNDKFGNRNYCAESNGNA
ADTLMLCASWVAQTDLSAFFKKWNPGANAYQLPGATEMSFEGGVSQSAYNTLASLDLPKPEQGPETINQVTEHKMSAE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	90
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	49
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
EcSMS35_3251	YP_001745231.1	hypothetical protein	VFG0106	Protein	0.0	49