Gene Information

Name : ECSF_2797 (ECSF_2797)
Accession : YP_003350787.1
Strain : Escherichia coli SE15
Genome accession: NC_013654
Putative virulence/resistance : Virulence
Product : hypothetical protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3057381 - 3061943 bp
Length : 4563 bp
Strand : -
Note : -

DNA sequence :

ATGAATAAGAAATTTAAATATAAGAAATCGCTTTTAGCGGCTATTTTAAGCGCAACCCTGTTAGCCGGTTGTGATGGCGG
TGGTTCGGGGTCATCCTCCGATACGCCACATGCAGATTCTGGTTCAGGGTCTTTGCCGGATGTGAAACCTGATCCAACAC
CAAACCCGGAGCCGACGCCTGAGCCGACTCCGGACCCAGAACCTACGCCGGATCCAACACCTGATCCTGAGCCGACACCA
GAACCGGAGCCAGAACCTGTTCCCACGAAAACGGGTTATCTGACCCTGGGCGGAAGCCAGCGGGTAACTGGTGCTACCTG
TAATGGTGAATCCAGCGATGGCTTTACTTTTACACCTGGCAAGGACGTTACTTGCGTGGCGGGTAACACGACAATTGCCA
CCTTCAACACTCAGTCAGAAGCTGCGCGTAGCCTGCGTGCGGTTGAAAAAGTATCGTTTAGTCTTGAGGACGCGCAAGAA
CTGGCGGCTTCCGACAACAAGAAAAGCAATGCGGTTTCGTTGGTAACGTCCAGTAACAGCTGTCCGGCGGATACAGAACA
GGTTTGCCTGACGTTCTCTTCGGTGATCGAGAGTAAACGTTTCGACTCGCTGTATAAGCAAATTGATCTGGCACCGGAGG
AGTTCAAAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCCGCGACCGATAAAGCGCCATCCACTCATACCTCATCGGTC
GTGCCAGTCACCACGCCGGGAACAAAACCGGATCTGAACGCTTCCTTCGTGTCAGCTAACGCGGAACAGTTTTATCAGTA
TCAACCTACTGAAATTATTCTCTCAGAAGGTCGCCTGGTAGATAGCATGGGCAATGGTGTGGTTGGCGTAAATTACTACA
CCAGCTCAGGCCGTGGTGTAACTGGCGAAAACGGCAAATTCAACTTCAGCTGGGGCGAAACCATCTCCTTTGGTATCGAC
ACCTTTGAACTGGGTTCAGTACGCGGCAATAAGTCGACCATTGCATTGACTGAATTGGGCGACGAAGTTCGCGGCGCGAA
TATCGATCAACTTATTCATCGTTATTCCCAGGCCGGAAAAAATGATGAGCGTGAAGTGCCGGACGTCGTGCGCCAGGTCT
TTGCCGAGTACCCCAACGTGATCAACGAGATTATCAATCTCTCGTTATCCAATGGCGAGGCGTTGAGCGAAGGCGATCAA
AACTTTCCGCGGACAAACGAATTTCTTGAGCAGCTTAAATCCGGGCAGGCTAAAGAGATTGATACGGCGATTTGTAATTC
TCTCGGGGGCTGCAACTCTCAACGTTGGTTCTCGTTGACTGCACGCAATGTTAACGAAGGTCAGATTCAGGGCGTTATCA
ACAAGCTGTGGGGTGTGGATGAAGATTACAAATCGGTGACGAAATTCCACGTCTTCCATGACTCTACCAACTTCTATGGC
AGCACGGGTAATGCGCGCGGTCAGGCGGTGGTGAATATCTCCAACGCTGCCTTCCCGATTCTGATGGCGCGTAATGATAA
AAACTACTGGCTGGCGTTTGGCGAAAAACGCGCCTGGGATAAAAATGAGCTGGCGTACATTACGGAAGCGCCTTCTCTGG
TTGAGCCGGAAAACGTTACGCGCGATACCGCCACCTTCAACCTGCCATTTATTTCGCTGGGGCAAGTTGGTGAGGGCAAG
CTGATGGTTATCGGTAACCCGCACTACAACAGCATTTTGCGTTGCCCTAATGGTTACAGTTGGAACGGGAGCGTTAATAA
AGACGGGCAGTGTACGCTCAACAGCGACCCGGACGACATGAAGAACTTCATGGAGAACGTGTTGCGCTATCTGTCAAATG
AACGCTGGCTGCCGGATGCGAAGAGCAGTATGACCGTGGGCACTAACCTGGATACGGTTTATTTCAAAAAAGCGGGTCAG
GTATTAGGAAATAGTGCACCGTTTGCTTTCCACAAGGACTTCGCTGGCATCACGGTCAAACCGATGACCAGCTATGGCAA
TCTGAATCCAGATGAAGTTCCTCTGTTGATCCTCAATGGCTTTGAATACGTCACACAATGGGGTAGCGATCCTTACTCTA
TTCCTCTGCGAGCAGATACCAGCAAACCGAAGCTGACCCAGCAGGATGTGACCGATCTGATCGCCTATCTGAACAAAGGT
GGCTCGGTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCGCGTCCAGTTTTGTGCGTCTGCTGGATGC
CGCGGGTCTGTCAATGGCTCTGAACAAATCGGTGGTGAATAACGATCCTCAAGGGTATCCGGATCGCGTTCGTCAGCGTC
GCGCGACTGGCATTTGGGTTTATGAACGTTATCCTGCTGCAGACGGCGCGCAACCGCCGTACACCATCGACCCAAATACA
GGGGAAGTGACCTGGAAATACCAGCAAGACAACAAGCCTGATGACAAGCCGAAACTGGAAGTTGCGAGCTGGCAGGAGGA
AGTTGAGGGCAAACAGGTAACGCGTTATGCCTTTATTGATGAAGCGGAATACACAACAGAAGAATCTCTGGAAGCGGCAA
AGGCAAAAATCTTTGAGAAGTTTCCTGGGTTACAGGAGTGTAAGGACTCGACTTACCATTACGAGATTAACTGTTTGGAG
CGCCGCCCAGGCACGGATGTTCCGGTAACAGGTGGCATGTATGTTCCGCGCTATACGCAACTGAATCTTGACGCCGACAC
CGCGAAAGCGATGGTGCAGGCGGCGGATTTAGGCACCAACATTCAGCGCCTGTATCAGCATGAGCTTTATTTCCGTACCA
AAGGCAGTAAAGGTGAGCGTCTGAACAGTGTTGATCTGGAACGTCTGTACCAGAACATGTCGGTCTGGCTGTGGAACGAT
ACGAAATATCGTTACGAAGAGGGCAAGGAAGATGAGCTGGGCTTTAAAACGTTCACCGAGTTCCTGAACTGCTACGCCAA
TGATGCCTATGCAGGCGGCACCAAGTGCTCCGCAGATCTGAAAAAATCGCTGGTCGATAACAACATGATCTACGGTGACG
GTAGCAGCAAAGCGGGCATGATGAACCCAAGCTATCCGCTCAACTATATGGAAAAACCGCTGACGCGTCTGATGCTGGGC
CGTTCCTGGTGGGATCTGAACATTAAGGTTGATGTGGAGAAGTACCCAGGATCCGTATCGGCAAAGGGTGAGAGCGTTAC
GGAAAACATCAGCCTGTACTCGAATCCGACCAAATGGTTTGCGGGTAACATGCAGTCAACCGGCCTGTGGGCACCGGCCC
AGCAGGACGTCACCATTAAGTCTTCGGCGTCAGTCCCAGTGACTGTTACCGTGGCGCTGGCTGACGACCTGACCGGACGT
GAGAAGCATGAAGTTGCGCTGAACCGTCCGCCAAGAGTGACTAAAACGTATACTCTGGAGGCTAACGGTGAAGTGACCTT
CAAGGTGCCTTATGGTGGTCTGATTTATATCAAGGGCGACAGTAAGGATGATGTTTCTGCTAACTTCACCTTTACCGGTG
TAGTAAAAGCGCCGTTCTATAAAGACGGCGAATGGAAAAACGATCTGGACTCACCGGCGCCGCTGGGCGAGCTGGAGTCT
GCGTCGTTCGTCTATACCACGCCGAAGAAGAACCTTGAGGCCAGCAATTTCACTGGTGGTGTAGCAGAATTCGCTAAAGA
TCTGGATACCTTTGCCAGCTCGATGAATGACTTCTACGGTCGCAATGAAACGAGCGGTAACCACCGGATGTTTACCTATG
AAGCATTGACGGGGCATAAACACCGTTTCGCCAACGATGTGCAGATCTCCATCGGTGATGCGCACTCGGGTTATCCGGTA
ATGAACAGCAGCTTCTCGACGAACAGCTCCACGCTGCCGACGACGCCGCTGAACGACTGGCTGATTTGGCACGAAGTCGG
TCATAACGCTGCAGAAACACCGCTGAACGTACCGGGTGCAACTGAAGTGGCGAACAACGTGCTGGCGCTGTACATGCAGG
ATCGCTATCTTGGCAAGATGAACCGTGTCGCTGACGACATTACCGTCGCGCCGGAATATCTGGACGAGAGCAACGGTCAG
GCATGGGCGCGCGGCGGTGCGGGTGACCGTCTGCTGATGTACGCACAGCTGAAAGAGTGGGCAGAGAAAAACTTTGATAT
CAAGAAATGGTATCCAGAAGGCTCTCTGCCAGCGTTCTACAGCGAGCGTGAAGGGATGAAAGGCTGGAACCTGTTCCAGT
TGATGCATCGCAAAGCACGCGGCGATGATGTTGGTAACAGCACCTTTGGCGGCAAGAATTACTGTGCTGAATCCAACGGT
AACGCTGCCGACACGCTGATGCTGTGTGCCTCCTGGGTCGCCCAGACGGATCTTTCGGAGTTCTTTAAGAAATGGAATCC
GGGTGCAAGTGCTTACCAGTTGCCGGGGGCAACGGAGATGAGTTTCCAGGGCGGTGTGAGCTCTTCGGCTTACAGCACGC
TCGCGTCGCTTAATCTGCCGAAACCGGAAAAAGGGCCGGAAACCATTAACAAGGTTACCGAGCATAAGATGTCTGCCGAG
TAA

Protein sequence :

MNKKFKYKKSLLAAILSATLLAGCDGGGSGSSSDTPHADSGSGSLPDVKPDPTPNPEPTPEPTPDPEPTPDPTPDPEPTP
EPEPEPVPTKTGYLTLGGSQRVTGATCNGESSDGFTFTPGKDVTCVAGNTTIATFNTQSEAARSLRAVEKVSFSLEDAQE
LAASDNKKSNAVSLVTSSNSCPADTEQVCLTFSSVIESKRFDSLYKQIDLAPEEFKKLVNEEVENNAATDKAPSTHTSSV
VPVTTPGTKPDLNASFVSANAEQFYQYQPTEIILSEGRLVDSMGNGVVGVNYYTSSGRGVTGENGKFNFSWGETISFGID
TFELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSQAGKNDEREVPDVVRQVFAEYPNVINEIINLSLSNGEALSEGDQ
NFPRTNEFLEQLKSGQAKEIDTAICNSLGGCNSQRWFSLTARNVNEGQIQGVINKLWGVDEDYKSVTKFHVFHDSTNFYG
STGNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNELAYITEAPSLVEPENVTRDTATFNLPFISLGQVGEGK
LMVIGNPHYNSILRCPNGYSWNGSVNKDGQCTLNSDPDDMKNFMENVLRYLSNERWLPDAKSSMTVGTNLDTVYFKKAGQ
VLGNSAPFAFHKDFAGITVKPMTSYGNLNPDEVPLLILNGFEYVTQWGSDPYSIPLRADTSKPKLTQQDVTDLIAYLNKG
GSVLIMENVMSNLKEESASSFVRLLDAAGLSMALNKSVVNNDPQGYPDRVRQRRATGIWVYERYPAADGAQPPYTIDPNT
GEVTWKYQQDNKPDDKPKLEVASWQEEVEGKQVTRYAFIDEAEYTTEESLEAAKAKIFEKFPGLQECKDSTYHYEINCLE
RRPGTDVPVTGGMYVPRYTQLNLDADTAKAMVQAADLGTNIQRLYQHELYFRTKGSKGERLNSVDLERLYQNMSVWLWND
TKYRYEEGKEDELGFKTFTEFLNCYANDAYAGGTKCSADLKKSLVDNNMIYGDGSSKAGMMNPSYPLNYMEKPLTRLMLG
RSWWDLNIKVDVEKYPGSVSAKGESVTENISLYSNPTKWFAGNMQSTGLWAPAQQDVTIKSSASVPVTVTVALADDLTGR
EKHEVALNRPPRVTKTYTLEANGEVTFKVPYGGLIYIKGDSKDDVSANFTFTGVVKAPFYKDGEWKNDLDSPAPLGELES
ASFVYTTPKKNLEASNFTGGVAEFAKDLDTFASSMNDFYGRNETSGNHRMFTYEALTGHKHRFANDVQISIGDAHSGYPV
MNSSFSTNSSTLPTTPLNDWLIWHEVGHNAAETPLNVPGATEVANNVLALYMQDRYLGKMNRVADDITVAPEYLDESNGQ
AWARGGAGDRLLMYAQLKEWAEKNFDIKKWYPEGSLPAFYSEREGMKGWNLFQLMHRKARGDDVGNSTFGGKNYCAESNG
NAADTLMLCASWVAQTDLSEFFKKWNPGASAYQLPGATEMSFQGGVSSSAYSTLASLNLPKPEKGPETINKVTEHKMSAE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	90
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	48
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	47
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	47
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	47

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
ECSF_2797	YP_003350787.1	hypothetical protein	VFG0106	Protein	0.0	48