Gene Information

Name : ETEC_3241 (ETEC_3241)
Accession : YP_006116782.1
Strain : Escherichia coli ETEC H10407
Genome accession: NC_017633
Putative virulence/resistance : Virulence
Product : accessory colonization factor
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3498320 - 3502879 bp
Length : 4560 bp
Strand : -
Note : -

DNA sequence :

ATGAATAAGAAATTTAAATATAAGAAATCGCTTTTAGCGGCTATTTTGAGCGCAACCCTGTTAGCCGGTTGTGATGGCGG
TGGTTCCGGATCTTCCTCCGATACGCCGCCTGTAGATTCTGGAACAGGGTCTTTGCCGGAAGTGAAACCTGATCCAACAC
CAAACCCGGAGCCGACGCCTGAGCCAACGCCGGACCCAGAGCCTACGCCAGAACCGATACCTGATCCTGAACCAACACCA
GAACCGGAGCCAGAACCTGTTCCTACGAAAACGGGTTATCTGACCCTGGGCGGAAGCCAGCGGGTAACTGGTGCTACCTG
TAATGGTGAATCCAGCGATGGCTTTACATTTAAACCTGGCGAGGACGTTACTTGCGTGGCGGGTAACACGACAATTGCCA
CCTTCAACACTCAGTCAGAAGCTGCGCGTAGCTTGCGTGCGGTTGAAAAAGTGTCGTTTAGCCTTGAGGACGCGCAAGAA
CTGGCGGGCTCCGATGACAAGAAAAGCAATGCGGTTTCGCTGGTAACGTCCAGTAACAGCTGTCCGGCGAATACAGAACA
GGTTTGTCTGACGTTCTCCTCGGTGATCGAGAGTAAACGCTTCGACTCGCTGTATAAGCAAATCGATCTGGCACCGGAAG
AGTTCAAAAAGCTGGTCAATGAAGAGGTGGAAAACAATGCTGCGACCGATAAAGCGCCATCCACTCATACTTCACCGGTC
GTGCCCGTCACCACGCCGGGAACAAAACCGGATCTGAACGCTTCCTTCGTGTCGGCTAACGCGGAACAGTTTTATCAGTA
TCAACCCACTGAAATCATTCTCTCTGAAGGTCGACTGGTCGATAGCCAGGGATATGGTGTTGCTGGCGTCAACTACTACA
CCAATTCAGGCCGTGGCGTGACAGGGGAAAATGGTGAATTTTCCTTTAGCTGGGGCGAAGCCATCTCCTTTGGTATCGAT
ACCTTTGAACTGGGTTCAGTGCGCGGCAATAAGTCGACCATTGCGCTGACTGAACTGGGTGATGAAGTTCGCGGGGCGAA
TATTGATCAGCTTATTCATCGCTATTCGACGACCGGGCAAAATAATACCCGTGTTGTTCCGGACGATGTACGCAAGGTCT
TTGCCGAATATCCCAACGTGATCAACGAGATTATCAATCTCTCGTTATCCAACGGTGCGACGCTGGGGGAAGGTGAGCAA
GTCGTTAATCTGCCTAACGAATTTATTGAGCAGTTTAATACGGGTCAGGCCAAAGAGATCGATACCGCGATTTGTGCGAA
AACCGATGGTTGTAACGAGGCTCGCTGGTTCTCGCTGACGACGCGCAATGTTAATGACGGCCAGATTCAGGGCGTTATCA
ACAAGCTGTGGGGCGTGGATACGAACTACAAATCTGTCAGCAAGTTCCATGTATTCCATGACTCCACCAACTTCTATGGC
AGCACGGGTAATGCGCGCGGTCAGGCGGTGGTGAATATCTCCAACGCGGCCTTCCCGATTCTGATGGCGCGTAATGATAA
AAACTACTGGCTGGCCTTCGGCGAGAAACGGGCCTGGGATAAAAATGAGCTGGCGTACATTACTGAAGCGCCTTCCATTG
TGCGACCAGAGAACGTGACACGCGAAACCGCCAGCTTCAACCTGCCGTTTATTTCGCTGGGGCAAGTGGGCGATGGCAAG
CTGATGGTTATCGGTAACCCACACTACAACAGCATCCTGCGTTGCCCGAACGGTTACAGCTGGAACGGGGGCGTTAATAA
AGATGGGCAGTGTACGCTCAACAGCGACCCGGATGACATGAAGAACTTCATGGAGAACGTGCTGCGCTATCTGTCAAATG
ATCGCTGGTTGCCGGATGCAAAATCCAGTATGACCGTGGGTACTAACCTGGAGACGGTGTATTTCAAAAAACATGGGCAG
GTGCTGGGAAATAGCGCACCGTTTGCGTTCCACAAGGATTTCACTGGCATCACGGTCAAACCGATGACCAGCTATGGCAA
TCTGAATCCAGATGAAGTTCCTCTGTTGATCCTCAATGGCTTTGAATACGTCACACAATGGGGTAGCGATCCTTACTCCA
TTCCTCTGCGCGCAGATACCAGCAAACCGAAGCTGACCCAGCAGGATGTGACCGATTTGATCGCCTATATGAACAAAGGT
GGATCGGTGCTGATCATGGAAAACGTGATGAGCAATCTTAAGGAAGAGAGCGCATCTGGCTTTGTACGTCTGCTTGATGC
CGCAGGTTTGTCGATGGCGCTTAACAAGTCGGTAGTAAATAACGACCCGCAAGGCTACCCGGACCGCGTTCGTCAACGAC
GTTCAACGCCAATTTGGGTCTATGAGCGTTATCCGGCTGTCGATGGTAAACCACCGTATACCATTGATGACACCACGAAA
GAAGTTATCTGGAAATATCAGCAAGAAAACAAACCTGATGACAAACCGAAGCTGGAAGTTGCCAGCTGGCAGGAAGAAGT
TGAGGGTAAACAGGTAACCCAATTCGCCTTTATTGATGAAGCCGACCACAAAACGCCTGAGTCACTGGCTGCGGCAAAAC
AGAGAATTCTGGACGCGTTCCCAGGGCTGGAAGTGTGTAAGGATTCTGACTACCACTATGAGGTCAACTGTCTGGAATAC
CGCCCAGGCACGGATGTGCCGGTAACCGGTGGCATGTATGTTCCGCAGTATACGCAGCTGGATCTGAGTGCCGACACCGC
GAAAGCGATGCTGCAGGCTGCGGATTTAGGCACCAATATTCAGCGCCTGTATCAGCATGAGCTTTATTTCCGTACCAATG
GCCGCCAGGGTGAGCGTCTCAACAGCGTTGATCTGGAACGTTTATACCAAAACATGTCCGTCTGGCTGTGGAACGAGACG
AAATATCGTTATGAAGAGGGTAAAGAAGACGAGCTGGGCTTTAAAACGTTCACTGAGTTTCTGAACTGCTACACCAACAA
TGCATACGTTGGCACGCAGTGTTCTGCTGAGCTGAAAAAATCGCTGATCGATAACAAGATGATTTACGGTGAAGAAAGCA
GCAAAGCGGGCATGATGAACCCGAGCTACCCGCTCAACTATATGGAAAAACCGCTGACACGCCTGATGCTGGGCCGTTCC
TGGTGGGATCTGAACATCAAAGTTGATGTTGAGAAGTATCCGGGAGTGGTGAATACAAACGGCGAAACCGTCACACAAAA
CATTAACTTGTACTCAGCTCCAACCAAATGGTTTGCAGGTAACATGCAGTCAACTGGCCTGTGGGCACCTGCCCAGCAGG
AAGTCAGCATTGAGTCAAAGTCGACAGTTCCTGTGACCGTGACTGTTGCGCTGGCCGACGACCTGACAGGACGAGAGAAG
CATGAAGTTAGCCTGAATCGTCCACCCAGAGTGACAAAAACCTATGACCTGAAAGCCAATGATAAGGTGACGTTCAAAGT
CCCTTACGGTGGTCTGATTTACATCAAGGGCGACAGCAAAGAGGTGCAATCAGCTGACTTCACCTTTACCGGTGTAGTAA
AAGCGCCGTTCTATAAAGACGGTAAGTGGCAACACGATCTGAACTCCCCTGCCCCGCTGGGCGAACTGGAGTCTGCCTCG
TTCGTCTATACCACACCGAAGAAGAACCTGAATGCCAGCAATTACACTGGCGGACTGGAGCAATTCGCTAACGATCTGGA
TACCTTTGCCAGCTCGATGAATGACTTCTACGGCCGTGATAGCGAAGACGGTAAGCACCGGATGTTTACCTATAAAAACT
TGCCGGGCCACAAACATCGTTTCGCCAACGATGTGCAGATCTCCATCGGTGATGCGCATTCGGGTTATCCGGTAATGAAC
AGCAGCTTCTCGCCGAACAGCACCACGCTGCCGACGACGCCGCTGAACGACTGGCTGATCTGGCATGAAGTCGGTCATAA
CGCCGCAGAAACGCCGTTGACTGTACCGGGTGCAACTGAAGTCGCTAACAACGTGCTGGCGCTGTACATGCAGGATCGTT
ATCTCGGCAAGATGAACCGTGTCGCTGACGATATTACCGTCGCACCGGAATATCTGGAGGAAAGCAACGGTCAGGCATGG
GCGCGCGGCGGTGCGGGTGACCGTCTGCTGATGTACGCACAGCTGAAGGAATGGGCAGAGAAAAACTTTGATATCAAGAA
ATGGTATCCAGATGGCACTCCTCTGCCAGAGTTTTACAGCGAGCGTGAAGGGATGAAAGGCTGGAACCTGTTCCAGTTGA
TGCATCGTAAAGCACGCGGCGATGAGGTCAGCAATGACAAGTTTGGCGGCAAGAATTACTGTGCTGAATCCAACGGTAAC
GCAGCGGACACGCTGATGCTGTGTGCCTCCTGGGTCGCCCAGACGGATCTTTCGGAGTTCTTTAAGAAATGGAATCCGGG
CGCGAATGCTTACCAGCTGCCGGGGGCGAGCGAGATGAGCTTCGAGGGCGGTGTGAGCCAGTCGGCTTACAACACGCTCG
CGTCACTCGATCTGCCGAAACCGGAACAGGGACCGGAAACCATTAATCAGGTTACCGAGCATAAGATGTCTGCCGAGTAA

Protein sequence :

MNKKFKYKKSLLAAILSATLLAGCDGGGSGSSSDTPPVDSGTGSLPEVKPDPTPNPEPTPEPTPDPEPTPEPIPDPEPTP
EPEPEPVPTKTGYLTLGGSQRVTGATCNGESSDGFTFKPGEDVTCVAGNTTIATFNTQSEAARSLRAVEKVSFSLEDAQE
LAGSDDKKSNAVSLVTSSNSCPANTEQVCLTFSSVIESKRFDSLYKQIDLAPEEFKKLVNEEVENNAATDKAPSTHTSPV
VPVTTPGTKPDLNASFVSANAEQFYQYQPTEIILSEGRLVDSQGYGVAGVNYYTNSGRGVTGENGEFSFSWGEAISFGID
TFELGSVRGNKSTIALTELGDEVRGANIDQLIHRYSTTGQNNTRVVPDDVRKVFAEYPNVINEIINLSLSNGATLGEGEQ
VVNLPNEFIEQFNTGQAKEIDTAICAKTDGCNEARWFSLTTRNVNDGQIQGVINKLWGVDTNYKSVSKFHVFHDSTNFYG
STGNARGQAVVNISNAAFPILMARNDKNYWLAFGEKRAWDKNELAYITEAPSIVRPENVTRETASFNLPFISLGQVGDGK
LMVIGNPHYNSILRCPNGYSWNGGVNKDGQCTLNSDPDDMKNFMENVLRYLSNDRWLPDAKSSMTVGTNLETVYFKKHGQ
VLGNSAPFAFHKDFTGITVKPMTSYGNLNPDEVPLLILNGFEYVTQWGSDPYSIPLRADTSKPKLTQQDVTDLIAYMNKG
GSVLIMENVMSNLKEESASGFVRLLDAAGLSMALNKSVVNNDPQGYPDRVRQRRSTPIWVYERYPAVDGKPPYTIDDTTK
EVIWKYQQENKPDDKPKLEVASWQEEVEGKQVTQFAFIDEADHKTPESLAAAKQRILDAFPGLEVCKDSDYHYEVNCLEY
RPGTDVPVTGGMYVPQYTQLDLSADTAKAMLQAADLGTNIQRLYQHELYFRTNGRQGERLNSVDLERLYQNMSVWLWNET
KYRYEEGKEDELGFKTFTEFLNCYTNNAYVGTQCSAELKKSLIDNKMIYGEESSKAGMMNPSYPLNYMEKPLTRLMLGRS
WWDLNIKVDVEKYPGVVNTNGETVTQNINLYSAPTKWFAGNMQSTGLWAPAQQEVSIESKSTVPVTVTVALADDLTGREK
HEVSLNRPPRVTKTYDLKANDKVTFKVPYGGLIYIKGDSKEVQSADFTFTGVVKAPFYKDGKWQHDLNSPAPLGELESAS
FVYTTPKKNLNASNYTGGLEQFANDLDTFASSMNDFYGRDSEDGKHRMFTYKNLPGHKHRFANDVQISIGDAHSGYPVMN
SSFSPNSTTLPTTPLNDWLIWHEVGHNAAETPLTVPGATEVANNVLALYMQDRYLGKMNRVADDITVAPEYLEESNGQAW
ARGGAGDRLLMYAQLKEWAEKNFDIKKWYPDGTPLPEFYSEREGMKGWNLFQLMHRKARGDEVSNDKFGGKNYCAESNGN
AADTLMLCASWVAQTDLSEFFKKWNPGANAYQLPGASEMSFEGGVSQSAYNTLASLDLPKPEQGPETINQVTEHKMSAE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
unnamed	CAE85238.1	hypothetical protein	Not tested	PAI V 536	Protein	0.0	87
VC0395_A0370	YP_001216326.1	lipoprotein	Not tested	VPI-1	Protein	0.0	49
VC0845	NP_230493.1	hypothetical protein	Not tested	VPI-1	Protein	0.0	49
acfD	AAK20802.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	49
acfD	ACK75655.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75649.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75652.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75646.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75664.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75670.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75658.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75661.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48
acfD	ACK75667.1	accessory colonization factor AcfD	Virulence	VPI	Protein	0.0	48

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
ETEC_3241	YP_006116782.1	accessory colonization factor	VFG0106	Protein	0.0	49