Gene Information

Name : EC042_0212 (EC042_0212)
Accession : YP_006094545.1
Strain : Escherichia coli 042
Genome accession: NC_017626
Putative virulence/resistance : Unknown
Product : putative type VI secretion system protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 245395 - 248922 bp
Length : 3528 bp
Strand : -
Note : -

DNA sequence :

GTGTTCAGATTTCCGACATCCCGACTGTTCAGCACGCTGAGATCTGCTCTCAGGCCAGCGATGCCGCGATTCAGGGTATC
CGCCGCCTGGCTGCTGGCGCTGGCATGGATTTTTCTGCTGGTGTGGATCTGGTGGCAAGGTCCGAAATGGACGCTCTATG
AGCAGCACTGGCTGGCTCCTCTAACAAACCGCTGGCTGGCGACCGCCGTCTGGGGGCTTATCGCTCTGATCTGGCTCACC
TGGCGGGTAATGAAGCGTCTGCAAAAGCTGGAAAAACAGCAGAAACAGCAGCGGGAGGAAGAAAAAGATCCGTTGACCGT
GGAACTCCACCGCCAGCAGCAATATCTGGATCACTGGCTGCTGCGCCTGCGCCGCCATCTGGATAACCGCCGTTATCTGT
GGCAGTTGCCGTGGTATATGGTCATTGGTCCTGCGGGTAGCGGTAAAAGCGCTCTGCTGCGCGAGGGCTTTCCATCTGAC
ATTATTTACACGCCGGAAAGCATCCGGGGTACGGAATACCATCCGCTGATCACACCGCGAGTGGGCAACCAAGCGGTGAT
TTTCGATGTTGACGGCGTACTGACCTCGCCCGGCGGGGATGATCTGCTCCACCGCCGCCTGCGCGAACACTGGCTGGGCT
GGCTGATGCAAACGCGCGCGCGCCAGCCGCTCAACGGCCTGATCCTGACGCTCGATCTTCCCGATCTGCTGACGGCGGAT
AAATCCCGCCGTGAGACACTGGTACAAAATTTGCGCCAGCAACTTCAGGAGATCCGCCAGAGTCTGCACTGCCGTCTGCC
CGTTTACGTGGTGCTGACACGGCTGGATCTGCTGACCGGCTTTGCCGCGCTGTTCCATTCACTGGATAAAAAAGACCGCG
ATGCGATCCTCGGCGTCACGTTTACCCGCCGCGCCCATGAAAGTGACGACTGGCGCAGCGAACTGGGGGCTTTCTGGCAG
ACGTGGGTACAACAGGTGAACCTGGCGCTGTCGGATCTGATGCTCGCACAAACCGGTGCTGCTCCCCGCAGCGCCGTGTT
CAGCTTCTCCCGTCAGATGCAGGGAACAGGAGAAATCGTCACCGCACTGCTCGCCGCATTGCTGGACGGTGAGAACATGG
ATGTAATGCTGCGTGGCGTCTGGCTCACATCATCGCTACAGCGTGGCCAGGTGGATGATATTTTCACGCAGTCCGCCGCC
CGCCAGTACGGGCTGGGTAACAGCTCGCTGGCAACCTGGCCTCTGGTGGAGACGACGCCGTATTTTACTCGCCGCCTCTT
CCCTGAAGTCCTGCTGGCTGAGCCGAACCTGGCGGGTGAAAACAGCGTCTGGCTGAACAGCTCCCGGCGCAGGCTGACCG
CCTTTTCCGCCTGTGGCGCGGCGCTGGCGGCATTGCTGGTCGGAAGCTGGCACCATTATTACAATCAGAACTGGCAGTCC
GGCGTTAACGTACTGGCACAGGCTAAAGCCTTTATGGACGTACCACCACCGCAAGGAACGGATGAATTCGGCAATCTGCA
ACTGTCGTTGCTTAATCCGGTACGCGATGCCACCCTGGCCTATGGCGATTACCGCGATCGCGGTTTTCTGGCGGATATGG
GATTGTACCAGGGCGTCCGCGTAGGGCCGTATGTGGAGCAAACCTACATTCAGCTTCTTGAGCAGCGTTATCTCCCCTCG
TTAATGAACGGCCTGATCCGGGATCTAAACAATGCCCCGCCAGAGAGCGAAGAAAAGCTCGCCGTGCTGCGCGTACTGCG
CATGATGGAAGACAAAAGTGGGCGCAACAACGAGGCGGTAAAACAGTACATGGCGCGGCGCTGGAGCAATGAATTTCACG
GCCAGCGCGATATTCAGGCGCAACTGATGGCGCATCTGGACTATGCGCTGGAGCACACCGACTGGCACGCGCAGCGCCAG
AGCGGTGACAGCGATGCTGTCAGCCGCTGGACCCCCTATGATAAACCGGTCATTAATGCGCAGCAGGAACTGAGCAAGCT
GCCCATATACCAGCGTGTCTACCAGACCCTGCGCACCAAAGCATTAAGCGTGTTGCCCGCCGATTTGAATTTGCGCGACC
AGGTTGGTCCCACCTTCGACAACGTGTTCGTCGCCGGTAATGATGAAAAACTGGTGATCCCGCAGTTCCTCACCCGCTAT
GGACTGCAAAGCTATTTTGTCAAACAGCGTGAGGGCCTCGTTGAGCTGACCGCGCTGGATTCGTGGGTACTGAACCTGAC
GCAAAGCGTCGCCTACAGCGAGGCCGACCGTGAAGAGATCCAGCGCCATATCACCGAACAGTACATCAGTGACTATACCG
CCACCTGGCGTGCCGGAATGGATAACCTCAACGTCCGTGACTATGAGGCCATGTCGGCGCTGACCGACGCGCTGGAGCAG
ATTATCAGCGGCGATCAGCCATTCCAGCGTGCGCTGACGGCGCTGCGCGATAATACCCACGCGCTGACGCTCTCCGGCAA
ACTGGATGATAAGGCGAGGGAAGCGGCAATAAATGAGATGGATTACCGCCTGTTATCCCGGCTGGGGCATGAGTTCGCAC
CGGAAAACAGCGCACTGGAGGAGCAAAAGGACAAGGCGAGTACGCTACAGGCCGTGTACCAGCAACTGACCGAGCTGCAC
CGTTACCTGCTGGCGATCCAGAACTCGCCAGTGCCGGGGAAATCGGCGCTGAAAGCAGTACAGCTACGTCTGGATCAAAA
CAGCAGCGATCCAATCTTCGCTACCCGCCAGATGGCAAAAACTCTCCCTGCACCGCTTAACCGCTGGGTAGGTAAGCTCG
CGGATCAGGCCTGGCATGTGGTGATGGTGGAAGCCGTTCGTTACATGGAAGTGGACTGGCGCGACAATGTAGTGAAACCC
TTCAACGAGCAGCTTGCCGATAACTATCCGTTTAATCCGCGCGCCACACAGGATGCCTCACTGGATTCGTTTGAACGTTT
CTTTAAACCGGATGGCATTCTGGACAATTTCTACAAGAACAACCTGCGCCTGTTCCTTGAAAACGATCTGACCTTTGGCG
ACGACGGCAGAGTGTTAATCCGTGAAGATATCCGGCAGCAACTGGATACCGCGCAGAAAATCCGCGACATCTTCTTCAGC
CAGCAGAACGGGCTGGGCGCACAGTTTGCCGTGGAAACCGTATCGCTTTCCGGCAATAAGCGGCGCAGCGTACTTAACCT
GGACGGCCAGTTAGTGGACTACAGCCAGGGACGCAACTACACCGCCCATCTGGTCTGGCCGAACAACATGCGTGAAGGCA
ATGAAAGCAAGCTGACGCTGATTGGCACCAGCGGCAGAGCACCGCACAGTATCGCGTTCAGTGGACCGTGGGCGCAGTTC
CGCCTGTTCGGCGCGGGCCAGTTGACCAATGTGACCAGTGACACCTTTAACGTGCGCTTTAACGTGGACGGCGGCGCAAT
GGTTTACCGGGTGCATGTGGATACCGAAGATAACCCGTTCACCGGCGGTCTGTTCAGCCTGTTCCGTTTACCGGATACGT
TGTATTAA

Protein sequence :

MFRFPTSRLFSTLRSALRPAMPRFRVSAAWLLALAWIFLLVWIWWQGPKWTLYEQHWLAPLTNRWLATAVWGLIALIWLT
WRVMKRLQKLEKQQKQQREEEKDPLTVELHRQQQYLDHWLLRLRRHLDNRRYLWQLPWYMVIGPAGSGKSALLREGFPSD
IIYTPESIRGTEYHPLITPRVGNQAVIFDVDGVLTSPGGDDLLHRRLREHWLGWLMQTRARQPLNGLILTLDLPDLLTAD
KSRRETLVQNLRQQLQEIRQSLHCRLPVYVVLTRLDLLTGFAALFHSLDKKDRDAILGVTFTRRAHESDDWRSELGAFWQ
TWVQQVNLALSDLMLAQTGAAPRSAVFSFSRQMQGTGEIVTALLAALLDGENMDVMLRGVWLTSSLQRGQVDDIFTQSAA
RQYGLGNSSLATWPLVETTPYFTRRLFPEVLLAEPNLAGENSVWLNSSRRRLTAFSACGAALAALLVGSWHHYYNQNWQS
GVNVLAQAKAFMDVPPPQGTDEFGNLQLSLLNPVRDATLAYGDYRDRGFLADMGLYQGVRVGPYVEQTYIQLLEQRYLPS
LMNGLIRDLNNAPPESEEKLAVLRVLRMMEDKSGRNNEAVKQYMARRWSNEFHGQRDIQAQLMAHLDYALEHTDWHAQRQ
SGDSDAVSRWTPYDKPVINAQQELSKLPIYQRVYQTLRTKALSVLPADLNLRDQVGPTFDNVFVAGNDEKLVIPQFLTRY
GLQSYFVKQREGLVELTALDSWVLNLTQSVAYSEADREEIQRHITEQYISDYTATWRAGMDNLNVRDYEAMSALTDALEQ
IISGDQPFQRALTALRDNTHALTLSGKLDDKAREAAINEMDYRLLSRLGHEFAPENSALEEQKDKASTLQAVYQQLTELH
RYLLAIQNSPVPGKSALKAVQLRLDQNSSDPIFATRQMAKTLPAPLNRWVGKLADQAWHVVMVEAVRYMEVDWRDNVVKP
FNEQLADNYPFNPRATQDASLDSFERFFKPDGILDNFYKNNLRLFLENDLTFGDDGRVLIREDIRQQLDTAQKIRDIFFS
QQNGLGAQFAVETVSLSGNKRRSVLNLDGQLVDYSQGRNYTAHLVWPNNMREGNESKLTLIGTSGRAPHSIAFSGPWAQF
RLFGAGQLTNVTSDTFNVRFNVDGGAMVYRVHVDTEDNPFTGGLFSLFRLPDTLY

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
aec30	AAQ96724.1	Aec30	Not tested	AGI-1	Protein	0.0	99
aec30	YP_851415.1	hypothetical protein	Not tested	PAI II APEC-O1	Protein	0.0	98
pmt1	AAN64194.1	Pmt1	Not tested	macrophage toxin pathogenicity island	Protein	0.0	58