PAI Gene Information


Name : espC
Accession : AAG37043.1
PAI name : espC PAI
PAI accession : AF297061
Strain : Escherichia coli 042
Virulence or Resistance: Virulence
Product : enterotoxin EspC
Function : -
Note : -
Homologs in the searched genomes :   30 hits    ( 30 protein-level )  
Publication :
    -Mellies,J.L., Navarro-Garcia,F., Okeke,I., Frederickson,J., Nataro,J.P. and Kaper,J.B., "espC pathogenicity island of enteropathogenic Escherichia coli encodes an enterotoxin", Infect. Immun. 69 (1), 315-324 (2001) PUBMED 11119520.

    -Mellies,J.L., Navarro-Garcia,F., Okeke,I., Frederickson,J., Nataro,J.P. and Kaper,J.B., "Direct Submission", Submitted (18-AUG-2000) University of Maryland School of Medicine, Center for Vaccine Development, 685 W. Baltimore St., Baltimore, MD 21201, USA.


DNA sequence :
ATGAATAAAATATACGCATTAAAATATTGTCACGCGACAGGGGGGCTGATTGCTGTATCCGAACTGGCCTCCAGAGTTAT
GAAGAAAGCCGCTCGCGGCAGCCTTTTAGCATTATTTAATCTATCATTGTATGGTGCTTTTTTAAGCGCATCTCAGGCTG
CTCAACTAAATATTGATAATGTATGGGCTAGAGATTATTTAGACCTCGCACAAAATAAGGGGGTGTTTAAAGCTGGTGCG
ACCAATGTTTCAATTCAACTCAAGAATGGCCAGACGTTTAATTTTCCAAATGTTCCAATTCCTGATTTCTCGCCGGCCTC
AAATAAAGGCGCTACTACATCTATAGGTGGAGCTTATAGTGTCACAGCAACCCATAACGGAACAACTCATCATGCAATAA
GCACCCAAAACTGGGGACAAAGCTCATATAAATATATAGACCGGATGACGAATGGAGATTTTGCTGTAACACGACTTGAT
AAGTTTGTTGTTGAAACAACAGGGGTAAAAAATTCAGTAGATTTTTCTCTCAATAGTCATGATGCTCTTGAACGTTATGG
TGTGGAGATCAATGGTGAGAAAAAAATCATTGGTTTCAGGGTTGGGGCTGGGACGACTTATACCGTTCAAAATGGTAATA
CATATAGTACAGGACAGGTATACAATCCTCTTTTGTTAAGCGCTTCAATGTTTCAGTTAAACTGGGATAACAAAAGACCA
TATAATAACACGACACCTTTTTATAATGAAACTACCGGTGGAGACAGTGGTTCCGGTTTCTATCTGTATGATAACGTAAA
AAAAGAATGGGTTATGCTTGGTACTTTATTTGGAATAGCATCCAGTGGTGCAGATGTTTGGTCTATTCTGAATCAGTATG
ATGAAAATACAGTTAATGGTTTAAAAAACAAATTTACTCAAAAAGTCCAGTTAAACAATAATACAATGTCGCTTAATAGT
GACAGTTTTACGTTAGCTGGTAATAATACAGCAGTGGAAAAAAATAATAATAACTATAAAGATCTAAGTTTTAGTGGTGG
TGGAAGTATTAATTTCGACAATGACGTAAACATTGGCTCTGGTGGTCTCATTTTTGATGCAGGGCATCATTATACTGTCA
CTGGTAATAATAAAACATTCAAGGGTGCCGGGCTGGATATTGGTGACAATACTACAGTCGACTGGAATGTGAAAGGGGTT
GTCGGTGATAACCTGCATAAAATTGGTGCAGGTACATTGAATGTTAATGTTTCTCAAGGTAATAATCTTAAAACGGGGGA
TGGTCTTGTCGTATTAAATAGCGCTAATGCATTTGATAATATTTATATGGCCAGTGGTCATGGTGTTGTAAAAATTAATC
ATAGTGCAGCGCTTAACCAGAACAATGACTATAGAGGTATTTTCTTTACTGAAAATGGTGGTACTCTGGATTTAAATGGT
TATGACCAGAGTTTTAATAAAATTGCAGCGACAGATATAGGAGCACTCATAACAAATAGTGCAGTGCAGAAAGCAGTTCT
TTCTGTTAATAATCAGTCAAACTATATGTATCATGGTTCTGTTTCAGGTAATACAGAGATAAACCACCAGTTTGATACCC
AAAAAAATAATAGTCGCCTGATTCTGGACGGTAATGTCGATATTACAAATGACATTAACATTAAGAATAGCCAGCTCACC
ATGCAGGGACATGCTACATCTCATGCTGTTTTTAGAGAGGGTGGGGTTACCTGCATGCTGCCAGGAGTTATTTGTGAAAA
GGATTATGTTTCAGGCATACAGCAACAGGAAAACTCAGCCAATAAAAATAATAATACAGATTATAAGACCAATAATCAGG
TATCATCATTTGAGCAACCTGACTGGGAAAATCGTCTGTTTAAGTTTAAGACATTGAATCTGATAAATTCAGATTTTATC
GTTGGCCGTAATGCTATTGTTGTTGGTGATATTTCTGCCAATAATTCCACTCTGTCTTTAAGTGGAAAAGATACAAAAGT
ACATATTGATATGTATGACGGCAAAAACATCACGGGAGATGGCTTCGGTTTTCGGCAGGATATTAAAGATGGTGTATCTG
TTTCTCCTGAGAGCAGCAGTTATTTTGGAAATGTTACGCTGAATAATCACTCATTACTGGATATTGGTAATAAATTTACC
GGTGGTATCGAGGCTTATGACAGCTCCGTGAGTGTGACCTCACAGAATGCTGTTTTTGATCGTGTTGGCAGCTTTGTCAA
CAGCAGCCTGACCCTCGAAAAAGGAGCAAAACTAACGGCTCAGGGCGGTATTTTCAGCACCGGGGCTGTGGACGTAAAAG
AAAATGCCTCCCTGATCCTGACGGGGACACCTTCTGCACAGAAACAGGAGTATTACTCCCCTGTGATTTCTACAACGGAA
GGGATTAACCTCGGAGATAAGGCCAGCCTTTCTGTTAAAAACATGGGCTATCTGAGTTCGGATATTCATGCAGGAACCAC
GGCGGCAACCATTAATCTGGGAGACGGTGATGCTGAGACGGATTCTCCGTTATTCAGCTCCCTGATGAAGGGATATAACG
CGGTTCTGAGTGGCAACATTACGGGTGAGCAGAGTACGGTAAATATGAACAATGCTCTGTGGTACTCTGACGGAAACTCA
ACGATCGGAACGCTGAAGAGTACGGGGGGACGAGTTGAACTGGGGGGCGGGAAAGACTTTGCCACCCTGCGGGTAAAAGA
GCTTAACGCAAATAACGCCACATTCCTGATGCATACCAACAACAGTCAGGCTGACCAGCTGAATGTCACGAATAAACTGT
TGGGCAGTAATAATACCGTCCTGGTCGACTTTTTAAACAAGCCAGCCAGTGAAATGAACGTGACGTTAATTACCGCACCG
AAAGGGAGTGACGAGAAAACGTTCACTGCAGGAACGCAGCAGATTGGTTTCAGTAATGTCACGCCGGTAATCAGCACAGA
AAAAACGGATGATGCCACAAAATGGATGCTGACAGGGTATCAGACCGTCTCTGATGCCGGTGCCTCGAAAACCGCAACGG
ACTTTATGGCGTCAGGTTATAAATCCTTCCTGACAGAGGTCAATAATCTGAACAAGCGTATGGGTGACCTGCGGGATACT
CAGGGGGATGCCGGCGTCTGGGCGCGCATCATGAACGGTACCGGTTCGGCAGATGGTGGTTACAGCGATAACTACACTCA
CGTTCAGATTGGTGCCGACAGAAAGCATGAGCTGGACGGTGTGGATTTGTTCACGGGTGCATTACTGACCTATACAGACA
GCAATGCAAGCAGCCACGCCTTCAGTGGTAAAACCAAATCCGTGGGGGGAGGGTTGTACGCTTCAGCACTCTTTGATTCC
GGGGCTTATTTTGACCTGATTGGTAAATATCTCCATCACGACAATCAGTACACGGCGAGTTTTGCGTCTCTTGGTACAAA
AGACTACAGCTCTCATTCCTGGTATGCCGGTGCAGAGGTCGGGTATCGTTACCACCTGTCGGAAGAGTCCTGGGTGGAGC
CACAGATGGAGCTGGTTTACGGTTCTGTGTCAGGAAAATCTTTTAGCTGGGAAGACCGGGGAATGGCCCTGAGCATGAAA
GACAAGGATTATAACCCACTGATTGGCCGTACCGGTGTTGACGTGGGAAGAACCTTCTCCGGAGACGACTGGAAAATTAC
CGCGCGAGCCGGGCTGGGTTACCAGTTCGACCTGCTGGCGAACGGAGAAACGGTTCTGCGGGATGCATCCGGAGAGAAAC
GTTTTGAAGGTGAAAAGGACAGCAGAATGCTGATGAATGTGGGGATGAATGCGGAAATTAAGGATAATATGCGTTTTGGC
TTGGAGCTGGAAAAATCGGCGTTCGGGAAATATAACGTGGACAATGCGATAAACGCTGACTTCCGTTATTCTTTCTGA

Protein sequence :
MNKIYALKYCHATGGLIAVSELASRVMKKAARGSLLALFNLSLYGAFLSASQAAQLNIDNVWARDYLDLAQNKGVFKAGA
TNVSIQLKNGQTFNFPNVPIPDFSPASNKGATTSIGGAYSVTATHNGTTHHAISTQNWGQSSYKYIDRMTNGDFAVTRLD
KFVVETTGVKNSVDFSLNSHDALERYGVEINGEKKIIGFRVGAGTTYTVQNGNTYSTGQVYNPLLLSASMFQLNWDNKRP
YNNTTPFYNETTGGDSGSGFYLYDNVKKEWVMLGTLFGIASSGADVWSILNQYDENTVNGLKNKFTQKVQLNNNTMSLNS
DSFTLAGNNTAVEKNNNNYKDLSFSGGGSINFDNDVNIGSGGLIFDAGHHYTVTGNNKTFKGAGLDIGDNTTVDWNVKGV
VGDNLHKIGAGTLNVNVSQGNNLKTGDGLVVLNSANAFDNIYMASGHGVVKINHSAALNQNNDYRGIFFTENGGTLDLNG
YDQSFNKIAATDIGALITNSAVQKAVLSVNNQSNYMYHGSVSGNTEINHQFDTQKNNSRLILDGNVDITNDINIKNSQLT
MQGHATSHAVFREGGVTCMLPGVICEKDYVSGIQQQENSANKNNNTDYKTNNQVSSFEQPDWENRLFKFKTLNLINSDFI
VGRNAIVVGDISANNSTLSLSGKDTKVHIDMYDGKNITGDGFGFRQDIKDGVSVSPESSSYFGNVTLNNHSLLDIGNKFT
GGIEAYDSSVSVTSQNAVFDRVGSFVNSSLTLEKGAKLTAQGGIFSTGAVDVKENASLILTGTPSAQKQEYYSPVISTTE
GINLGDKASLSVKNMGYLSSDIHAGTTAATINLGDGDAETDSPLFSSLMKGYNAVLSGNITGEQSTVNMNNALWYSDGNS
TIGTLKSTGGRVELGGGKDFATLRVKELNANNATFLMHTNNSQADQLNVTNKLLGSNNTVLVDFLNKPASEMNVTLITAP
KGSDEKTFTAGTQQIGFSNVTPVISTEKTDDATKWMLTGYQTVSDAGASKTATDFMASGYKSFLTEVNNLNKRMGDLRDT
QGDAGVWARIMNGTGSADGGYSDNYTHVQIGADRKHELDGVDLFTGALLTYTDSNASSHAFSGKTKSVGGGLYASALFDS
GAYFDLIGKYLHHDNQYTASFASLGTKDYSSHSWYAGAEVGYRYHLSEESWVEPQMELVYGSVSGKSFSWEDRGMALSMK
DKDYNPLIGRTGVDVGRTFSGDDWKITARAGLGYQFDLLANGETVLRDASGEKRFEGEKDSRMLMNVGMNAEIKDNMRFG
LELEKSAFGKYNVDNAINADFRYSF