PAI Gene Information


Name : unnamed
Accession : AAC12276.1
PAI name : VPI
PAI accession : AF034434
Strain : Vibrio cholerae IEC224
Virulence or Resistance: Not determined
Product : putative inner membrane protein
Function : -
Note : hypothetical Orf3
Homologs in the searched genomes :   7 hits    ( 5 protein-level,   2 DNA-level )  
Publication :
    -Karaolis,D.K., Johnson,J.A., Bailey,C.C., Boedeker,E.C., Kaper,J.B. and Reeves,P.R., "A Vibrio cholerae pathogenicity island associated with epidemic and pandemic strains", Proc. Natl. Acad. Sci. U.S.A. 95 (6), 3134-3139 (1998) PUBMED 9501228.

    -Karaolis,D.K.R., Johnson,J.A., Bailey,C.C., Boedeker,E.C., Kaper,J.B. and Reeves,P.R., "Direct Submission", Submitted (14-NOV-1997) Center for Vaccine Development, University of Maryland School of Medicine, 685 W. Baltimore Street, Room 480 HSF, Baltimore, MD 21201, USA.


DNA sequence :
ATGGTTGAGTATGTCGGTGATGATCCTTCCGAACTCTATGACATGTTATTGTTGACCATCAATTATGGTAACCTCTCAGG
TATAGATTTTTCTCGCGAAATTTTTAATAAAAATAAGGATATTATAGTTGACTATAAAAAGGGTACCATTAACCATAGAG
GTATTACTGGTGGATTTTTGGGGAAGACTTTTGCTCAAGTTGCAGCCATTTTGTATCAAAAATCTATTGAGGAGCTCAGC
TATATTGAGTTACTGAGTACTAAAAATGCATTAGAAAGTATTGGTATTGACACCGTATACCCTTATGGCAGTATGGATAA
TATAAAAGCAAGTCTATTCTTGAGGGTCAACAATAATCTATCAAAAAGGTTACTTCCTGAAGAGGTCGGTATTGGATCTG
AGCCATTTATTATTGATGAATTATTGGCAAGAAATAATCAATTAACAATGTTTAACTTTTCTAATGCATTAGATAAGCTT
ACTGAAGATATTTATTCTAATGCTAATTTATATCGTTCAGATAATGTTGTAAGACTCTATGCTGATCATAACTATACAGG
TCACTATATAGATATTGAAAATTCGACGAAATTCCTACATGGATTTAATGATACACTTTCGTCTTGGACTATCCCACATG
GCTGGTCTGTACGATTTTATGAACATGGTGACTATCAAGGACGTTATTGGACAAGAGATGCTTCTGGAAATGAATCAGGA
TTTAATGATGTAATTAGCTCTATTGAGATATTGAAAAAAACATCTGGGATAAAAGGTAGCTTAATACGTAATGAGCTTGA
ATCATTAAAAAATAGCTACAGAGAAATAGATAAATTTCAAGTAATTGTCGGTTATGAAAATGAAACACCAATTTATGCCC
TTCCTTTAACTGATGAGCTTTTTGCTAAAGCTCAGCTGTACAGTTATGGATTAGATGCCAACTTTGTTGACAAACACTGG
AAGTCATACCTAAAAAAAGGCCGCTTGTCTCTTATCCCCGGGGTTCGTGTAGGGAAGGATATTCTTAAAAAGGATGCTGC
TGCATTAGGAGGAGATGTAACAACAAAAGGTGCACAAGATTTATGGAGAAGAAAATACCAAGAAATCAGCCAAGTTATGG
CAAAGTATATTGCAACTCTTATTTCATTTAAAGCAAAGCTAGAGGGAAAAGAATCATGGGATATTCAATCTGAAAATAAA
AATCGTTCAGTTAGATTTAATTTTGGATTCGGAATTACATATTATAATATGGGTAATAATGGTAAAGCCCATTCAAGATA
TGAAAATATTCCAACTCAAAGCTGGGTCATGACGGGTAAGGATATAAGTTATTCGGTTACGACACCTGGTGATTTGTTGA
GCCTGTTCAGTCTTAATAATTTTAAAGTGATAGAACCTATCGATTTTAATTCAGGCTCGAATAATTATCCACTTTATCAA
TTGATGAACTCCGATTACGCCGATAAGTGTTCATATTATCAAGATGGATGGTATCCTCGGTGGAATGTGTGTGATACAAA
ATTTATAACGAGAAATAAAAAATCATATAATACAAAAGACATCATGTCATATGGATGGCAAGAGTTTCTAAATTTTAAAA
TGAACGATTTGAAGACTGTACAAACAGATAGAGATATAGCATATCAAGTATTGATGGCGATTCTTCCTGTATGGGGAACT
GTTGAAGATATTAAATCGGGTGATGCAGGAATGGCAACCCTTGGTGTGTTAGGTGACGTAATGTTTTTTTTACCCATAGC
AAAAAGTGTTTCTAGTATCGGAAAACTATCTGCTAAAGCTGCGTCGTCTAAACTACTACCGAGAAATGTTAAGTTTGTTA
GAAATGTCATTGGCCTAAACAAACAAGGTAAGTATTCATTAACATCATCGCAAGCTGATAGAGCTTTCTATAAATTAAAA
ATACAAGGAAAACTAAAGGAACTCCCTAAAGTTATATTAAATGAACTTAATCCTATCGCAGGTTTGGATCAGCTCGTTGT
TACAGGGACAAGTAAATTATATAAAAAATATTCATCGCGGGTTAGTATACCTAAAAAAAATATAATAGGTGATAACTCAG
TTGTGTTTTACGATGATTTAAAGTTTAAATCAGAGGTGTTTTCAGTATCATATTTAGATGATGGTTATTTAATTATTAAT
AATCAATATCGAGCTGTTTATATTGATGGTAACTACTATAGGGTCGAATATGATCCAATACTACGTGCTAATTTTATTTA
TGAACAAAATAGTGGGAGAAGGATAGAAATTATTAAAGATAAAAATGGCAATTGGTCTATTAAAGAAATTAATAATGGGA
TTTGTCCACTTGTTTCGTTAATGAATAATACTAAAGTATGTCATTTCACCAACATTGATGATGCATTAATAAGTATGGGG
TTTGACCCAAAAACCAGAACAGCATCAGGATTATTGGAGTTGATTAATGGTCGATATGGACCTGATATTAAAGAATACTT
ATTAAAATTAAATTCTTCGCTATCTCTTAATTATAATATCGATATAGATACTCTAAATTGGGTTTTCGATACTATAGAAA
ATTCTGGCATGTCTAGATATGCATTTACTCCATTTGTAAAAAATACTGATGCCATCATGTATGATATGCTAGGTAAGTTT
TATAATAATAACATGAGTATTAAACCTGTTTTTTTGAACAAATCGCAGTACAAAAAATTAAAAAAAACTTTAGACTCTGA
TAAAGAATTAATTATAAATGTAATTTCAGAACAAAGGAAAATTAATCTAAATGAGGCACAGCAGCTCTTCGATGAATTTT
ATGCTTCTGTTACGAAAGATCCTATTTTTGGTTTGGATTCTATAACACATGATAGACCGGTTATTCATGTCGTCGGACAT
GGTGATGCTGGTGATGAAGTCATCTACCCTGGTGATGCAAGCCATTACTTTTACGCTTTCGAGTTAGCTGATATGCTGAA
AAATAAAGGATTAAAGCCGGATTCAATCATAAAACTTGACTTTTGTTGGAGTGCTTGCTCTCTCAAACCAAGTGATTATT
CAAAAACAGAAGTACTGACTCGTATGAATAAGGGGGATTACACTCCTTTATTTGGTGACATTGATGATAGCTTTCTGGGG
GAGTTTGCTAAAGAATTAACGGCAATGTACCCTACATTCCGTGGACCAATAATCGGATACGTAGGGACAGTATTAAACAC
AATTCAAGATAATGTGTTAACTTTAGCTAATACACAAGGTCGGTTTCATGCTGTAGAAATGAACTTTTCTGATGGTAAAT
TTTTTTTCAAGAAAGAGGATGCAGAAGTTATTTATGGGAGTTATAAAAATAAATGA

Protein sequence :
MVEYVGDDPSELYDMLLLTINYGNLSGIDFSREIFNKNKDIIVDYKKGTINHRGITGGFLGKTFAQVAAILYQKSIEELS
YIELLSTKNALESIGIDTVYPYGSMDNIKASLFLRVNNNLSKRLLPEEVGIGSEPFIIDELLARNNQLTMFNFSNALDKL
TEDIYSNANLYRSDNVVRLYADHNYTGHYIDIENSTKFLHGFNDTLSSWTIPHGWSVRFYEHGDYQGRYWTRDASGNESG
FNDVISSIEILKKTSGIKGSLIRNELESLKNSYREIDKFQVIVGYENETPIYALPLTDELFAKAQLYSYGLDANFVDKHW
KSYLKKGRLSLIPGVRVGKDILKKDAAALGGDVTTKGAQDLWRRKYQEISQVMAKYIATLISFKAKLEGKESWDIQSENK
NRSVRFNFGFGITYYNMGNNGKAHSRYENIPTQSWVMTGKDISYSVTTPGDLLSLFSLNNFKVIEPIDFNSGSNNYPLYQ
LMNSDYADKCSYYQDGWYPRWNVCDTKFITRNKKSYNTKDIMSYGWQEFLNFKMNDLKTVQTDRDIAYQVLMAILPVWGT
VEDIKSGDAGMATLGVLGDVMFFLPIAKSVSSIGKLSAKAASSKLLPRNVKFVRNVIGLNKQGKYSLTSSQADRAFYKLK
IQGKLKELPKVILNELNPIAGLDQLVVTGTSKLYKKYSSRVSIPKKNIIGDNSVVFYDDLKFKSEVFSVSYLDDGYLIIN
NQYRAVYIDGNYYRVEYDPILRANFIYEQNSGRRIEIIKDKNGNWSIKEINNGICPLVSLMNNTKVCHFTNIDDALISMG
FDPKTRTASGLLELINGRYGPDIKEYLLKLNSSLSLNYNIDIDTLNWVFDTIENSGMSRYAFTPFVKNTDAIMYDMLGKF
YNNNMSIKPVFLNKSQYKKLKKTLDSDKELIINVISEQRKINLNEAQQLFDEFYASVTKDPIFGLDSITHDRPVIHVVGH
GDAGDEVIYPGDASHYFYAFELADMLKNKGLKPDSIIKLDFCWSACSLKPSDYSKTEVLTRMNKGDYTPLFGDIDDSFLG
EFAKELTAMYPTFRGPIIGYVGTVLNTIQDNVLTLANTQGRFHAVEMNFSDGKFFFKKEDAEVIYGSYKNK