PAI Gene Information

Name : nanH (VC0395_A1381)
Accession : YP_001217324.1
PAI name : VPI-2
PAI accession : NC_009457_P3
Strain : Vibrio cholerae IEC224
Virulence or Resistance: Not determined
Product : neuraminidase
Function : -
Note : identified by match to protein family HMM PF02012; match to protein family HMM PF09264
Homologs in the searched genomes : 8 hits ( 8 protein-level )
Publication :

A recalibrated molecular clock and independent origins for the cholera pandemic clones

PLoS ONE 3 (12), E4053 (2008) PUBMED 19115014

Direct Submission

Submitted (18-MAY-2007) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

Direct Submission

Submitted (16-MAR-2007) The Institute for Genomic Research, 9712 Medical Center Drive, Rockville, MD 20850, USA

DNA sequence :
TTGTCAATCAAGATGACTTCACAACGAAGAAGAGCATCGATTCACAAGGAAACAGATTCTAATATAAAGGGAGTAGATAT GCGTTTCAAAAACGTAAAGAAAACCGCTTTAATGCTTGCAATGTTCGGTATGGCGACAAGCTCAAACGCCGCACTTTTTG ACTATAACGCAACGGGTGACACTGAGTTTGACAGTCCAGCCAAACAGGGATGGATGCAAGACAACACGAATAATGGCAGC GGCGTTTTAACCAATGCAGATGGAATGCCCGCTTGGTTGGTGCAAGGTATTGGAGGGAGAGCTCAATGGACATATTCTCT CTCTACTAATCAACATGCCCAAGCATCAAGTTTCGGTTGGCGAATGACGACAGAAATGAAAGTGCTCAGTGGTGGAATGA TCACAAACTACTACGCCAACGGCACTCAGCGTGTCTTACCCATCATTTCATTAGATAGCAGTGGTAACTTAGTTGTTGAG TTTGAAGGGCAAACTGGACGCACCGTTTTGGCAACCGGCACAGCAGCAACGGAATATCATAAATTTGAATTGGTATTCCT TCCTGGAAGTAACCCATCCGCTAGCTTTTACTTCGATGGCAAACTCATTCGTGACAACATCCAGCCGACTGCATCAAAAC AAAATATGATCGTATGGGGGAATGGCTCATCAAATACGGATGGTGTCGCCGCTTATCGTGATATTAAGTTTGAAATTCAA GGCGACGTCATCTTCAGAGGCCCAGACCGTATACCGTCCATTGTAGCAAGTAGCGTAACACCAGGGGTGGTAACCGCATT TGCAGAGAAACGTGTGGGGGGAGGAGATCCCGGTGCTCTGAGTAATACCAATGACATAATCACTCGTACCTCACGAGATG GCGGTATAACTTGGGATACCGAGCTCAACCTCACTGAGCAAATCAATGTCAGTGATGAGTTTGATTTCTCCGATCCTCGG CCTATCTATGATCCTTCCTCCAATACGGTTCTTGTCTCTTATGCTCGATGGCCGACCGATGCCGCTCAAAACGGAGATCG AATAAAACCATGGATGCCAAACGGTATTTTTTACAGCGTCTATGATGTTGCATCAGGGAACTGGCAAGCGCCTATCGATG TTACCGATCAGGTGAAAGAACGCAGTTTCCAAATCGCTGGTTGGGGTGGTTCAGAGCTGTATCGCCGAAATACCAGCCTA AATAGCCAGCAAGACTGGCAATCAAACGCTAAGATCCGAATTGTTGATGGTGCAGCGAACCAGATACAAGTTGCCGATGG TAGCCGAAAATATGTTGTCACACTGAGTATTGATGAATCAGGTGGTCTAGTCGCTAATCTAAACGGTGTTAGTGCTCCGA TTATCCTGCAATCTGAACACGCAAAGGTACACTCTTTCCATGACTACGAACTTCAATATTCGGCGTTAAACCACACCACA ACGTTATTCGTGGATGGTCAGCAAATCACAACTTGGGCTGGCGAAGTATCGCAGGAGAACAACATTCAGTTTGGTAATGC GGATGCCCAAATTGACGGCAGACTGCATGTGCAAAAAATTGTTCTCACACAGCAAGGCCATAACCTCGTGGAGTTTGATG CTTTCTATTTAGCACAGCAAACCCCTGAAGTAGAGAAAGACCTTGAAAAGCTTGGTTGGACAAAAATTAAAACGGGCAAC ACCATGAGTTTGTATGGAAATGCCAGTGTCAACCCAGGACCGGGTCATGGCATCACCCTTACTCGACAACAAAATATCAG TGGCAGCCAAAACGGCCGCTTGATCTACCCAGCGATTGTGCTTGATCGTTTCTTCTTGAACGTCATGTCTATTTACAGTG ATGATGGCGGTTCAAACTGGCAAACCGGTTCAACACTCCCTATCCCCTTTCGCTGGAAGAGTTCGAGTATCCTAGAAACT CTCGAACCTAGTGAAGCTGATATGGTTGAACTCCAAAACGGTGATCTACTCCTTACTGCACGCCTTGATTTTAACCAAAT CGTTAATGGTGTGAACTATAGCCCACGCCAGCAATTTTTGAGTAAAGATGGTGGAATCACGTGGAGCCTACTTGAGGCTA ACAACGCTAACGTCTTTAGCAATATCAGTACTGGTACCGTTGATGCTTCTATTACTCGGTTCGAGCAAAGTGACGGTAGC CATTTCTTACTCTTTACTAACCCACAAGGAAACCCTGCGGGGACAAATGGCAGGCAAAATCTAGGCTTATGGTTTAGCTT CGATGAAGGGGTGACATGGAAAGGACCAATTCAACTTGTTAATGGTGCATCGGCATATTCTGATATTTATCAATTGGATT CGGAAAATGCGATTGTCATTGTTGAAACGGATAATTCAAATATGCGAATTCTTCGTATGCCTATCACATTGCTAAAACAG AAGCTGACCTTATCGCAAAACTAA
Protein sequence :
MSIKMTSQRRRASIHKETDSNIKGVDMRFKNVKKTALMLAMFGMATSSNAALFDYNATGDTEFDSPAKQGWMQDNTNNGS GVLTNADGMPAWLVQGIGGRAQWTYSLSTNQHAQASSFGWRMTTEMKVLSGGMITNYYANGTQRVLPIISLDSSGNLVVE FEGQTGRTVLATGTAATEYHKFELVFLPGSNPSASFYFDGKLIRDNIQPTASKQNMIVWGNGSSNTDGVAAYRDIKFEIQ GDVIFRGPDRIPSIVASSVTPGVVTAFAEKRVGGGDPGALSNTNDIITRTSRDGGITWDTELNLTEQINVSDEFDFSDPR PIYDPSSNTVLVSYARWPTDAAQNGDRIKPWMPNGIFYSVYDVASGNWQAPIDVTDQVKERSFQIAGWGGSELYRRNTSL NSQQDWQSNAKIRIVDGAANQIQVADGSRKYVVTLSIDESGGLVANLNGVSAPIILQSEHAKVHSFHDYELQYSALNHTT TLFVDGQQITTWAGEVSQENNIQFGNADAQIDGRLHVQKIVLTQQGHNLVEFDAFYLAQQTPEVEKDLEKLGWTKIKTGN TMSLYGNASVNPGPGHGITLTRQQNISGSQNGRLIYPAIVLDRFFLNVMSIYSDDGGSNWQTGSTLPIPFRWKSSSILET LEPSEADMVELQNGDLLLTARLDFNQIVNGVNYSPRQQFLSKDGGITWSLLEANNANVFSNISTGTVDASITRFEQSDGS HFLLFTNPQGNPAGTNGRQNLGLWFSFDEGVTWKGPIQLVNGASAYSDIYQLDSENAIVIVETDNSNMRILRMPITLLKQ KLTLSQN