PAI Gene Information

Name : STY4607
Accession : NP_458690.1
PAI name : SPI-7
PAI accession : NC_003198_P9
Strain : Salmonella enterica RSK2980
Virulence or Resistance: Not determined
Product : probable major tail sheath protein
Function : -
Note : Similar to Bacteriophage P2 major tail sheath protein fI SW:VPF1_BPP2 (P22501) (395 aa) fasta scores: E(): 0, 67.5% id in 391 aa, and to Bacteriophage 186 tail sheath protein fI J TR:Q37844 (EMBL:U32222) (392 aa) fasta scores: E(): 0, 69.6% id in 388 aa
Homologs in the searched genomes : 243 hits ( 243 protein-level )
Publication :

Direct Submission

Submitted (25-OCT-2001) Submitted on behalf of the Salmonalla sequencing team, Sanger Centre, Wellcome Trust Genome Campus, Hinxton, Cambridge CB10 1SA, UK

Complete genome sequence of a multiple drug resistant Salmonella enterica serovar Typhi CT18

Nature 413 (6858), 848-852 (2001) PUBMED 11677608

Direct Submission

Submitted (10-SEP-2013) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

DNA sequence :
ATGGCTCAGGATTACCACCACGGGGTGCGCGTTGTTGAAATCAACGAGGGCACCCGACCTATTACCACGGTGAGCACTGC CATCGTGGGCATGGTCTGCACCGGCGATGATGCTGATGCGTCCGTGTTCCCCATCAATAAGCCTGTCCTGCTGACTGATG TGCTCACCGCCAGCGGTAAAGCGGGGGAGTCCGGCACGCTGGCCCGCTCGCTGGACGCGATTGCAGATCAGGCAAAACCC GTGACTGTCGTTGTGCGTGTGGCGCAGGGCGAAACCGAAGCGGAAACCACCTCCAATATTATCGGCGGCGTAACTTCCGA CGGTAAGAAAACGGGCATGAAAGCGCTACTGTCGGCGCAGTCGCAGCTCGGTGTCAAGCCGCGCATTCTTGGGGTGCCGG GACATGACACTCAGGCCGTTGCTACTGAACTGCTGGGCGTGGCGCAAAGCTTGCGCGGGTTTGCCTACCTTGCTGCTAAT GGCTGCAAAACGGTGGAGGAAGCTATTGCCTATCGCGAGAATTTCAGTCAGCGCGAGGGAATGCTGATCTGGCCTGACTT CATCAACTTTGACACCGTGCTGAAAGCAGACGCGACGGCTTACGCCTCCGCCCGTGCGCTCGGCCTGCGTGCCAAAATCG ACGAGCAGATCGGCTGGCATAAAACCCTGTCCAATGTGGGTGTGAACGGTGTCACCGGCATTTCCGCTGATGTGTTCTGG GATCTGCAGGACCCGGCAACCGATGCGGGACTGCTGAACAAAAATGACGTCACCACATTGATCCGCAAAGACGGCTTCCG CTTCTGGGGGTCCCGTTGTCTCAGTGACGATCCGCTGTTTGCCTTTGAGAACTACACCCGCACGGCGCAGGTGCTGGCTG ACACTATGGCGGAGGCGCACATGTGGGCGGTGGATGGCGTGCTTAATCCGTCGCTGGCCCGCGACATTATTGAAGGACTA CGCGCCAAGATGCGCAGTCTGGTCAACCAGGGATACCTGATTGGTGGTGACTGCTGGCTGGATGAGTCTGTTAACGATAA AGACACCCTTAAAGCCGGGAAACTGACCATCGATTATGACTACACGCCGGTGCCTCCGCTTGAAAACCTGATGCTGCGCC AGCGCATCACCGATCGTTACCTGGTCGATTTTGCCAGCCGTGTCGCTGCATAA
Protein sequence :
MAQDYHHGVRVVEINEGTRPITTVSTAIVGMVCTGDDADASVFPINKPVLLTDVLTASGKAGESGTLARSLDAIADQAKP VTVVVRVAQGETEAETTSNIIGGVTSDGKKTGMKALLSAQSQLGVKPRILGVPGHDTQAVATELLGVAQSLRGFAYLAAN GCKTVEEAIAYRENFSQREGMLIWPDFINFDTVLKADATAYASARALGLRAKIDEQIGWHKTLSNVGVNGVTGISADVFW DLQDPATDAGLLNKNDVTTLIRKDGFRFWGSRCLSDDPLFAFENYTRTAQVLADTMAEAHMWAVDGVLNPSLARDIIEGL RAKMRSLVNQGYLIGGDCWLDESVNDKDTLKAGKLTIDYDYTPVPPLENLMLRQRITDRYLVDFASRVAA