PAI Gene Information

Name : STY4611
Accession : NP_458693.1
PAI name : SPI-7
PAI accession : NC_003198_P9
Strain : Salmonella enterica RSK2980
Virulence or Resistance: Not determined
Product : probable phage tail fibre protein
Function : -
Note : Similar to Bacteriophage P2 probable tail fiber protein SW:VPH_BPP2 () (669 aa) fasta scores: E(): 7.1e-29, 37.6% id in 569 aa
Homologs in the searched genomes : 13 hits ( 13 protein-level )
Publication :

Direct Submission

Submitted (25-OCT-2001) Submitted on behalf of the Salmonalla sequencing team, Sanger Centre, Wellcome Trust Genome Campus, Hinxton, Cambridge CB10 1SA, UK

Complete genome sequence of a multiple drug resistant Salmonella enterica serovar Typhi CT18

Nature 413 (6858), 848-852 (2001) PUBMED 11677608

Direct Submission

Submitted (10-SEP-2013) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USA

DNA sequence :
ATGAGCACAAAATTTTATACCCTGCTGACGGATATTGGCGCGGCAAAACTTGCCAGCGCCGCCGCGCTCGGTGTGCCGCT AAAAATTACCCATATGGCGGTGGGCGATGGCGGCGGAGTATTGCCAACGCCGGACGCAAAGCAGACGGCACTGGTAAATG AGAAACGCCGGGCTGCGCTGAATATGCTTTATATCGACCCGCAGAACAGTAGCCAGATTATTGCTGAGCAGGTAATCCCG GAAACTGAGGGCGGGTGGTGGATTCGTGAAGTTGGCCTGTTTGATGAAACCGGTGCGCTGATCGCTGTGGGTAACTGCCC TGAGAGCTACAAGCCGCAGCTGACAGAAGGGAGCGGACGTACGCAGACCGTGCGCATGGTACTGATTACCAGCAGCACCG ATAACATCACCCTGAAAATTGACCCTGCAGTAGTGCTGGCAACCCGTAAATATGTAGATGATAAGGCGCTGGAGCTGAAG GTATATGTAGACGACCTGATGGCAAAGCATCTTGCTGCGCCGGACCCGCATTCACAGTATGCGCAGAAGGACAGCCCGAC ACTCACAGGGATTCCAAAGGTACCGACGCCAGCGGCGGGTAACAGCACTAAACAGATTGCGAACACGGAATTTGTGGCAT CGTCTATTGCGGCAATGGTGGATTCTGCGCCTGCAGCACTGGATACGCTGAACGAGCTGGCAGCGGCTCTGGGGAATGAC CCGAATTTTGCCACAACGATGTTAAACGCTCTTGGTGGAAAGCAGCCGCTGGACAATACGCTGACGAATTTAAGCGGAAA AGATGTCGCCGGCCTTCTCGCATACTTCGGTTTAGGAGAAACGATAAATCGTGCCGCCGATGCGCTACAAAAATCACAGA ACGGTGCAGACATTCCTGACAAGCCGCGGTTTGTACAAAATATCGGTTTAAAAGAAACCCTGAACCCGACAAAACGCGTG AGTATAGGCAATATCGGAACCGGCGTTTTTGACGGCAGCACACCGTGTATAAATATCGGTGACAGTGACAGTGGATTTAT CGGCAGCGCGGATGGCGTACTGGATATTTACTGTAACGGTGCCAAAGTGGGTTATATCAATGGTAACGGATTACACATGC TCACTGATATTCATTTCGATAATGCGAGCATGACCACTAATGGTGACATTTTTAGTTCAGTGTGGGGGGATAACTGGCTG AGTATCTGGATTACTAATCAGCTAAATACCCGTGGAACGATTGACTGGATCAATAGTGAACTGGCAATTCGTGACAACAA CATCAACACCCGCGCCACCATTGATTATGTTAACCAGACTTTCGCCCGTAAAAATACCGGCAGCATTCAGGACTGGGGCT GGATTCTGGACGACAGCACCGGATTTATAATGCAGTGGGGAACACTTGGTAACTCAAACGGAACCTACAATTTCCCGCGC GCTTTCCCTGTTGGTTGCTTTGCCGTTTTTGTAACCAATACCAACGCTCAGGGCACCCAGGTGGATAACGCATTCGGATA CCCGGTGAGCAACAGTCAGTTTTTTGCCGCCACCAAGTCATCAGGAATGGCCAATCTGGTCAATAATTTTCCTGTAGCCT GGTTTGCGATTGGGAGATAA
Protein sequence :
MSTKFYTLLTDIGAAKLASAAALGVPLKITHMAVGDGGGVLPTPDAKQTALVNEKRRAALNMLYIDPQNSSQIIAEQVIP ETEGGWWIREVGLFDETGALIAVGNCPESYKPQLTEGSGRTQTVRMVLITSSTDNITLKIDPAVVLATRKYVDDKALELK VYVDDLMAKHLAAPDPHSQYAQKDSPTLTGIPKVPTPAAGNSTKQIANTEFVASSIAAMVDSAPAALDTLNELAAALGND PNFATTMLNALGGKQPLDNTLTNLSGKDVAGLLAYFGLGETINRAADALQKSQNGADIPDKPRFVQNIGLKETLNPTKRV SIGNIGTGVFDGSTPCINIGDSDSGFIGSADGVLDIYCNGAKVGYINGNGLHMLTDIHFDNASMTTNGDIFSSVWGDNWL SIWITNQLNTRGTIDWINSELAIRDNNINTRATIDYVNQTFARKNTGSIQDWGWILDDSTGFIMQWGTLGNSNGTYNFPR AFPVGCFAVFVTNTNAQGTQVDNAFGYPVSNSQFFAATKSSGMANLVNNFPVAWFAIGR