Gene Information

Name : NWMN_1888 (NWMN_1888)
Accession : YP_001332922.1
Strain : Staphylococcus aureus Newman
Genome accession: NC_009641
Putative virulence/resistance : Unknown
Product : phage tail tape measure protein
Function : -
COG functional category : S : Function unknown
COG ID : COG5412
EC number : -
Position : 2101579 - 2106108 bp
Length : 4530 bp
Strand : -
Note : tail tape measure protein for bacteriophage phiNM3

DNA sequence :
ATGGGAGAAAGAATAAAAGGTTTATCTATAGGTTTGGATTTAGATGCAGCAAATTTAAATAGATCATTTGCAGAAATCAA
ACGAAACTTTAAAACTTTAAATTCTGACTTAAAATTAACCGGTAACAACTTCAAATATACCGAAAAATCAACTCATAGTT
ACAAACAAAGGATTAAAGAACTTGATGGAACTATCACAGGTTATAAGAAAAACGTTGATGATTTAGCCAAGCAATATGGC
AAGGTATCTCAAGAACAGGGCGAAAACAGCGCGGAAGCTCAAAAATTACGACAAGAATATAACAAACAAGCAAATGAGCT
GAATTTTTTAGAAAAAGAACTAGAAAAAACAACAACTGAGTTTGAAGAGTTCAAAAAAGCTCAAGTTGAAGCTCAAAGAA
TGGCAGAAAGTGGCTGGGGAAAAACCAGTAAAGTTTTTGAAAGTATGGGACCTAAATTAACAAAAATGGGTGATGGTTTA
AAATCCATTGGTAAAGGTTTGATGATTGGTGTAACTGCACCTGTTTTAGGTATTGCAGCAGCATCAGGAAAAGCTTTTGC
AGAAGTTGATAAAGGTTTAGATACAGTTACCCAAGCAACAGGAGCAACCGGCGGAGAGCTTAAGAAGTTGCAGAATTCAT
TTAAAGATGTTTATGGCAACTTTCCAGCAGACGCTGAGACTGTAGGCGGTGTTTTAGGGGAAGTTAACACAAGGTTAGGT
TTCACTGGCAAAGAACTTGAGAGTGCCACAGAGTCATTCTTGAAATTTAGTCACATAACAGGTTCTGACGGCGTACAAGC
CGTTCAATTAATTACGCGTGCAATGGGTGATGCAGGTATTGAAGCTGATGAGTATCAAAGTGTACTTGATATGGTAGCGA
AAGCAGCACAGGCTAGCGGTATAAGTGTTGATACATTAGCTGATAGCATTACTAAATACGGTGCTCCAATGAGGGCTATG
GGCTTTGAGATGAAAGAATCAATCGCTTTATTCTCTCAATGGGAGAAATCAGGTGTTAATACTGAAATAGCCTTCAGTGG
TTTGAAAAAAGCTATATCCAATTGGGGTAAAGCGGGTAAAGACCCAAGAGAAGAATTTAAGAAGACATTAGCAGAAATTG
AAAGGACACCGGATATAGCTAGCGCAACAAGTTTAGCGATTGAAGCATTTGGTGCAAAAGCAGGTCCTGATTTAGCAGAT
GCTATTAAAGGCGGTCGCTTTAGTTACCAAGAGTTCTTAAAAACTATCGAAGATTCGCAAGGAACGGTCAATCAGACATT
TAAAGATTCTGAAAGTGGCTCCGAAAGATTTAAAGTAGCAATGAATAAACTTAAATTAGTAGGTGCTGATGTATGGGCTT
CTATTGAAAGTGCGTTTGCTCCAGTCATGGAAGAATTAATCAAAAAGCTATCTGTAGCAGTTGATTGGTTTTCAAGTTTA
AGTGATGGATCTAAAAGGTCGATTGTTATATTCGGTGGTATTGCTGCTGCAATTGGTCCTGTAGTTTTTGGATTAGGTGC
ATTCATAAGCACAATTGGCAACGCAGTAACTGTATTAGCTCCATTATTAGCTAGTATTGTAAAGGCTGGCGGATTGATTA
GTTTTTTATCAACTAAAGTGCCTATTTTAGGAACAGTCTTCACAGCATTAACTGGTCCAATTGGTATCGTGTTAGGTGTA
CTGGCTGGTTTAGCAGTCGCATTTACAATAGCTTATAAGAAATCTGAAACATTCAGAAATTTTGTTAATGGTGCAATTAA
CAGTGTTAAACAAACGTTTAGTAATTTCATTCAATTTATCCAACCTTTCATTGATTCCGTTAAAAACGTCTTTAAACAAG
CGGTTTCAGCAATCGTTGATTTCGCTAAAGATATTTGGAGTCAAATTAATGGATTCTTTAATGAAAACGGAATTTCTATT
GTTCAAGCGCTTCAAAATATATGCAATTTTATCAAAGCTATATTTGAATTTATCTTAAATTTTGTAATTAAACCAATCAT
GTTTGCGATTTGGCAAGTGATGCAATTTATTTGGCCGGCGGTTAAAGCCTTGATTGTCAGTACTTGGGAGAATATAAAAG
GAGTAATACAAGGTGCTTTAAATATCATACTTGGCTTTATTAAGTTCTTTTCAAGTTTATTCACTGGTAATTGGCGAGGT
GTTTGGGACGGTATTGTGATGATACTAAAAGGCACTGTGCAGTTAATTTGGAATTTAATACAACTGTGGTTTGTAGGTAA
GATTCTAGGTGTTGTTAGATACTTTGGTGGATTGCTTAAAGGTTTAATATCCGGTATCTGGGGTGTTATCAAAGGTATTT
TCACAAAATCATTATCTGCAATTTGGAATGCAACGAAAAGTATTTTTGGTTTCTTATACAATAGTGTTAAATCTATTTTC
ACTAATATGAAAAACTGGTTATCTAGTACGTGGAATAATATCAAAAGCAATACCGTCGGCAAGGCTCATTCGTTATTTAC
GGGTGTAAGGTCTAAATTCACAAGTTTATGGAATGCGACGAAAGATATATTTACTAAATTAAGAAATTGGATGTCAAACA
TCTGGAACTCTATTAAAGATAACACGGTAGGTATAGCGGGTCGCTTATGGGATAGAGTGCGTAACATCTTTGGAAGCATG
CGTGACGGTTTAAAATCTATCATTAGTAAAATTAAAGATCATATCGGTGGTATGGTAGACGCTGTTAAAAGAGGTCTTAA
TAAATTAATTGAAGGTTTAAACTGGGTCGGTGGTAAGTTGGGTATGGACAAAATACCGAAGTTACACACTGGTACTGAAC
ATACACATACTACTACAAGATTAGTTAAGAACGGTAAGATTGCACGTGACACATTCGCTACAGTTGGGGATAAGGGACGC
GGAAATGGTCCAAATGGTTTCAGAAATGAAATGATTGAATTCCCTAATGGTAAACGTGTAATCACACCAAATACAGATAC
TACGGCTTATTTACCTAAAGGCTCAAAAGTATACAACGGGGCACAAACTTATTCAATGTTAAACGGAACGCTTCCGAGAT
TTAGTTTAGGTACTATGTGGAAAGATATTAAATCTGGTGCATCATCGGCATTTAACTGGACAAAAGATAAAATAGGTAAA
GGTACCAAATGGCTTGGCGATAAAGTTGGCGATGTTTTAGATTTTATGGAAAATCCAGGCAAACTTTTAAATTATATACT
TGAAGCTTTTGGAATTGATTTCAATTCTTTAACTAAAGGTATGGGAATTGCAGGCGACATAACAAAAGCTGCATGGTCTA
AGATTAAGAAAAGTGCTACTGATTGGATAAAAGAAAATTTAGAAGCTATGGGCGGTGGCGATTTAGTCGGTGGAATATTA
GACCCTGACAAAATTAATTATCATTATGGACGTACCGCAGCTTATACCGCTGCAACTGGAAGACCATTTCATGAAGGTGT
CGATTTTCCATTTGTATATCAAGAAGTTAGAACGCCGATGGGTGGCAGACTTACAAGAATGCCATTTATGTCTGGTGGTT
ATGGTAATTATGTAAAAATTACTAGTGGCGTTATCGATATGCTATTTGCGCATTTGAAAAACTTTAGCAAATCACCACCT
AGTGGCACGATGGTAAAGCCCGGTGATGTTGTTGGTTTAACTGGTAATACCGGATTTAGTACAGGACCACATTTACATTT
TGAAATGAGGAGAAATGGAAGACATTTTGACCCTGAACCATATTTAAGGAATGCTAAGAAAAAAGGTAGGTTATCAATTG
GTGGCGGTGGCGCTACTTCTGGAAGTGGTGCAACTTATGCCAGCCGAGTAATCCGACAAGCACAAAGTATTTTAGGAGGA
CGTTATAAAGGTAAGTGGATTCATGACCAGATGATGCGAGTTGCAAAGCGCGAAAGTAACTATCAATCAAATGCAGTGAA
TAATTGGGACATTAATGCTCAAAGAGGAGACCCGTCTAGAGGATTATTCCAAATTATCGGCTCAACTTTTAGAGCTAACG
CTAAACGAGGGTACACTAATTATAATAATCCAGTACATCAAGGTATCTCAGCAATGCAGTACATTGTTAGACGATATGGT
TGGGGTGGTTTTAAACGTGCTGGTGATTACGCATATGCTACAGGTGGAAAAGTTTTTGATGGTTGGTATAACTTAGGTGA
AGACGGTCATCCAGAATGGATTATTCCAACAGATCCAGCTCGTAGAAATGATGCAATGAAGATTTTGCATTATGCAGCAG
CAGAAGTAAGAGGGAAAAAAGCGAGTAAAAATAAGCGTCCTAGCCAATTATCAGACTTAAACGGGTTTGATGATCCTAGC
TTATTATTGAAAATGATTGAACAACAGCAACAACAAATAGCTTTATTACTGAAAATAGCACAATCTAACGATGTGATTGC
AGATAAAGATTATCAGCCGATTATTGACGAATACGCTTTTGATAAAAAGGTGAACGCGTCTATAGAAAAGCGAGAAAGGC
AAGAATCAACAAAAGTAAAGTTTAGAAAAGGAGGAATTGCTATTCAATGA

Protein sequence :
MGERIKGLSIGLDLDAANLNRSFAEIKRNFKTLNSDLKLTGNNFKYTEKSTHSYKQRIKELDGTITGYKKNVDDLAKQYG
KVSQEQGENSAEAQKLRQEYNKQANELNFLEKELEKTTTEFEEFKKAQVEAQRMAESGWGKTSKVFESMGPKLTKMGDGL
KSIGKGLMIGVTAPVLGIAAASGKAFAEVDKGLDTVTQATGATGGELKKLQNSFKDVYGNFPADAETVGGVLGEVNTRLG
FTGKELESATESFLKFSHITGSDGVQAVQLITRAMGDAGIEADEYQSVLDMVAKAAQASGISVDTLADSITKYGAPMRAM
GFEMKESIALFSQWEKSGVNTEIAFSGLKKAISNWGKAGKDPREEFKKTLAEIERTPDIASATSLAIEAFGAKAGPDLAD
AIKGGRFSYQEFLKTIEDSQGTVNQTFKDSESGSERFKVAMNKLKLVGADVWASIESAFAPVMEELIKKLSVAVDWFSSL
SDGSKRSIVIFGGIAAAIGPVVFGLGAFISTIGNAVTVLAPLLASIVKAGGLISFLSTKVPILGTVFTALTGPIGIVLGV
LAGLAVAFTIAYKKSETFRNFVNGAINSVKQTFSNFIQFIQPFIDSVKNVFKQAVSAIVDFAKDIWSQINGFFNENGISI
VQALQNICNFIKAIFEFILNFVIKPIMFAIWQVMQFIWPAVKALIVSTWENIKGVIQGALNIILGFIKFFSSLFTGNWRG
VWDGIVMILKGTVQLIWNLIQLWFVGKILGVVRYFGGLLKGLISGIWGVIKGIFTKSLSAIWNATKSIFGFLYNSVKSIF
TNMKNWLSSTWNNIKSNTVGKAHSLFTGVRSKFTSLWNATKDIFTKLRNWMSNIWNSIKDNTVGIAGRLWDRVRNIFGSM
RDGLKSIISKIKDHIGGMVDAVKRGLNKLIEGLNWVGGKLGMDKIPKLHTGTEHTHTTTRLVKNGKIARDTFATVGDKGR
GNGPNGFRNEMIEFPNGKRVITPNTDTTAYLPKGSKVYNGAQTYSMLNGTLPRFSLGTMWKDIKSGASSAFNWTKDKIGK
GTKWLGDKVGDVLDFMENPGKLLNYILEAFGIDFNSLTKGMGIAGDITKAAWSKIKKSATDWIKENLEAMGGGDLVGGIL
DPDKINYHYGRTAAYTAATGRPFHEGVDFPFVYQEVRTPMGGRLTRMPFMSGGYGNYVKITSGVIDMLFAHLKNFSKSPP
SGTMVKPGDVVGLTGNTGFSTGPHLHFEMRRNGRHFDPEPYLRNAKKKGRLSIGGGGATSGSGATYASRVIRQAQSILGG
RYKGKWIHDQMMRVAKRESNYQSNAVNNWDINAQRGDPSRGLFQIIGSTFRANAKRGYTNYNNPVHQGISAMQYIVRRYG
WGGFKRAGDYAYATGGKVFDGWYNLGEDGHPEWIIPTDPARRNDAMKILHYAAAEVRGKKASKNKRPSQLSDLNGFDDPS
LLLKMIEQQQQQIALLLKIAQSNDVIADKDYQPIIDEYAFDKKVNASIEKRERQESTKVKFRKGGIAIQ

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
SA1766 NP_375064.1 hypothetical protein Not tested ¥ÕSa3 Protein 0.0 99
SAKOR_01932 YP_008492120.1 hypothetical protein Not tested ¥ÕSa3 Protein 0.0 97
SAUSA300_1930 YP_494581.1 phi77 ORF001-like protein, phage tail tape measure protein Not tested ¥ÕSa3 Protein 0.0 96
SAUSA300_1930 YP_494581.1 phi77 ORF001-like protein, phage tail tape measure protein Not tested ¥ÕSa3 Protein 0.0 96
SAV1955 NP_372479.1 phi PVL ORF 15 and 16-like protein Not tested ¥ÕSa3 Protein 0.0 96
MW1895 NP_646712.1 hypothetical protein Not tested ¥ÕSa3 Protein 0.0 54