Gene Information

Name : SAUSA300_1930 (SAUSA300_1930)
Accession : YP_494581.1
Strain : Staphylococcus aureus FPR3757
Genome accession: NC_007793
Putative virulence/resistance : Unknown
Product : phi77 ORF001-like protein, phage tail tape measure protein
Function : -
COG functional category : S : Function unknown
COG ID : COG5412
EC number : -
Position : 2096778 - 2101307 bp
Length : 4530 bp
Strand : -
Note : identified by match to protein family HMM PF01464; match to protein family HMM PF01551; match to protein family HMM TIGR01760

DNA sequence :
ATGGGAGAAAGAATAAAAGGTTTATCTATAGGTTTGGATTTAGATGCAGCAAATTTAAATAGATCATTTGCAGAAATCAA
ACGAAACTTTAAAACTTTAAATTCTGACTTAAAATTAACAGGCAACAACTTCAAATATACCGAAAAATCAACTGATAGTT
ACAAACAAAGGATTAAAGAACTTGATGGAACTATCACAGGTTATAAGAAAAACGTTGATGATTTAGCTAAGCAATATGAC
AAGGTATCTCAAGAACAGGGCGAAAACAGTGCAGGAGCTCAAAAGTTACGACAAGAATATAACAAACAAGCAAATGAACT
GAATTATTTAGAAAGAGAATTACAAAAAACATCAGCCGAATTTGAAGAGTTCAAAAAAGCTCAAGTTGAAGCTCAAAGAA
TGGCAGAAAGTGGCTGGGGAAAAACCAGTAAAGTTTTTGAAAGTATGGGACCTAAATTAACAAAAATGGGTGATGGTTTA
AAATCCATTGGTAAAGGCATGATGATTGGTGTAACTGCACCTGTTTTAGGTATCGCAGCAGCATCAGGAAAAGCTTTTGC
AGAAGTTGATAAAGGTTTAGATACTGTTACTCAAGCAACAGGCGCAACAGGCAGTGAATTAAAAAAATTGCAGAACTCAT
TTAAAGATGTTTATGGCAATTTTCCAGCAGATGCTGAAACTGTTGGTGGAGTTTTAGGAGAAGTTAATACAAGATTAGGT
TTTACAGGTAAAGAACTTGAAAATGCCACAGAGTCATTCTTGAAATTCAGTCATATAACAGGTTCTGACGGTGTGCAAGC
CGTACAGTTAATTACCCGTGCAATGGGCGATGCAGGTATCGAAGCAAGTGAATATCAAAGTGTTTTGGATATGGTAGCAA
AAGCGGCGCAAGCTAGTGGGATAAGTGTTGACACATTAGCTGATAGTATTACTAAATACGGCGCTCCAATGAGAGCTATG
GGCTTTGAGATGAAAGAATCAATTGCTTTATTCTCTCAATGGGAAAAGTCAGGCGTTAATACTGAAATAGCATTCAGTGG
TTTGAAAAAAGCTATATCAAATTGGGGTAAAGCTGGTAAAAACCCAAGAGAAGAATTTAAGAAGACATTAGCAGAAATTG
AAAAGACGCCGGATATAGCTAGCGCAACTATTTTAGCGATTGAAGCATTTGGTGCAAAGGCAGGTCCTGATTTAGCAGAC
GCTATTAAAGGTGGTCGCTTTAGTTATCAAGAATTTTTAAAAACTATTGAAGATTCCCAAGGCACAGTAAACCAAACATT
TAAAGATTCTGAAAGTGGCTCCGAAAGATTTAAAGTAGCAATGAATAAATTAAAATTAGTAGGTGCTGATGTATGGGCTT
CTATTGAAAGTGCGTTTGCTCCAGTCATGGAAGAATTAATAAAAAAGCTATCAGTCGCTGTCGATTGGTTTTCGAATTTA
AGTGATGGTTCTAAAAGATCAATTGTTATTTTCGGTGGTATTGCTGCTGCAATTGGTCCTGTAGTTTTTGGGTTAGGTGC
ATTTATAAGCACAATTGGTAATGCAGTAACTGTATTAGCCCCACTATTAGCTGGTATTGCAAAGGCTGATGGATTAATTA
GTTTTTTATCGACTAAAGTACCTATATTAGGAACTGTCTTCACAGCTTTAACTGGTCCAATTGGCATTGTATTAGGTGTT
TTAGCTGGCCTAGCAGTCGCATTTACAATTGCTTATAAGAAATCTGAAACATTTAGAAATTTTGTTAATGATGCAATTGA
AAGTGTTAAACAAACATTTAGTAATTTTATTCAATTTATTCAACCTTTCATTGATTCCGTTAAAAACGTCTTTAAACAAG
CGGTTTCAGCAATCGTTGATTTCGCTAAAGATATTTGGAGTCAAATTAATGGATTCTTTAATGAAAACGGAATTTCTATT
GTTCAAGCGCTTCAAAATATATGCAATTTTATCAAAGTTATATTTGAATTTATCTTAAATTTTGTAATTAAACCAATAAT
GTTTGCAATCTGGCAAGTGATGCAATTTATTTGGCCGGCGGTTAAAGCCTTGATTGTCAGTACTTGGGAGAATATAAAAG
GTGTGATACAAGGAACTTTAAATATCATACTAGGTTTAATTAAGTTCTTCTCAAGTTTATTTACTGGAGATTGGCGAGGA
GTTTGGGACGCGATTATTATGATTCTTAAAGGAGTCGTTCAATTAATATGGAATTTAATTCAATTATGGTTTGTAGGCAA
AATACTTGGCGTTGTTAGGTACTTTGGCGGATTGCTAAAAGGATTAATAACAGGTATTTGGGACGTAATAAAAAGTATAT
TCAGTAAATCTTTATCAGCAATTTGGAATGCGACAAAAAGTATTTTTGGATTCTTATTTAATAGTGTCAAATCAATTTTC
ACGAATATGAAAAATTGGTTATCTAACACATGGAGTAGTATCCGTACGAATACGATAGGAAAAGCACAGTCATTATTTAG
TGGTGTGAAATCAAAATTCACTAGTTTGTGGAATGCGACAAAAGATATTTTTAGTAATCTAAGAAATTGGATGGCAAATA
TTTGGAATTCCATTAAAGATAATACGGTTGGAATTGCAAGTCGTTTATGGAGTAAAGTGCGTGGAATTTTTACAAATATG
CGTGACGGCTTACAAAGTATTATCAGCAAAATTAAAAGTCATATCGGCGGTATGGTAGATGCTATTAAAAAAGGACTTAA
TAAATTAATTGAAGGTTTAAACTGGGTCGGTGGTAAGCTGGGAATGGATAAAATACCTAAGTTACACACTGGTACAGAAC
ACACACATACTACTACAAGATTAGTTAAGAACGGTAAGATTGCGCGGGATACGTTCGCTACGGTTGGGGATAAAGGACGT
GGAAATGGTCCGAATGGTTTCAGAAATGAAATAATTGAATTCCCTAATGGTAAACGTGTAATCACACCTAATACAGATAC
TACCGCTTATTTACCTAAAGGCTCAAAAGTATACAACGGTACACAAACTTATTCAATGTTAAACGGAACGCTTCCAAGAT
TTAGCTTAGGTACTATGTGGAAAGATATTAAATCCGGTGCATCATCGGCATTTAACTGGACAAAAGATCAAATAGGTAAA
GGTACCAAATGGCTTGGCGATAAAGTTGGCGATGTTTTAGATTTTATGGAAAATCCTGGCAAACTTTTAAATTATATACT
TGAAGCTTTTGGAATTGATTTCAATTCTTTAACTAAAGGTATGGGAATTGCAGGCGACATAACAAAAGCTGCATGGTCTA
AGATTAAGAAAAGTGCTACTGATTGGATAAAAGAAAATTTAGAAGCTATGGGCGGTGGCGATTTAGTCGGCGGAATATTA
GACCCTGACAAAATTAATTATCATTATGGACGTACCGCAGCTTATACTGCTGCAACTGGAAGACCATTTCATGAAGGTGT
CGATTTTCCATTTGTATATCAAGAAGTTAGAACGCCGATGGGTGGCAGACTTACAAGAATGCCATTTATGTCTGGTGGTT
ATGGTAATTATGTAAAAATTACTAGTGGAGTTATCGATATGCTATTTGCGCATTTGAAAAACTTTAGCAAATCACCACCT
AGTGGCACGATGGTAAAGCCCGGCGATGTTGTTGGTTTAACTGGTAATACCGGATTTAGTACAGGACCACACTTACATTT
TGAAATGAGAAGAAATGGACGTCACTTTGACCCTGAACCATATTTAAGAAATGCAAAGAAAAAAGGTAGGTTATCAATTG
GTGGCGGTGGTGCTACTTCTGGAAGTGGTGCAACTTATGCAAGCCGAGTAATCCGTCAAGCGCAAAGTATTTTAGGAGGA
CGTTATAAAGGTAAGTGGATTCATGACCAGATGATGCGAGTTGCAAAGCGTGAAAGTAACTATCAATCAAATGCAGTGAA
TAATTGGGATATTAATGCTCAAAGAGGAGACCCATCAAGAGGATTATTCCAAATCATCGGCTCAACTTTTAGAGCAAACG
CTAAACGTGGATATACTAACTTTAATAATCCGGTTCATCAAGGTATTTCAGCAATGCAGTACATTGTTAGACGCTACGGT
TGGGATGGATTTAAGCGTGCTGGTGATTACGCATATGCTACAGGTGGAAAAGTTTTTGATGGTTGGTATAACTTAGGTGA
AGACGGTCATCCAGAATGGATTATTCCAACAGATCCAGCTCGTAGAAATGATGCAATGAAGATGTTGCATTATGCAGCAG
CAGAAGTAAGAGGGAGAAAAGCGAGTAAAAATAAGCGTCCTAGTCAATTGTCTAGTGTAAATGGGTTTGATGACCCAAGC
TTATTATTGAAAATGATTGAACAACAGCAACAACAAATAGCTTTATTACTGAAAATAGCGCAATCCAACGATGTGATTGC
AGATAAAGATTATCAGCCGATTATTGACGAATACGCTTTTGATAAAAAGGTGAACGCGTCTATAGAAAAGCGAGAAAGGC
AAGAATCAACAAAAGTAAAGTTTAGAAAAGGAGGAATTGCTATTCAATGA

Protein sequence :
MGERIKGLSIGLDLDAANLNRSFAEIKRNFKTLNSDLKLTGNNFKYTEKSTDSYKQRIKELDGTITGYKKNVDDLAKQYD
KVSQEQGENSAGAQKLRQEYNKQANELNYLERELQKTSAEFEEFKKAQVEAQRMAESGWGKTSKVFESMGPKLTKMGDGL
KSIGKGMMIGVTAPVLGIAAASGKAFAEVDKGLDTVTQATGATGSELKKLQNSFKDVYGNFPADAETVGGVLGEVNTRLG
FTGKELENATESFLKFSHITGSDGVQAVQLITRAMGDAGIEASEYQSVLDMVAKAAQASGISVDTLADSITKYGAPMRAM
GFEMKESIALFSQWEKSGVNTEIAFSGLKKAISNWGKAGKNPREEFKKTLAEIEKTPDIASATILAIEAFGAKAGPDLAD
AIKGGRFSYQEFLKTIEDSQGTVNQTFKDSESGSERFKVAMNKLKLVGADVWASIESAFAPVMEELIKKLSVAVDWFSNL
SDGSKRSIVIFGGIAAAIGPVVFGLGAFISTIGNAVTVLAPLLAGIAKADGLISFLSTKVPILGTVFTALTGPIGIVLGV
LAGLAVAFTIAYKKSETFRNFVNDAIESVKQTFSNFIQFIQPFIDSVKNVFKQAVSAIVDFAKDIWSQINGFFNENGISI
VQALQNICNFIKVIFEFILNFVIKPIMFAIWQVMQFIWPAVKALIVSTWENIKGVIQGTLNIILGLIKFFSSLFTGDWRG
VWDAIIMILKGVVQLIWNLIQLWFVGKILGVVRYFGGLLKGLITGIWDVIKSIFSKSLSAIWNATKSIFGFLFNSVKSIF
TNMKNWLSNTWSSIRTNTIGKAQSLFSGVKSKFTSLWNATKDIFSNLRNWMANIWNSIKDNTVGIASRLWSKVRGIFTNM
RDGLQSIISKIKSHIGGMVDAIKKGLNKLIEGLNWVGGKLGMDKIPKLHTGTEHTHTTTRLVKNGKIARDTFATVGDKGR
GNGPNGFRNEIIEFPNGKRVITPNTDTTAYLPKGSKVYNGTQTYSMLNGTLPRFSLGTMWKDIKSGASSAFNWTKDQIGK
GTKWLGDKVGDVLDFMENPGKLLNYILEAFGIDFNSLTKGMGIAGDITKAAWSKIKKSATDWIKENLEAMGGGDLVGGIL
DPDKINYHYGRTAAYTAATGRPFHEGVDFPFVYQEVRTPMGGRLTRMPFMSGGYGNYVKITSGVIDMLFAHLKNFSKSPP
SGTMVKPGDVVGLTGNTGFSTGPHLHFEMRRNGRHFDPEPYLRNAKKKGRLSIGGGGATSGSGATYASRVIRQAQSILGG
RYKGKWIHDQMMRVAKRESNYQSNAVNNWDINAQRGDPSRGLFQIIGSTFRANAKRGYTNFNNPVHQGISAMQYIVRRYG
WDGFKRAGDYAYATGGKVFDGWYNLGEDGHPEWIIPTDPARRNDAMKMLHYAAAEVRGRKASKNKRPSQLSSVNGFDDPS
LLLKMIEQQQQQIALLLKIAQSNDVIADKDYQPIIDEYAFDKKVNASIEKRERQESTKVKFRKGGIAIQ

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
SAUSA300_1930 YP_494581.1 phi77 ORF001-like protein, phage tail tape measure protein Not tested ¥ÕSa3 Protein 0.0 100
SAUSA300_1930 YP_494581.1 phi77 ORF001-like protein, phage tail tape measure protein Not tested ¥ÕSa3 Protein 0.0 100
SAKOR_01932 YP_008492120.1 hypothetical protein Not tested ¥ÕSa3 Protein 0.0 98
SAV1955 NP_372479.1 phi PVL ORF 15 and 16-like protein Not tested ¥ÕSa3 Protein 0.0 98
SA1766 NP_375064.1 hypothetical protein Not tested ¥ÕSa3 Protein 0.0 96
MW1895 NP_646712.1 hypothetical protein Not tested ¥ÕSa3 Protein 0.0 52