Gene Information

Name : SAR2050 (SAR2050)
Accession : YP_041421.1
Strain : Staphylococcus aureus MRSA252
Genome accession: NC_002952
Putative virulence/resistance : Unknown
Product : hypothetical protein
Function : -
COG functional category : S : Function unknown
COG ID : COG5412
EC number : -
Position : 2137898 - 2142427 bp
Length : 4530 bp
Strand : -
Note : No significant database matches to the full length CDS. N-terminal region is similar to similar to bacteriophage phi PVL hypothetical protein Orf 15 TR:O80054 (EMBL:AB009866) (694 aa) fasta scores: E(): 5.7e-22, 28.4% id in 704 aa. Internal region is simi

DNA sequence :
ATGGGAGAAAGAATAAAAGGTTTATCTATAGGTTTGGATTTAGATGCAGCAAATTTAAATAGATCATTTGCAGAAATCAA
ACGAAACTTTAAAACTTTAAATTCTGACTTAAAATTAACCGGTAACAACTTCAAATATACCGAAAAATCAACTCATAGTT
ACAAACAAAGGATTAAAGAACTTGATGGAACTATCACAGGTTATAAGAAAAACGTTGATGATTTAGCCAAGCAATATGGC
AAGGTATCTCAAGAACAGGGCGAAAACAGCGCGGAAGCTCAAAAATTACGACAAGAATATAACAAACAAGCAAATGAGCT
GAATTTTTTAGAAAAAGAACTAGAAAAAACAACAACTGAGTTTGAAGAGTTCAAAAAAGCTCAAGTTGAAGCTCAAAGAA
TGGCAGAAAGTGGCTGGGGAAAAACCAGTAAAGTTTTTGAAAGTATGGGACCTAAATTAACAAAAATGGGTGATGGTTTA
AAATCCATTGGTAAAGGTTTGATGATTGGTGTAACTGCACCTGTTTTAGGTATTGCAGCAGCATCAGGAAAAGCTTTTGC
AGAAGTTGATAAAGGTTTAGATACAGTTACCCAAGCAACAGGAGCAACCGGCGGAGAGCTTAAGAAGTTGCAGAATTCAT
TTAAAGATGTTTATGGCAACTTTCCAGCAGACGCTGAGACTGTAGGCGGTGTTTTAGGGGAAGTTAACACAAGGTTAGGT
TTCACTGGCAAAGAACTTGAGAGTGCCACAGAGTCATTCTTGAAATTTAGTCACATAACAGGTTCTGACGGCGTACAAGC
CGTTCAATTAATTACGCGTGCAATGGGTGATGCAGGTATTGAAGCTGATGAGTATCAAAGTGTACTTGATATGGTAGCGA
AAGCAGCACAGGCTAGCGGTATAAGTGTTGATACATTAGCTGATAGCATTACTAAATACGGTGCTCCAATGAGGGCTATG
GGCTTTGAGATGAAAGAATCAATCGCTTTATTCTCTCAATGGGAGAAATCAGGTGTTAATACTGAAATAGCCTTCAGTGG
TTTGAAAAAAGCTATATCCAATTGGGGTAAAGCGGGTAAAGACCCAAGAGAAGAATTTAAGAAGACATTAGCAGAAATTG
AAAGGACACCGGATATAGCTAGCGCAACAAGTTTAGCGATTGAAGCATTTGGTGCAAAAGCAGGTCCTGATTTAGCAGAT
GCTATTAAAGGCGGTCGCTTTAGTTACCAAGAGTTCTTAAAAACTATCGAAGATTCGCAAGGAACGGTCAATCAGACATT
TAAAGATTCTGAAAGTGGCTCCGAAAGATTTAAAGTAGCAATGAATAAACTTAAATTAGTAGGTGCTGATGTATGGGCTT
CTATTGAAAGTGCGTTTGCTCCAGTCATGGAAGAATTAATCAAAAAGCTATCTGTAGCAGTTGATTGGTTTTCAAGTTTA
AGTGATGGATCTAAAAGGTCGATTGTTATATTCGGTGGTATTGCTGCTGCAATTGGTCCTGTAGTTTTTGGATTAGGTGC
ATTCATAAGCACAATTGGCAACGCAGTAACTGTATTAGCTCCATTATTAGCTAGTATTGTAAAGGCTGGCGGATTGATTA
GTTTTTTATCAACTAAAGTGCCTATTTTAGGAACAGTCTTCACAGCATTAACTGGTCCAATTGGTATCGTGTTAGGTGTA
CTGGCTGGTTTAGCAGTCGCATTTACAATAGCTTATAAGAAATCTGAAACATTCAGAAATTTTGTTAATGGTGCAATTAA
CAGTGTTAAACAAACGTTTAGTAATTTCATTCAATTTATCCAACCTTTCATTGATTCCGTTAAAAACGTCTTTAAACAAG
CGGTTTCAGCAATCGTTGATTTCGCTAAAGATATTTGGAGTCAAATTAATGGATTCTTTAATGAAAACGGAATTTCTATT
GTTCAAGCGCTTCAAAATATATGCAATTTTATCAAAGCTATATTTGAATTTATCTTAAATTTTGTAATTAAACCAATCAT
GTTTGCGATTTGGCAAGTGATGCAATTTATTTGGCCGGCGGTTAAAGCCTTGATTGTCAGTACTTGGGAGAATATAAAAG
GAGTAATACAAGGTGCTTTAAATATCATACTTGGCTTTATTAAGTTCTTTTCAAGTTTATTCACTGGTAATTGGCGAGGT
GTTTGGGACGGTATTGTGATGATACTAAAAGGCACTGTGCAGTTAATTTGGAATTTAATACAACTGTGGTTTGTAGGTAA
GATTCTAGGTGTTGTTAGATACTTTGGTGGATTGCTTAAAGGTTTAATATCCGGTATCTGGGGTGTTATCAAAGGTATTT
TCACAAAATCATTATCTGCAATTTGGAATGCAACGAAAAGTATTTTTGGTTTCTTATACAATAGTGTTAAATCTATTTTC
ACTAATATGAAAAACTGGTTATCTAGTACGTGGAATAATATCAAAAGCAATACCGTCGGCAAGGCTCATTCGTTATTTAC
GGGTGTAAGGTCTAAATTCACAAGTTTATGGAATGCGACGAAAGATATATTTACTAAATTAAGAAATTGGATGTCAAACA
TCTGGAACTCTATTAAAGATAACACGGTAGGTATAGCGGGTCGCTTATGGGATAGAGTGCGTAACATCTTTGGAAGCATG
CGTGACGGTTTAAAATCTATCATTAGTAAAATTAAAGATCATATCGGTGGTATGGTAGACGCTGTTAAAAGAGGTCTTAA
TAAATTAATTGAAGGTTTAAACTGGGTCGGTGGTAAGTTGGGTATGGACAAAATACCGAAGTTACACACTGGTACTGAAC
ATACACATACTACTACAAGATTAGTTAAGAACGGTAAGATTGCACGTGACACATTCGCTACAGTTGGGGATAAGGGAAGC
GGAAATGGTCCAAATGGTTTCAGAAATGAAATGATTGAATTCCCTAATGGTAAACGTGTAATCACACCAAATACAGATAC
TACGGCTTATTTACCTAAAGGCTCAAAAGTATACAACGGGGCACAAACTTATTCAATGTTAAACGGAACGCTTCCGAGAT
TTAGTTTAGGTACTATGTGGAAAGATATTAAATCTGGTGCATCATCGGCATTTAACTGGACAAAAGATAAAATAGGTAAA
GGTACCAAATGGCTTGGCGATAAAGTTGGCGATGTTTTAGATTTTATGGAAAATCCAGGCAAACTTTTAAATTATATACT
TGAAGCTTTTGGAATTGATTTCAATTCTTTAACTAAAGGTATGGGAATTGCAGGCGACATAACAAAAGCTGCATGGTCTA
AGATTAAGAAAAGTGCTACTGATTGGATAAAAGAAAATTTAGAAGCTATGGGCGGTGGCGATTTAGTCGGTGGAATATTA
GACCCTGACAAAATTAATTATCATTATGGACGTACCGCAGCTTATACCGCTGCAACCGGAAGACCATTTCATGAAGGTGT
CGATTTTCCATTTGTATATCAAGAAGTTAGAACGCCGATGGGTGGCAGACTTACAAGAATGCCATTTATGTCTGGTGGTT
ATGGTAATTATGTAAAAATTACTAGTGGCGTTATCGATATGCTATTTGCGCATTTGAAAAACTTTAGCAAATCACCACCT
AGTGGCACGATGGTAAAGCCCGGTGATGTTGTTGGTTTAACTGGTAATACCGGATTTAGTACAGGACCACATTTACATTT
TGAAATGAGGAGAAATGGAAGACATTTTGACCCTGAACCATATTTAAGGAATGCTAAGAAAAAAGGTAGGTTATCAATTG
GTGGCGGTGGCGCTACTTCTGGAAGTGGTGCAACTTATGCCAGCCGAGTAATCCGACAAGCACAAAGTATTTTAGGAGGA
CGTTATAAAGGTAAGTGGATTCATGACCAGATGATGCGAGTTGCAAAGCGCGAAAGTAACTATCAATCAAATGCAGTGAA
TAATTGGGACATTAATGCTCAAAGAGGAGACCCGTCTAGAGGATTATTCCAAATTATCGGCTCAACTTTTAGAGCTAACG
CTAAACGAGGGTACACTAATTATAATAATCCAGTACATCAAGGTATCTCAGCAATGCAGTACATTGTTAGACGATATGGT
TGGGGTGGTTTTAAACGTGCTGGTGATTACGCATATGCTACAGGTGGAAAAGTTTTTGATGGTTGGTATAACTTAGGTGA
AGACGGTCATCCAGAATGGATTATTCCAACAGATCCAGCTCGTAGAAATGATGCAATGAAGATTTTGCATTATGCAGCAG
CAGAAGTAAGAGGGAAAAAAGCGAGTAAAAATAAGCGTCCTAGCCAATTATCAGACTTAAACGGGTTTGATGATCCTAGC
TTATTATTGAAAATGATTGAACAACAGCAACAACAAATAGCTTTATTACTGAAAATAGCACAATCTAACGATGTGATTGC
AGATAAAGATTATCAGCCGATTATTGACGAATACGCTTTTGATAAAAAGGTGAACGCGTCTATAGAAAAGCGAGAAAGGC
AAGAATCAACAAAAGTAAAGTTTAGAAAAGGAGGAATTGCTATTCAATGA

Protein sequence :
MGERIKGLSIGLDLDAANLNRSFAEIKRNFKTLNSDLKLTGNNFKYTEKSTHSYKQRIKELDGTITGYKKNVDDLAKQYG
KVSQEQGENSAEAQKLRQEYNKQANELNFLEKELEKTTTEFEEFKKAQVEAQRMAESGWGKTSKVFESMGPKLTKMGDGL
KSIGKGLMIGVTAPVLGIAAASGKAFAEVDKGLDTVTQATGATGGELKKLQNSFKDVYGNFPADAETVGGVLGEVNTRLG
FTGKELESATESFLKFSHITGSDGVQAVQLITRAMGDAGIEADEYQSVLDMVAKAAQASGISVDTLADSITKYGAPMRAM
GFEMKESIALFSQWEKSGVNTEIAFSGLKKAISNWGKAGKDPREEFKKTLAEIERTPDIASATSLAIEAFGAKAGPDLAD
AIKGGRFSYQEFLKTIEDSQGTVNQTFKDSESGSERFKVAMNKLKLVGADVWASIESAFAPVMEELIKKLSVAVDWFSSL
SDGSKRSIVIFGGIAAAIGPVVFGLGAFISTIGNAVTVLAPLLASIVKAGGLISFLSTKVPILGTVFTALTGPIGIVLGV
LAGLAVAFTIAYKKSETFRNFVNGAINSVKQTFSNFIQFIQPFIDSVKNVFKQAVSAIVDFAKDIWSQINGFFNENGISI
VQALQNICNFIKAIFEFILNFVIKPIMFAIWQVMQFIWPAVKALIVSTWENIKGVIQGALNIILGFIKFFSSLFTGNWRG
VWDGIVMILKGTVQLIWNLIQLWFVGKILGVVRYFGGLLKGLISGIWGVIKGIFTKSLSAIWNATKSIFGFLYNSVKSIF
TNMKNWLSSTWNNIKSNTVGKAHSLFTGVRSKFTSLWNATKDIFTKLRNWMSNIWNSIKDNTVGIAGRLWDRVRNIFGSM
RDGLKSIISKIKDHIGGMVDAVKRGLNKLIEGLNWVGGKLGMDKIPKLHTGTEHTHTTTRLVKNGKIARDTFATVGDKGS
GNGPNGFRNEMIEFPNGKRVITPNTDTTAYLPKGSKVYNGAQTYSMLNGTLPRFSLGTMWKDIKSGASSAFNWTKDKIGK
GTKWLGDKVGDVLDFMENPGKLLNYILEAFGIDFNSLTKGMGIAGDITKAAWSKIKKSATDWIKENLEAMGGGDLVGGIL
DPDKINYHYGRTAAYTAATGRPFHEGVDFPFVYQEVRTPMGGRLTRMPFMSGGYGNYVKITSGVIDMLFAHLKNFSKSPP
SGTMVKPGDVVGLTGNTGFSTGPHLHFEMRRNGRHFDPEPYLRNAKKKGRLSIGGGGATSGSGATYASRVIRQAQSILGG
RYKGKWIHDQMMRVAKRESNYQSNAVNNWDINAQRGDPSRGLFQIIGSTFRANAKRGYTNYNNPVHQGISAMQYIVRRYG
WGGFKRAGDYAYATGGKVFDGWYNLGEDGHPEWIIPTDPARRNDAMKILHYAAAEVRGKKASKNKRPSQLSDLNGFDDPS
LLLKMIEQQQQQIALLLKIAQSNDVIADKDYQPIIDEYAFDKKVNASIEKRERQESTKVKFRKGGIAIQ

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
SA1766 NP_375064.1 hypothetical protein Not tested ¥ÕSa3 Protein 0.0 98
SAKOR_01932 YP_008492120.1 hypothetical protein Not tested ¥ÕSa3 Protein 0.0 97
SAUSA300_1930 YP_494581.1 phi77 ORF001-like protein, phage tail tape measure protein Not tested ¥ÕSa3 Protein 0.0 96
SAV1955 NP_372479.1 phi PVL ORF 15 and 16-like protein Not tested ¥ÕSa3 Protein 0.0 96
SAUSA300_1930 YP_494581.1 phi77 ORF001-like protein, phage tail tape measure protein Not tested ¥ÕSa3 Protein 0.0 96
MW1895 NP_646712.1 hypothetical protein Not tested ¥ÕSa3 Protein 0.0 54