Gene Information

Name : STH8232_0674 (STH8232_0674)
Accession : YP_006040352.1
Strain : Streptococcus thermophilus JIM 8232
Genome accession: NC_017581
Putative virulence/resistance : Virulence
Product : surface antigen I/II superfamily protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 542010 - 546905 bp
Length : 4896 bp
Strand : +
Note : -

DNA sequence :

ATGACCAAAACATGTAATCATCACTTTCTTGTCAATCAGGAAAAAGGCGAGAAACACGTCTTTCGCAAGAGTAAAAAATA
TCGCACTCTATGTTCCGTTGCCCTTGGAACCATGGTGACGGCTGTTGTTGCTTGGGGAGGAACGGTTGCACATGCTGATG
AAGTTACAACATCAGTTGACACCACTATTCAACGAACGGAAAATCCAGCCACGAATTTACCAGAAGCACAGCCAAACCCT
GTATCTGAACAAACTGAAAGTTTAGCGTTAACTGGACAATCTAACGGTGCAATTGCAGTCACCGTACCACATGATACGGT
AACACAAGCAGTTGAAGAGGCAAAGGCTGAAGGTGTTTCTACGGTTGAAGATAGCCCAATGGATTTAGGAAATACAACTT
CTGCGGCAGAAACCAACCAACAAATTTTAAAAGCAGAAGCAGATGTCCAAAAACAGGTTGAGGCTATTAATGAAGTTACT
GAAACCTACAAAGCTGACAAAGCAGCTTATGTGGATGAAAAAGCTCGCATCGAACAGGAAAATAAGGAGCTGTCACAGGC
CTACGAAGGGGCCAACCAAACTGGTAAAGAGACAAATGCTTGGGTTGATTCTAAAATCAATGACCTAAAAACTCGGTATG
CAGATGCTGATGTGACAGTGAAAGAACAAGTAGTTTCATCAGGAAATGGGACATCTGTACTTGACTATACAAACTATGGC
AAGGCTGTTGAAACCATTCAAACAACAAACGAACAAGCTGTAGCGGATTATCTAACAAAGAAAACCAAGGCAGATGATAT
TGTTGCAAAAAATCAGGCCATTCAAAAAGAAAATGAAGCTGGACTTGCTAAGGCAAAGGCAGATAATGAAGCTATTGAAA
GGCGTAATCAGGCTGGTCAAGCAGCTGTTGATGCTGAAAACCGTGCAGGTCAAGCCGCAGTAGATCAAGCTAATCAGGAG
AAACAACAATTAGTTTCAGATCGAGCAGCTGAGATTGAAGCCATTACAAAACGCAATCAAGATAAAGAAGCCGCAGCCAG
AAAAGAGAATGAAGCGATTGATGCCTATAATGCCAAAGAAATGGAACGCTATCAACGTGACTTGGCCGAGATTTCGAAAG
GTGAAGAAGGTTATATTTCTGAAGCCCTTGCTCAAGCCCTCAATCTCAATAACGGTGAGCCACAAGCACAACATGGAGCC
ATTACCCGAAATCCTAATCAAATCATTTCAACTGGCGATGCCATGCTGGGTGGCTACTCAAGAATATTGGATTCAACAGG
ATACTTTGTCTATGATAGCTTCAAAACAGGTGAGACCCTTAGTTTTAACTATCAAAATCTTCAAAATGCACGATTTGATG
GTAAAAAGATTAGTCGAGTGACTTACGATATTACCAACCTTGTATCACCTGCTGGAACCGATGCCGTGAAATTGGTTGTG
CCAAATGATCCTACCGAAGGCTTCATTGCCTACCGAAATGACGGAAACGGTGATTGGCGAACAGACAAGATGGAGTTTCG
TGTAGTTGCCAAGTATTTCTTGGAAGACGGTTCACAAGTTACCTTCTCCAAAGAAAAGCCAGGTGTCTTCACGCATTCTT
CCCTCAATCATAATGACATTGGTCTAGAATATGTTAAAGATTCGTCTGGGAAATTTGTGCCGATTAATGGTTCAACCGTT
CAAGTGACTAATGAAGGTCTAGCACGTTCTTTGGGTTCCAACCGTGCAAGTGATTTGAATTTGCCTGAGGAATGGGATAC
CACATCAAGTCGTTATGCTTATAAAGGAGCTATTGTCTCAACGGTCACATCAGGCAATACCTATACGGTCACCTTTGGGC
AAGGCGATATGCCACAGAATGTTGGCTTGTCATACTGGTTCGCCTTAAATACCCTACCAGTTGCACGTACAGTAACACCG
TATAGTCCCAAACCTCATGTAACGGTGGAACTTGAACCCATTCCAGAACCTATTACGGTAACACCAGATGTCTTTACTCC
TAAAACATTTACACCAGAAAAGCCTGTAACCTTTACGCCAAAGCCTTTGGAAGAAGTGGTGCAGCCTAGTCTAACTTTGA
CCAAGGTAACCTTACCTGTCAAACCTATTCCAAAAGAACTTCCAACGCCACCACAAGTACCCACTGTCCATTATCATGCG
TACCGTTTGACGACAACTCCAGAGATTATGAAAGAAGTGGTCAATAGTGACCAAGCTAATCTTCATGAGAAAACTGTCGC
AAAAGATTCAACGGTGATTTATCCCCTAACAGTTGATGCCTTATCGCCCAATCGTGCTCAAACGACTAATCTCATTTTTG
AAGACTATTTGCCTGCAGGTTATTTGTTTGATAAGGAAACAACACAAAAAGAGAATGGAAACTATGTCCTTAGCTTTGAT
GAGACTAAGAATTTTGTGACCTTAACCGCAAAGGAAAACTTGTTGCAGGAGGTAAATAAAGATTTAACCAAGGTTTATCA
ACTGACCGCTCCAAAACTCTATGGTTCTGTTCAAAATGATGGGGCAACCTATTCCAATAGTTACAAACTCCTTTTGAACA
AGGGCACAACCAATGCTTACACAGTCACTTCAAATGTTGTAACGGTTCGTACACCAGGTGATGGGGAGACAACCACACTC
ATTACACCAGATAAAAACAATGAAAATGCGGATGGTATCCTCATTAATGACACGGTCGTAGCCCTTGGCACAACCAACCA
CTACCGATTGATTTGGGATTTGGACCAGTATAAGGGGGATCGTTCTGCTAAAGAGACAATTGCACGTGGCTTCTTCTTTG
TGGACGATTACCCAGAGGAAGTGCTCGATGTGGTGGAAAATGGCACGGCTGTTACAACCCTTGACGGTCAGAAGGTATCA
GGAATAACGGTTAAAAACTATGCTTCACTAAATGAAGCTCCTAAAGACCTTCAATATAAATTAGCTCATGCTAAGATTAC
ACCGACAGGTGCCTTTCAAGTCTTTTTGCCGGATGACAACCAAGCCTTTTATGACCAGTATGTTCAAACAGGAACTTCTT
TAGCTCTTTTGACCAAAATGACGGTTAAAAATAGTCTCTATGGTCAAACTAAGACCTATACAAACAAGGCCTACCAAGTG
GATTTCGGCAATGGCTATGAGACCAAAGAAGTGACCAACACCCTTGTTTCTCCAGAACCCAAGAAACAAAACCTAAACAA
GGATAAAGTGGATATCAATGGGAAGCCCATGCTAGTGGGAACTCAAAATCACTATACTCTCTCATGGGACTTGGACCAAT
ACCGAGGGATTAAAGCAGACAACTCTCAGATTGCACAAGGTTTTTACTTTGTGGATGATTATCCAGAAGAAGCTTTATTG
CCGGATGAAGCAGCTATTCAGTTTATCACATCTGATGGCAAAACAGTTTCAGGAATCACCGTAAAGGCTTATTCTCAATT
ATCAGAAGCTCCTAAAACGCTACAAGCAGCCCTTTCGAAACAAAAAATTCAGCCTAAAGGAGCTTTTCAAGTTTTCATGC
CTGAAGACCCACAAGACTTTTATGAATCTTATGTGACCAAGGGGGAGAATATTACTATTGTCACTCCGATGACGATTTTG
GAAACCATGATTAATTCAGGGAAGTCTTATGAAAACGTGGCTTATCAGGTGGACTTTGGGCAAGCCTATGAAACCAACAC
GGTGACCAATTTTGTCCCTAAAGTAACTCCACATAAGTCTAATACCAATCAAGAAGGTATTTCAATTGATGGAAAGACTG
TTTTTCCGAATACGGTCAATTATTACAAAATTGTCTTGGATTACAGTCAATATAAGGAAATGGTCGTGACGGATGATGTT
CTTGCCAAGGGATTTTACATGGTAGACGATTACCCAGAAGAAGCCCTTACCCTAAATCCTGATGGCATTCAAGTTTTGGA
TAAGGATGGCAATCGTGTATCTGGTATCTCTGTCAGCACCTACGCTAGTTTGTCAGAAGCTCCGAAAGTCGTCCAAGATG
CCATGGCTAAACGTCAGTTTACACCTAAAGGAGCCATTCAGGTCCTTAGTAGCGATGATCCCAAAAACTTTTACGAGACT
TATGTGAAGACTGGTCAAACCTTAGTTGTCACGCTTCCGATGACTGTTAAAAATGAGTTGACCAAAACAGGTGGTCAGTA
TGAAAATACAGCCTATCAGATTGATTTTGGCTTGGCCTATGTCACGGAAACAGTGGTCAATAATGTTCCCAAACTAGACC
CACAAAAAGATGTGGTGATTGACTTGTCTCATAAAGATGAGAGCCTTGACGGGAAAGAAGTGGCCTTGCATCAAACCTTT
AACTATCGCTTGGTTGGAGCATTGATTCCAAGCAATCGTGCGACTGATTTATTTGAATATGGTTTTGAAGATAACTATGA
TGAAAAGCATGATGAGTATAATGGTGTTTATCGCAGCTATCTGATGACGGATGTCATCCTCAAAGACGGTTCTGTCTTAA
AAGAGGGGACAGAAGTCACGAAATATACCTTGCAACAAGTGGATACAGAAAATGGCCTAGTGTCAATTTCATTTGATAAA
TCCTTCTTAGAGATTATCTCCGATGATTCAGCCTTTCAGGCAGATGTTTACCTTCAAATGAAACGGATTGCGACTGGTCA
GGTGGAGAATACCTACCTTCATACAGTGAATGGCTATGTCATTAGCTCAAATACAGTTGTAACACATACACCTCAACCTG
AAGAACCAAGTCCAAATAAACCCACACCACCTCAACCACCAATTGAGACTATTGAACCGCCTGTTCCAGCAAGTATTTTG
CCAAATACAGGGGAACAGGAATCCCTTTTGGGCTTGATTGAAGCTGGTATTCTACTTGGTACGGCTTATGGACTGAAGAA
AAAGGAGGAGAAGTAG

Protein sequence :

MTKTCNHHFLVNQEKGEKHVFRKSKKYRTLCSVALGTMVTAVVAWGGTVAHADEVTTSVDTTIQRTENPATNLPEAQPNP
VSEQTESLALTGQSNGAIAVTVPHDTVTQAVEEAKAEGVSTVEDSPMDLGNTTSAAETNQQILKAEADVQKQVEAINEVT
ETYKADKAAYVDEKARIEQENKELSQAYEGANQTGKETNAWVDSKINDLKTRYADADVTVKEQVVSSGNGTSVLDYTNYG
KAVETIQTTNEQAVADYLTKKTKADDIVAKNQAIQKENEAGLAKAKADNEAIERRNQAGQAAVDAENRAGQAAVDQANQE
KQQLVSDRAAEIEAITKRNQDKEAAARKENEAIDAYNAKEMERYQRDLAEISKGEEGYISEALAQALNLNNGEPQAQHGA
ITRNPNQIISTGDAMLGGYSRILDSTGYFVYDSFKTGETLSFNYQNLQNARFDGKKISRVTYDITNLVSPAGTDAVKLVV
PNDPTEGFIAYRNDGNGDWRTDKMEFRVVAKYFLEDGSQVTFSKEKPGVFTHSSLNHNDIGLEYVKDSSGKFVPINGSTV
QVTNEGLARSLGSNRASDLNLPEEWDTTSSRYAYKGAIVSTVTSGNTYTVTFGQGDMPQNVGLSYWFALNTLPVARTVTP
YSPKPHVTVELEPIPEPITVTPDVFTPKTFTPEKPVTFTPKPLEEVVQPSLTLTKVTLPVKPIPKELPTPPQVPTVHYHA
YRLTTTPEIMKEVVNSDQANLHEKTVAKDSTVIYPLTVDALSPNRAQTTNLIFEDYLPAGYLFDKETTQKENGNYVLSFD
ETKNFVTLTAKENLLQEVNKDLTKVYQLTAPKLYGSVQNDGATYSNSYKLLLNKGTTNAYTVTSNVVTVRTPGDGETTTL
ITPDKNNENADGILINDTVVALGTTNHYRLIWDLDQYKGDRSAKETIARGFFFVDDYPEEVLDVVENGTAVTTLDGQKVS
GITVKNYASLNEAPKDLQYKLAHAKITPTGAFQVFLPDDNQAFYDQYVQTGTSLALLTKMTVKNSLYGQTKTYTNKAYQV
DFGNGYETKEVTNTLVSPEPKKQNLNKDKVDINGKPMLVGTQNHYTLSWDLDQYRGIKADNSQIAQGFYFVDDYPEEALL
PDEAAIQFITSDGKTVSGITVKAYSQLSEAPKTLQAALSKQKIQPKGAFQVFMPEDPQDFYESYVTKGENITIVTPMTIL
ETMINSGKSYENVAYQVDFGQAYETNTVTNFVPKVTPHKSNTNQEGISIDGKTVFPNTVNYYKIVLDYSQYKEMVVTDDV
LAKGFYMVDDYPEEALTLNPDGIQVLDKDGNRVSGISVSTYASLSEAPKVVQDAMAKRQFTPKGAIQVLSSDDPKNFYET
YVKTGQTLVVTLPMTVKNELTKTGGQYENTAYQIDFGLAYVTETVVNNVPKLDPQKDVVIDLSHKDESLDGKEVALHQTF
NYRLVGALIPSNRATDLFEYGFEDNYDEKHDEYNGVYRSYLMTDVILKDGSVLKEGTEVTKYTLQQVDTENGLVSISFDK
SFLEIISDDSAFQADVYLQMKRIATGQVENTYLHTVNGYVISSNTVVTHTPQPEEPSPNKPTPPQPPIETIEPPVPASIL
PNTGEQESLLGLIEAGILLGTAYGLKKKEEK

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
SSU05_0965	YP_001198331.1	agglutinin receptor	Virulence	89K	Protein	0.0	96
SSU98_0978	YP_001200536.1	agglutinin receptor	Virulence	89K	Protein	0.0	96