Gene Information

Name : t4166 (t4166)
Accession : NP_807770.1
Strain : Salmonella enterica Ty2
Genome accession: NC_004631
Putative virulence/resistance : Unknown
Product : large repetitive protein
Function : -
COG functional category : S : Function unknown
COG ID : COG1340
EC number : -
Position : 4312248 - 4322099 bp
Length : 9852 bp
Strand : +
Note : corresponds to STY4458 from Accession AL513382: Salmonella typhi CT18

DNA sequence :

ATGGGAAATAAAAGCATACAAAAGTTTTTTGCCGATCAAAATTCTGTAATTGATTTATCTTCTTTGGGTAATGCCAAAGG
CGCAAAAGTTTCTCTTTCCGGGCCAGACATGAACATTACCACGCCGCATGGGTCAGTGATCATTGTCAATGGCGCTCTTT
ATTCAAGTATCAAAGGCAATAACCTCGCTGTTAAATTTAAAGATAAGACTATTACCGGCGCTAAAATTCTGGGCAGCGTA
GATTTAAAAGATATTCAACTGGAGAGAATTGACAGCTCATTAGTTGATTCTGCTCAGGTAGAAAAGAAAGGTAATGGCAA
ACGACGAAATAAGAAGGAAGAAGAGGAATTAAAAAAGCAGCTTGACGAGGCTGAAAACGCAAAGAAAGAAGCTGATAAGG
CGAAGGAAGAAGCAGAGAAAGCTAAGGAGGCAGCAGAAAAAACGCTCAATGAAGCGTTTGAAGTACAGAACTCGTCAAAG
CAAATTGAAGAAATGCTGCAGAACTTTTTGGCTGACAATGTAGCAAAAGACAATCTGGCTCAGCAAAGCGATGCTTCCCA
GCAAAATACACAGGCTAAAGCAACGCAGGCTTCTAAACAGAACGATGCTGAAAAAGTTCTTCCTCAACCTATTAATAAAA
ATACCAGTACTGGCAAAAGTAATAGCAGTAAAAATGAGGAAAATAAGCTCGATGCCGAGTCTGTTAAAGAGCCGCTTAAA
GTCACATTAGCGCTTGCGGCCGAGAGTAACAGCGGTAGCAAAGATGATAGTATAACTAATTTTACCAAACCTCAGTTTGT
AGGTAGCACTGCTCCCAATGCCACGGTTATTATTAAAATTAATGGTATTGCTGTCGGTCAGGCTGTAGCGGATAGTTTGG
GTAACTTCACCTTCACAGCGCCTGAAACATTGACTGATGGAACATACAATCTGGAGGCAGAGGCCAAGACTGCTGATGGA
AGCGGTAGCGCCAAACTTGTCATTACTATCGATTCCGTTACCGATAAGCCAACATTTGAACTTTCGCCTGAAAGTAGTGT
GTCCGGTCATAAGGGCTTAACGCCGACCTTGACGCCTTCAATTGTTGGTACGGCGGAAGAGAATGCTAAGGTTGACATTT
ATGTAGATAATAAACTGGTTGCCAGCGTTGATGTCGATAAAGATGGAAACTGGAGTTATGAATTTAAAGATAATGAATTA
TCTGAGGGCGAAAATAGTATAAAAGTCGTTGCCGTGGATAAAGCAGGTAATAAAAACGAAACGACGGATAGTATCATAAC
CGACACCATTCCTCCGGAAAAGCCGACGATTGAGCTGGATGATAGTAGTGATTCCGGCATTAAAAATGACAACATTACAA
ATAGCACTCTGCCAACATTTATTGGTGTGGCGGAACCTGGTTCTACAGTCTCTATTTATCTTGGGCTTAAACATCTTGGT
GAGGTCATTGTTGCTAAAGATGGGACATGGAGCTATACGCTTACTACGCCGCTCAAGGATGGCGAATACAATATAACAGC
AACCGCTACTGATATTGCCGGGCATACCTCTGCGACGGCAAATCTGCCTTTTACTATTGATACCCGTATCAGCTATTTCA
GCGCTGAGATTGAAACGACTGATGATAGCGGTATTGTTGGAGATAACGTTACTAACAATACTCGCCCAACCTTTACAGGT
AAAACTGAGCCAAATGCTATTATCAGTGTCATAAATAGTGAGACTGGCGAAGAGGTTATTTTTAAAGCGAATGACAAGGG
CGAATGGACGTTCAATTTCACTTCAGACTCAGTGGAAGGGGTTAACAATCTTACGTTCACTGTTGAAGATGTCGCTGGCA
ACAAAAAGGATTTTTCCTTTAGTTACGTTATCGATACTGTTGCCCCTGTACCTCCGACGGTTTCTTTGGAGGATTTTGTT
GTTTTACCGAATGGTATAATTTTATCAGGGAATGATTTACCGGCTTTAGTCGGTACGGCAGAGCCAAAGTCTACCATCTT
ATTGATGCGAGATGGTAAATTATATGACAGCATTGAGGTTGACTCAAACGGGACCTGGAATTATCAGTTTAGTAATAAAT
TTCTTCAGGGCGCCTATGATATTGAAATCATTTCTCAGGATGCCGCCGGTAATAAATCCTCTACTGTTAAATATTCTTTT
ACTATTCAAACTGAAGTTGTACCTCCAAAAGCGGAACTCGATGCCAGTGATGATTCCGGTGCAAAAGGCGACTGGATTAC
CAATAAACATAATGCTCTGACATTACTGGGAACAGCGGATAGGTTTGCTACCATAAATATCCTTATCGATGGTAAAACGA
TAGGCGTGACGACTGCGGATGCAGACGGTAACTGGAATTTTGATATTTCCCGAAATCTGTCTGACAATGTTTATAAGATT
ACGGTTGAATCTATCGATCCTTTAGGAAGAACGTCATCTGTAGATTATCAGCTTACCATTGATAGCTTTACGCCGATCCC
TACTGTTATGTTGCATGATAGCGCTGGCTCTGGCGTTAAAGGCGATATGATTACTAAAATTAATACGCCGTTGTTTACCG
GGATGGCTGAAGCTAATGCTAAGGTTTCCATCTATGTTGACGGTGTGTTAAGTGGCGAGGCTATTGCTGGCGATGATGGT
GTATGGAATTTTCAATTTACCACAGCGTTGTCCGATGGCTCGCATGACGTAACGGTAAAGGTAGAAGATATTGCCGGTAA
TACTGCCTCCTCATCAGCGTATAATTTCCAAATCGTAACGCAAACGCAAAAACCAACAATAGAGTTGGTCAACGATACGG
GGGTTGATAATACAGACCATATTATTAATGAAAAGAATCCTGCACTGACAGGGACCGCTGCACCCTATTCAACGGTTAAA
CTCTATGTTGATGGCGCACTAATCGCTGAGGTCAGAACAAATAAAGATAGCAGATGGGAGTATACCCTGAAAGCCGATCA
AGGTTTGGTTGATGGCGATCATAGAATAACCGCTTCAGTTGAAGATATCGCTGGCAACATTGCGCATTCGGATCCTTTCT
TAATTAGCGTTGATACTGCTATTTCAATACCGATAGTTTCATTGAGCCCGGATTCAGATTCGGGAATCGCAGATGATAAT
TTAACGAATATCGTTAACCCTACCTTGCACCTAAAAGATATTGATCCGGACATTATCAGCGTTCAGGTATGGGATGCCGC
GTCTGATACGCAGATCGGTGTTGCCACGCAACAACCTGATGGTTCATGGACCTATACCTTTACTTCAGATTTAACGGAAG
GCTTGCATCAGGTTTATGTCAAGGTTGAGGACATTGCGGGTAATAAAGCGAACAGCGCGGTATTCGATTTTACTATCGAT
ACCACAGTATCAACGCCGGTGATTTCCCTGCTTTCTAAGGATGATACGGGGGTGACAGGCGATAACCTGACCAATATCAA
TAAGCCAGGTTTTGCTATTTCCGGTGTTGATGCCGATGCGCATCGGGTCGTCGTACAGGTGATGCACAATGGCGTGAGCG
AAGAGATCGAACTTTCCCACCTCAATGGTAGTTGGTTATTTACACCAGGGAATACGTGGGCGGATGGCAGCTACACGTTA
ACGGTGAAAGTAGAAGATAAGGCAGGAAATACCAGCTATTCAGCGCCGCTGACGGTCGTTATCGATACCCAAATCGCCAT
TGATGGGGTGGAACTGGTCAACGATAGCGGCGTGAAAGGCGACAATATGACCAACGACGACCGTCCCCACTTTCGTGTGA
CGGTACCTACGGATGTCAATGAAGTCCGTCTGAGCATTGACGGTGGTAATTCGTGGGTTCAGGCAACCCCGGGCGTGGCA
GGAAGCTGGGAGTATATCTGGCCGACAGACCTGGCAGATGGTCAATACACGCTAACGGTGGAAGCGACTGATAAAGCAGG
CAATACAGTGACGAAGACCATCGATTTCGCGGTGGATACCACGCTGTCAGTGCCGGTCATCGTACTGAATAGCGCGGACG
ATACCGGTGTCCAGGGCGATAACATGACGAATCGCACCCAGCCGACATTTGCCCTGCAGCATATTGATGATGATGCCGTT
CGCGTTACGGTCAGCGTGGAGCATGGCGGCGTCACCACCACATTTGACGCCACGAAAGGCACAGGCGGATGGACCTTTAC
GCCGCCGACATCATGGGCGGATGGTGATTATACCCTGAGTGTGTCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCTG
CATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAACATTGAACTGGTCAATGACAGCGGTATTCCCAACGAT
AATCTGACTAATAATGTGCGTCCACACTTCCAGGTGACGGTACCGACGGATGTCAACGTGGTGCGCCTGAGCATTGACGG
CGGCAAGACGTGGTTCAACGCGACCCAGAGCGCGACGCCGGGCGTCTGGGATTATATCTGGCCGGATGATGTGGCCGACG
GAGGCTATACCCTGACGGTAGAAGCGACCGATGAGGCGGGAAATAAGGCAACACAGACGCTCGATTTCACCATCGATACC
ACTCTGTCTGTGCCGACCCTCTCGCTGGACAGCGCAGATGACAGCGGCATCGCGGGCGATAATATCACCAGTGTTAAAAC
GCCGGGCTTTACCCTCAACAATATTGATACCGATGTCAGCCGGGTGATAGTGGAGGTAATGCACAATGGCATTAAACAGG
AGGTACCACTGGTTCAGACCGGCGGACAGTGGCGCTTTGCGCCGACCAGCGACTGGGCGGACGGCGGCTATATCCTGACG
GTGAAGGTAGAAGACAGGGCCGGAAATGTGAAGCAGTCCGCGCCGTTGACGGTGACAGTGGACACGCATATCGCCATTGA
CCGTATTGAACTGGTTAACGACAGCAGTATCCCCGACGATAATCTGACCAATGAAGCGCGCCCGCACTTTCAGGTGACAG
TACCGGCGGATGTTAACGGTGTAAGACTGAGCATTGATGGCGGCAAAACGTGGTTTGACGCCACGCAGAGCGCGACGTCG
GGCGTCTGGGATTATACCTGGCTGACGAATGTGGCTAACGGCCCTCACACCCTGATGGTGGAAGCGACCGACAAGGCGGG
AAACAAAACGACGCAGAAACTGGACTTCATCATCGATACCCTGCTGTCAGAACCGACTATTACCCTGGACAGTGCGGATG
ACAGCGCCGCTGGCGATAACATCACCAACGTTAAGATGCCAGGCTTTACCCTCGGTAATATCGACGCCGACGTGACCAAA
GTGGTGGTGACGGTGGCGCATGATGGTAAGAACCAACAGATAGAGTTGATTAAGAACGGCGGTGTGTGGCGCTTTACGCC
GGGCGCAGCCTGGACCGATGGCGACTATACGCTGACGGTAAAGGTAGAAGATAAGGCGGGTAATACAAATTATTCTGCGC
CGCTGACGGTGACTATCGATACGCAAACGTCTATTGATCGCATTGGGCTTCTTAATGACACGGGTATTGTCGGGGATAAC
CTGACCAATGAAGCACGTCCACAGTTTCATATTACGGTACCGACGGACGTGAACTCTGTGCAACTGAGTCTTGATGGCGG
CATCAACTGGGTTAACGCAACGCTGACGTCTGACGGCGTTTGGGAGTATATATGGCCGACAGATCTGGTCGAAAATACGT
ATACCCTGACAGTGAAAGCAACCGATGTTGCAGGCAACACGGCGACGGAAACGCTCAATTTTATCATTGATACCACATTG
TCGACACCGACCATCACGCTGGATAGCGCAGATGATAGCGGCACCGCCAACGATAATAAGACTAACGTTAAAACGCCGGG
TTTTATTATCGGCGGTATTGATTCTGACGTGACTCAGGTCGTCGTGCAGGTGATGCGCGATGGTCACAGCGAGGAGGTGG
AGCTGACGCAGACTAACGGGCAGTGGCGTTTTGTACCCGGCAGCGCGTGGACTGATGGCGACTATACGCTGACGGTAACG
GTGAAAGATGAGGCGGGTAATATTCGCCACTCAGCGCCGTTGACGGTCACCATCGATACGCAAATCACCATTGACCATAT
TGAACTGGTCAATGACAGCGGTATTCCCGACGATAATCTGACTAATAATGTGCGTCCGCACTTCCAGGTGACGGTACCGA
CGGATGTCAACGTGGTGCGCCTGAGCATTGACGGCGGCAAGACGTGGTTCAACGCGACCCAGAGCGCGACGCCGGGCGTC
TGGGATTATACCTGGCTGGCTGATGTGGGAGAGGGTAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAACAA
AACGACGCAGCAACTGGACTTCATCATCGATACCCTACTGTCAGAACCGACTATCGTGCTGGACAGCACGGACGACAGCG
GAACAAAAGGCGATAACCTGACCAACGTAAATAAGCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTATGTC
ACAGTTGAGGTACAGCATGGCGGCACGAAAGAGGTGCTGACGGCCACCAAAGACGCGACCGGCAACTGGAGCGTGACACC
GATCGGCACATGGGCAGATGGCGACTATACGCTGACAGTGAGGGTGGAAGATGAGGCGGGGAACGAAAAACACTCAGCGT
CGCTGACGGTCACTGTTGATACCCAAATCACCATTGATGTTATTGAACTGGTTAATGATAACGGTATTCCCGGCGACAAT
ATGACTAACGACGCCCATCCGCAGTTCCGCGTGACGGTACCGGGGGATGTTAACGAAGTCAGTCTGAGCATTGACGGCGG
TGTAACCTGGGTTAAAGCGATGCAAAGCGCGACGCCGGGCGTCTGGAATTATACCTGGCCAAAGACAGTGGCAGATGGTG
ACTACACGTTAACGGTGAAAGCGACTGATAACGCAGGCAATACGGTGACCAGGACGCTCGACTTCACTATTGATACTACG
TTGTCGACGCCGGTTATCGTACTGGATAGCGCGGACGACAGTGGTGTCCATGGCGATAACATGACCAATCGCACCCAGCC
GACATTTGCCCTGCAGCATATTGATGATGATGCCGTTCGCGTTACGGTCAGCGTAGAGCATGGCGGCGTCACCACCACAT
TTGACGCCACGAAAGACGCAGGCGGATGGACCTTTACGCCGACAGGGGCGTGGGCGGATGGTGATTATACCCTGAGTGTG
TCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCTGCATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAA
CATTGAACTGGTCAATGACAGCGGTATTCCCAACGATAATCTGACTAATAATGTGCGTCCACACTTCCAGGTGACGGTAC
CGACGGATGTCAACGTGGTGCGCCTGAGCATTGACGGCGGCAAGACGTGGTTCAACGCGACCCAGAGCGCGACGCCGGGT
GTCTGGGATTATACCTGGCTGGCTGATGTGGGAGAGGGGAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAA
CAAAACGACGCAGCAACTGGACTTCATCATCGATACCCTACTGTCAGAACCGACTATCGTGCTGGACAACACGGACGACA
GCGGAACAAAAGGCGATAACCTGACCAACGTAAATAAGCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTAT
GTCACGGTTGAGGTGCAGCATGGCGGCACGAAAGAAGTGCTGACGGCCACCAAAGGCGCGACCGGCATCTGGAGCGTGAC
ACCGACCGGCACATGGGCAGATGGCGACTATACGCTGACGGTGAGGGTGGAGGATGATGCGGGGAACGTAAAATACTCAG
CGCCGCTGACGGTCACGGTTGATACCCAAATCACCATCGATGTTATTGAACTGGTTAATGATAACGGTATTCCCGGCGAC
AACCTGACCAATGACGTTCGTCCACACTTCCGCGTCACGGTGCCAGGGGATGTCAACGAGGTACGTCTGAGTATCGACGG
CGGTAATACGTGGGTTCGTGCAACACAGGGCACGGCAGGGATCTGGGATTACACCTGGCCGAAAGATGTGACCGACGGGC
TACATACCCTGACGGTAGAAGCGACCGATAAGGCGGGAAATAAGACGACGCAGACGCTCGATTTTACCATTGATACCCGG
CTGTCAACGCCTACCATCGCTATGGACAGCAGGGACGATACAGGTGCCATTGGCGATCATATTACGAGCGTCAAAAGACC
GGGCTTTACCATTGGCAATATTGACGCCGATGCGCACTCGGTCATTTTGCGGATCACACAGGGCGGCAATAGCCAGGAAG
TGACACTAACCCAGGTTGGAGGACAGTGGCGCTTTACGCCAGATGCTGACTGGGCGGACGGTAGCTATACGCTGACGGTA
GAGGTAACGGATAACGCAGGAAACGTTCGTCAGTCCACGCCGCTGGTGGTGACGGTGGACACGCAAACCAGCATTACTGA
TATTACATTGGTCAATGATCATGGCGTGCCTGATGACAATCTAACTAATAGCACCCGTCCGCAGTTTGAGATCACGGTGC
CGGCGGATGTGAATTCTGTGCAACTGAGCATTGATGGGGGCGCAAACTGGGTGAGCGCGACGCAGGGTATCGAAGGCGTC
TGGGGCTATACCTGGCCAACGGATATGGGCGATGGAAAACACACCCTAACCGTCATGGTCACCGACAGAGCGGGCAATAC
GGCGACGCAAACGCTTGAATTTTTCATCGACACCCGGTTGTCGACGCCGACCATTGCGCTGGATAGCACGGATGATACCG
GTACGCCTGGCGATGATATGACCAATCGCACCCGGCCGACTTTTATTCTGCAGAATATCGATTCGGATGTTATCAACGTT
ACAGTCAGCGTCACGCATAATGGAACGACAACCTCGTTTACCGCGACACAGGGGGCTGGAGGATGGAGCTTTACACCGCC
AGCGCCGTGGGGCGACGGTGATTATACGCTGACGGTGACAGTGGAGGATCGGGCGGGAAATACGCGTCCGTCTACGCCGC
TGACGGTGACAGTGGATACGCAAATAGCCATTGATCATATTGAATTAGTCAACGATAGCGGCGTCCCTGGCGATAATGTG
ACAAAACATGTGCGTCCGCAGTTCCAGATCTCGGTACCGGATGATGTGGAAAAGGTTCTTCTGAGTATTGACGGCGGCAC
GACCTGGGTTACTGCAATCAAGAGTTCGACGGTTGGCATTTGGGATTACACCTGGCCGACGGATATGCCAGAGGGACAGC
ATACCCTGATCGTGGAAGTGACTGACGGTGCGGGTAATAAGATGACGGGGACGCTCGATTTCACTATCGACATCACGTTG
TTGACGCCAACCATTGAGCTAGCGCCCGATCAGGATACCGGACAGAATAAGAACGATAATCTGACCAGCGTCACTCAGCC
GGTATTTGTGTTGGGGAGTATCGATAAAGATGTTCGACACGTGGAATTGAGTATTGAGCATAACGGCACGTTTAAAACGG
TGGTACTCACCGAATCAGCCGACGGCTGGCGCTATCGACCGGATTCTGCTTTGGCGGACGGTAGCTACACATTCACCGTG
ACGGTAACAGATGTGGCCGGTAATCAGCAAACATCCGCGCCTTTAAAGGTGACGATAGACGGTACGTTGACTACGCCGGT
GATTGAGCTGGCGGCCGGCGAAGATAGCGGTACTGTTGGCGATCGCCTCACCAATCACGATCGGCCTGTGTTCGACATAC
GCCAGATTGATTCTGACGTTACGCGCGTGATGGTCAAAGTAACTTACAACGGTAAAACGCACGAGGAAGCGGCGGTATTC
ACCAATGGTTAA

Protein sequence :

MGNKSIQKFFADQNSVIDLSSLGNAKGAKVSLSGPDMNITTPHGSVIIVNGALYSSIKGNNLAVKFKDKTITGAKILGSV
DLKDIQLERIDSSLVDSAQVEKKGNGKRRNKKEEEELKKQLDEAENAKKEADKAKEEAEKAKEAAEKTLNEAFEVQNSSK
QIEEMLQNFLADNVAKDNLAQQSDASQQNTQAKATQASKQNDAEKVLPQPINKNTSTGKSNSSKNEENKLDAESVKEPLK
VTLALAAESNSGSKDDSITNFTKPQFVGSTAPNATVIIKINGIAVGQAVADSLGNFTFTAPETLTDGTYNLEAEAKTADG
SGSAKLVITIDSVTDKPTFELSPESSVSGHKGLTPTLTPSIVGTAEENAKVDIYVDNKLVASVDVDKDGNWSYEFKDNEL
SEGENSIKVVAVDKAGNKNETTDSIITDTIPPEKPTIELDDSSDSGIKNDNITNSTLPTFIGVAEPGSTVSIYLGLKHLG
EVIVAKDGTWSYTLTTPLKDGEYNITATATDIAGHTSATANLPFTIDTRISYFSAEIETTDDSGIVGDNVTNNTRPTFTG
KTEPNAIISVINSETGEEVIFKANDKGEWTFNFTSDSVEGVNNLTFTVEDVAGNKKDFSFSYVIDTVAPVPPTVSLEDFV
VLPNGIILSGNDLPALVGTAEPKSTILLMRDGKLYDSIEVDSNGTWNYQFSNKFLQGAYDIEIISQDAAGNKSSTVKYSF
TIQTEVVPPKAELDASDDSGAKGDWITNKHNALTLLGTADRFATINILIDGKTIGVTTADADGNWNFDISRNLSDNVYKI
TVESIDPLGRTSSVDYQLTIDSFTPIPTVMLHDSAGSGVKGDMITKINTPLFTGMAEANAKVSIYVDGVLSGEAIAGDDG
VWNFQFTTALSDGSHDVTVKVEDIAGNTASSSAYNFQIVTQTQKPTIELVNDTGVDNTDHIINEKNPALTGTAAPYSTVK
LYVDGALIAEVRTNKDSRWEYTLKADQGLVDGDHRITASVEDIAGNIAHSDPFLISVDTAISIPIVSLSPDSDSGIADDN
LTNIVNPTLHLKDIDPDIISVQVWDAASDTQIGVATQQPDGSWTYTFTSDLTEGLHQVYVKVEDIAGNKANSAVFDFTID
TTVSTPVISLLSKDDTGVTGDNLTNINKPGFAISGVDADAHRVVVQVMHNGVSEEIELSHLNGSWLFTPGNTWADGSYTL
TVKVEDKAGNTSYSAPLTVVIDTQIAIDGVELVNDSGVKGDNMTNDDRPHFRVTVPTDVNEVRLSIDGGNSWVQATPGVA
GSWEYIWPTDLADGQYTLTVEATDKAGNTVTKTIDFAVDTTLSVPVIVLNSADDTGVQGDNMTNRTQPTFALQHIDDDAV
RVTVSVEHGGVTTTFDATKGTGGWTFTPPTSWADGDYTLSVSVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPND
NLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPGVWDYIWPDDVADGGYTLTVEATDEAGNKATQTLDFTIDT
TLSVPTLSLDSADDSGIAGDNITSVKTPGFTLNNIDTDVSRVIVEVMHNGIKQEVPLVQTGGQWRFAPTSDWADGGYILT
VKVEDRAGNVKQSAPLTVTVDTHIAIDRIELVNDSSIPDDNLTNEARPHFQVTVPADVNGVRLSIDGGKTWFDATQSATS
GVWDYTWLTNVANGPHTLMVEATDKAGNKTTQKLDFIIDTLLSEPTITLDSADDSAAGDNITNVKMPGFTLGNIDADVTK
VVVTVAHDGKNQQIELIKNGGVWRFTPGAAWTDGDYTLTVKVEDKAGNTNYSAPLTVTIDTQTSIDRIGLLNDTGIVGDN
LTNEARPQFHITVPTDVNSVQLSLDGGINWVNATLTSDGVWEYIWPTDLVENTYTLTVKATDVAGNTATETLNFIIDTTL
STPTITLDSADDSGTANDNKTNVKTPGFIIGGIDSDVTQVVVQVMRDGHSEEVELTQTNGQWRFVPGSAWTDGDYTLTVT
VKDEAGNIRHSAPLTVTIDTQITIDHIELVNDSGIPDDNLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPGV
WDYTWLADVGEGKHTLTVEATDKAGNKTTQQLDFIIDTLLSEPTIVLDSTDDSGTKGDNLTNVNKPTFLLGNIDADARYV
TVEVQHGGTKEVLTATKDATGNWSVTPIGTWADGDYTLTVRVEDEAGNEKHSASLTVTVDTQITIDVIELVNDNGIPGDN
MTNDAHPQFRVTVPGDVNEVSLSIDGGVTWVKAMQSATPGVWNYTWPKTVADGDYTLTVKATDNAGNTVTRTLDFTIDTT
LSTPVIVLDSADDSGVHGDNMTNRTQPTFALQHIDDDAVRVTVSVEHGGVTTTFDATKDAGGWTFTPTGAWADGDYTLSV
SVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPNDNLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPG
VWDYTWLADVGEGKHTLTVEATDKAGNKTTQQLDFIIDTLLSEPTIVLDNTDDSGTKGDNLTNVNKPTFLLGNIDADARY
VTVEVQHGGTKEVLTATKGATGIWSVTPTGTWADGDYTLTVRVEDDAGNVKYSAPLTVTVDTQITIDVIELVNDNGIPGD
NLTNDVRPHFRVTVPGDVNEVRLSIDGGNTWVRATQGTAGIWDYTWPKDVTDGLHTLTVEATDKAGNKTTQTLDFTIDTR
LSTPTIAMDSRDDTGAIGDHITSVKRPGFTIGNIDADAHSVILRITQGGNSQEVTLTQVGGQWRFTPDADWADGSYTLTV
EVTDNAGNVRQSTPLVVTVDTQTSITDITLVNDHGVPDDNLTNSTRPQFEITVPADVNSVQLSIDGGANWVSATQGIEGV
WGYTWPTDMGDGKHTLTVMVTDRAGNTATQTLEFFIDTRLSTPTIALDSTDDTGTPGDDMTNRTRPTFILQNIDSDVINV
TVSVTHNGTTTSFTATQGAGGWSFTPPAPWGDGDYTLTVTVEDRAGNTRPSTPLTVTVDTQIAIDHIELVNDSGVPGDNV
TKHVRPQFQISVPDDVEKVLLSIDGGTTWVTAIKSSTVGIWDYTWPTDMPEGQHTLIVEVTDGAGNKMTGTLDFTIDITL
LTPTIELAPDQDTGQNKNDNLTSVTQPVFVLGSIDKDVRHVELSIEHNGTFKTVVLTESADGWRYRPDSALADGSYTFTV
TVTDVAGNQQTSAPLKVTIDGTLTTPVIELAAGEDSGTVGDRLTNHDRPVFDIRQIDSDVTRVMVKVTYNGKTHEEAAVF
TNG

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
STY4458	NP_458558.1	large repetitive protein	Not tested	SPI-4	Protein	0.0	100