Gene Information

Name : SPAB_05250 (SPAB_05250)
Accession : YP_001591360.1
Strain : Salmonella enterica SGSC4150; SPB7
Genome accession: NC_010102
Putative virulence/resistance : Virulence
Product : hypothetical protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 4408430 - 4425109 bp
Length : 16680 bp
Strand : +
Note : KEGG: chu:CHU_2852 3.6e-23 CHU large protein; candidate b-glycosidase, glycoside hydrolase family 8 protein K01238; COG: NOG16062 non supervised orthologous group; Psort location: cytoplasmic, score: 23

DNA sequence :
ATGGGAAATAAAAGCATACAAAAGTTTTTTGCCGATCAAAATTCTGTAATTGATTTATCTTCTTTGGGTAATGCCAAAGG
CGCAAAAGTTTCTCTTTCCGGGCCAGACATGAACATTACCACGCCGCGTGGTTCAGTGATCATTGTCAATGGCGCTCTTT
ATTCAAGTATCAAAGGCAATAACCTCGCTGTTAAATTTAAAGATAAGACTATTACCGGCGCTAAAATTCTGGGCAGCGTA
GATTTAAAAGATATTCAACTGGAGAGAATTGACAGCTCATTGGTTGATTCTGCTCAGGTAGAAAAGAAAGGTAATGGCAA
ACGACGAAATAAGAAGGAAGAAGAGGAATTAAAAAAGCAGCTTGACGATGCTGAAAACGCAAAGAAAGAAGCTGATAAGG
CGAAGGAAGAAGCAGAGAAAGCTAAGGAGGCAGCAGAAAAAGCGCTCAATGAAGCGTTTGAAGTACAGAACTCGTCAAAG
CAAATTGAAGAAATGCTGCAGAACTTTTTGGCTGACAATGTAGCAAAAGACAATTTGGCTCAGCAAAGCGATGCTTCCCA
GCAAAATACACAGGCTAAAGCAACGCAGGCTTCTAAACAGAACGATGCTGAAAAAGTTCTTCCTCAACCTATTAATAAAA
ATACCAGTACTGGCAAAAGTAATAGCAGTAAAAATGAGGAAAATAAGCTCGATGCCGAGTCTGTTAAAGAGCCGCTTAAA
GTCACATTAGCGCTTGCGGCCGAGAGTAACAGCGGTAGCAAAGATGATAGTATAACTAATTTTACCAAACCTCAGTTTGT
AGGTAGCACTGCTCCCAATGCCACGGTTATTATTAAAATTAATGGTATTGCTGTCGGTCAGGCTGTAGCGGATAGTTTGG
GTAACTTCACCTTCACAGCGCCTGAAACATTGACTGATGGAACATACAATCTGGAGGCAGAGGCCAAGACTGCTGATGGA
AGCGGTAGCGCCAAACTTGTCATTACTATCGATTCCGTTACCGATAAGCCAACATTTGAACTTTCGCCTGAAAGTAGTGT
GTCTGGTCATAAGGGCTTAACGCCGACCTTGACGCCTTCAATTGTTGGTACGGCGGAAGAGAATGCTAAGGTTGACATTT
ATGTAGATAATAAACTGGTTGCCAGCGTTGATGTCGATAAAGATGGAAACTGGAGTTATGAATTTAAAGATAATGAATTA
TCTGAGGGCGAAAATAGTATAAAAGTCGTTGCCGTGGATAAAGCAGGTAATAAAAACGAAACGACGGATAGTATCATAAC
CGACACCATTCCTCCGGAAAAGCCGACGATTGAGCTGGATGATAGTAGTGATTCCGGCATTAAAAATGACAACATTACAA
ATAGCACCCTGCCAACATTTATTGGTGTGGCGGAACCCGGTTCTACAGTCTCTATTTATCTGGGACTTAAACATCTTGGT
GAGGTCATTGTTGCTAAAGATGGGACATGGAGCTATACGCTTACTACGCCGCTCAAGGATGGCGAATACAATATAACAGC
AACAGCTACTGATATTGCCGGACATACCTCAGCGACGGCAAATCTGCCTTTTACTATTGATACACGTATCAGCTATTTCA
GCGCTGAGATTGAAACGACGAATGATAGCGGTATTGTCGGAGATAACGTTACTAACAATACTCGCCCAACCTTTACAGGT
AAAACTGAGCCAAATGCTATTATCAGTGTCATAAATAGTGAGACTGGCGAAGAGGTTATTTTTAAAGCGAATGACAAGGG
CGAATGGACGTTCAATTTCACTTCCGACTCAGTGGAAGGGATTAACAATCTTACGTTCACTGTTGAAGATGTCGCTGGCA
ACAAAAAGGATTTTTCCTTTAGTTACGTTATTGATACTATTGCCCCTGTACCTCCGACGGTTTCTTTGGAGGATTATGTT
GTTTTGCCGAATGGTATAATTTTATCAGGGAATGATTTACCGGCTTTAGTCGGTACGGCAGAGCCAAAGTCTACCATCTT
ATTGATGCGAGATGGTAAATTATATGACAGCATTGAGGTTGACTCAAACGGGACCTGGAATTATCAGTTTAGTAATAAAT
TTCTTCAGGGCGCCTATGATATTGAAATCATCTCTCAGGATGCCGCCGGTAATAAATCCTCTACTGTTAAATATTCTTTT
ACTATTCAAACTGAAGTTGTACCTCCAAAAGCGGAACTCGATGCCAGTGATGATTCCGGTGCAAAAGGCGACTGGATTAC
CAATAAACATAATGCTCTGACATTACTGGGAACAGCGGATAGGTTTGCTACCGTAAATATCCTTATTGATGGTAAAACGA
TAGGCGTGACGACTGCGGATGCAGACGGTAACTGGAATTTTGATATTTCCCGAAATCTGTCTGACAATGTTTATAAGATT
ACGGTTGAATCCATCGATCCTTTAGGAAGAACGTCATCTGTAGATTATCAGCTTACCATTGATAGCTTTACGCCGATCCC
TACTGTTATGTTGCATGATAGCGCTGACTCTGGCGTTAAAGGCGATATGATTACTAAAATTAATACGCCGTTGTTTACCG
GGATGGCTGAAGCTAATGCTAAGGTTTCCATCTATGTTGACGGTGTGTTAAGTGGTGAGGCTATTGCTGGCGATGATGGT
GTATGGAATTTTCAATTTACCACAGCGTTATCCGATGGCTCGCATGACGTAACGGTAAAAGTAGAAGATATTGCCGGTAA
TACTGCCTCCTCATCAGCGTATAATTTCCAAATCGTAACGCAAACGCAAAAACCAACAATAGAGTTGGTCAACGATACGG
GGGTTGATAATACAGACCATATTATTAATGAAAAGAATCCTGCACTGACAGGAACCGCTGCACCCTATTCAACGGTTAAA
CTCTATATTGATGGCGCACTGATCGCTGAGGTCAGAACAAATAAAGATGGCAGATGGGAATATACCCTGAAAGCCGATCA
AGGTTTGGTTGATGGCGATCATAGAATAACCGCTTCAGTTGAAGATATCGCTGGCAACATTGCCCATTCGGATCCTTTCT
TAATTAGCGTCGATACTGCTATTTCAATACCGATAGTTTCATTGAGCCCGGATTCAGATTCGGGAATTGCAGATGATAAT
TTAACGAATATCGTTAAACCTACCTTGCACCTAAAAGATATTGATCCGGACATTATCAGTGTTCAGGTATGGGATGCCAT
GTCTGATACGCAGATCGGTGTTGCCACGCAACAACCTGATGGTTCATGGGCCTATACCTTTACTTCAGATTTAACGGAAG
GCTTGCATCAGGTTTATGTCAAGGTTGAGGACATTGCGGGTAATAAAGCGAACAGTGCGGTATTCGATTTTACTATCGAT
ACCACAGTATCAACGCCGGTGATTTCCCTGCTTTCTAAGGATGATACGGGGGTTACAGGCGATAACCTGACCAATATCAA
TAAGCCAGGTTTTGCTATTTCCGGTGTTGATGCTGATGCGCATCGGGTCGTCGTACAGGTGATGCACAATGGCGTGAGCG
AAGAGATCGAACTTTCCCACCTCAATGGTAGTTGGTTATTTATACCAGGGAATACGTGGGCGGATGGCAGCTACACGTTA
ACGGTGAAAGTAGAAGATAAGGCAGGAAATACCAACTACTCAGCGCCGCTGACGGTCGTTATCGATACCCAAATCGCCAT
TGATGGGGTGGAACTGGTCAACGATAGCGGCGTGAAAGGCGATAATATGACCAACGACGACCGTCCCCACTTTCGTGTGA
CGGTACCTACGGATGTCAATGAAGTCCGTCTGAGCATTGACGGTGGTAATTCGTGGGTTCAGGCAACTCCGGGCGTGGCA
GGAAGCTGGGAGTATATCTGGCCGACAGACCTGGCAGATGGTCAATACACGCTAACGGTGGAAGCGACTGATAAAGCAGG
CAATACAGTGACGAAGACCATCGATTTCGCGGTGGATACCACGCTGTCAGTGCCGGTCATCGTACTGGATAGCGCGGACG
ACACCGGCATCCAGGGCGATAACATGACGAATAGCACCCAGCCGACATTTGCCCTGCAGCATATTGATGATGATGCCGTT
CGCGTTACGGTCAGCGTGGAGCATGGCGGCGTCACCACCACATTTGACGCCACGAAAGGCACAGGCGGATGGACCTTTAC
GCCGCCGACATCATGGGCGGATGGTGATTATACCCTGAGTGTGTCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCTG
CATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAACATTGAACTGGTCAATGACAGCGGTATTCCCGACGAT
AATCTGACTAATAATGTGCGTCCGCACTTCCAGGTGACGGTACCGACGGATGTCAACGTGGTGCGCCTGAGCATTGACGG
CGGCAAGACGTGGTTCAACGCGACCCAGAGCGCGACGCCGGGCGTCTGGGATTATATCTGGCCGGATGATGTGGCCGACG
GAGGCTATACCCTGACGGTAGAAGCGACCGATGAGGCGGGAAATAAGGCAACACAGACGCTCGATTTCACCATCGATACC
ACTCTGTCTGTGCCGACCCTCTCGCTGGACAGCGCAGATGACAGCGGCATCGCGGGCGATAATATCACCAGTGTTAAAAC
GCCGGGCTTTACCCTCAACAATATTGATACCGATGTCAGCCGGGTGATAGTGGAGGTAATGCACAATGGTATTAAACAGG
AGGTGCCACTGGTTCAGACCGGCGGACAGTGGCGCTTTGCGCCGACCAGCGACTGGGCGGACGGCGACTATATCCTGACG
GTGAAGGTAGAAGATAGGGCCGGAAATGTGAAGCAGTCCGCGCCGTTGACGGTGACAGTGGACACGCATATCGCCATTGA
CCGTATTGAACTGGTTAACGACAGCGGTATCCCCGACGATAATCTGACCAATGAAGCGCGCCCGCACTTTCAGGTGACAG
TACCGGCGGATGTTAACGGTGTAAGACTGAGCATTGATGGCGGCAAAACGTGGTTTGACGCCACGCAGAGCGCGACGTCG
GGCGTCTGGGATTATACCTGGCTGACGAATGTGGCTAACGGCCCTCACACCCTGATGGTGGAAGCAACCGACAAGGCGGG
AAACAAAACGACGCAGAAACTGGACTTCACCATCGATACCATTCTGTCAGAACCGACGATTACCCTGGACAGCGCGGATG
ATAGCGCCGCTGGCGATAACATCACCAACGTTAAGATGCCAGGCTTTACCCTCGGTAATATCGACGCCGACGTGACCAAA
GTGGTGGTGACGGTGGCGCATGATGGTAAGAACCAACAGATAGAGTTGATTAAGAACGGCGGTGTGTGGCGCTTTACGCC
GGGCGCAGCCTGGACCGATGGCGACTATACGCTGACGGTAAAGGTAGAAGATAAGGCGGGTAATACAAATTATTCTGCGC
CGCTGACGGTGACTATCGATACGCAAACGTCTATTGATCGCATTGAACTTCTTAATGACACGGGTATTGTCGGGGATAAC
CTGACCAATGAAGCACGTCCACAGTTTCATATTACGGTACCGACGGACGTGAACTCTGTGCAACTGAGTCTTGATGGCGG
CATCAACTGGGTTAACGCAACGCTGACGTCTGACGGCGTTTGGGAGTATATATGGCCGACAGATCTGGTCGAAAATACGT
ATACCCTGACAGTGAAAGCAACCGATGTTGCAGGCAACACGGCGACGGAAACGCTCAATTTTATCATTGATACCACATTG
TCGACACCGACCATCACGCTGGATAGCGCAGATGATAGCGGCACCGCCAACGATAATAAGACTAACGTTAAAACGCCGGG
TTTTATTATCGGCGGTATTGATTCTGACGTGACTCAGGTCGTCGTGCAGGTGATGCGCGATGGTCACAGCGAGGAGGTGG
AGCTGACGCAGACTAACGGGCAGTGGCGTTTTGTACCCGGCAGCGCGTGGACTGATGGCGACTATACGCTGACGGTAACG
GTGAAAGATGAGGCGGGTAATATTCGCCACTCAGCGCCGTTGACGGTCACCATCGATACGCAAATCACCATTGACCATAT
TGAACTGGTCAATGACAGCGGTATTCCCGACGATAATCTGACTAATAATGTGCGTCCGCACTTCCAGGTGACGGTACCGA
CGGATGTCAACGTGGTGCGCCTGAGCATTGACGGCGGCAAGACGTGGTTCAACGCTACCCAGAGCGCGACGCCGGGCGTC
TGGGATTATACCTGGCTGGCTGATGTGGGAGAGGGTAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAACAA
AACGACGCAGCAACTGGACTTCATCATCGATACCCTACTGTCAGAACCGACTATCGTGCTGGACAACACGGACGACAGCG
GAACAAAAGGCGATAACCTGACCAACGTAAATAAGCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTATGTC
ACGGTTGAGGTGCAGCATGGCGGCACGAAAGAAGTGCTGACGGCCACCAAAGACGCGACCGGCAACTGGAGCGTAACACC
GACCGGCACATGGGCAGATGGCGACTATACGCTGACAGTGAGGGTGGAGGATGATGCGGGGAACGTAAAATACTCCGCGT
CGCTGACGGTCACGGTCGATACCCAAATCACCATCGATGTTATTGAACTGGTTAACGACAGTGGTACCAGGGGCGACAAT
CTAACTAACGACGCCAATCCACACTTCCGTATCACGGTACCAGGGGATGTTAACGAAGTCAGTCTGAGCATTGACGGCGG
TGTAACCTGGGTTAAAGCGATGCAAAGCGCGACGCCGGGCGTCTGGAATTATACCTGGCCAAAGACAGTGGCAGATGGTG
ACTACACGTTAACGGTGAAAGCGACTGATAACGCAGGCAATACGGTGACCAGGACGCTCGACTTCACTATTGATACTACG
TTGTCGACGCCGGTGATCGTACTGGATAGCGCGGACGACAGTGGTGTCCATGGCGATAACATGACCAATCACACCCAGCC
GACATTTGCCCTGCAGCATATTGATGATGATGCCGTTCGCGTTACGGTCAGCGTAGAGCATGGCGGCGTCACCACCACAT
TTGACGCCACGAAAGACGCAGGCGGATGGACCTTTACGCCGACAGGGGCGTGGGCGGATGGTGATTATACCCTGAGTGTG
TCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCTGCATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAA
CATTGAACTGGTCAATGACAGCGGTATTCCCAACGATAATCTGACTAATAACGTGCGTCCGCACTTCCAGGTGACGGTAC
CGACTGATGTCAACGTGGTGCGCCTGAGCATTGACGGCGGCAAGACGTGGTTCAACGCGACCCAGAGCGCGACGCCGGGT
GTCTGGGATTATACCTGGCTGGCTGATGTGGGAGAGGGGAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAA
CCAGACGACGCAGAAACTGGACTTCATCATCGATACCCTACTGTCAGAACCGACTATCGTGCTGGACAGCACGGACGACA
GCGGAACAAAAGGCGATAACCTGACCAACGCGAATAAGCCGACGTTTATACTGGGCAATATTGACGCAGACGCGCGGTAT
GTCACGGTTGAGGTGCAGTATGGCGGCACGAAAGAAGTGCTGACGGCCACCAAAGGCGCGACCGGCATCTGGAGCGTGAC
ACCGACCGGCACATGGGCAGATGGCGACTATACGCTGACGGTGAGGGTGGAGGATGATGCGGGGAACGTAAAATACTCAG
CGCCGCTGACGGTCACGGTTGATACCCAAATCACCATTGATGTTATTGAACTGGTTAATGATAACGGTATTCCCGGCGAC
AACCTGACCAATGACGTTCGTCCACACTTCCGCGTCACGGTGCCAGGGGATGTCAACGAGGTACGTCTGAGTATCGACGG
CGGTAATACGTGGGTTCGTGCAACACAGGGCACGGCAGGGATCTGGGATTACACCTGGCCGAAAGATGTGACCGACGGGC
TACATACCCTGACGGTAGAAGCGACCGATAAGGCGGGAAATAAGACGACGCAGACGCTCGATTTTACCATTGATACCCGG
CTGTCAACGCCTACCATCACTATGGATAGCAGGGACGATACAGGTGCCATTGGCGATCATATTACGAGCGTCAAAAGACC
GGGCTTTACCATTGGCAATATTGACTCCGATGCGCAATCGGTCATTTTGCGGATCACACAGGGCGGCAATAGCCAGGAAG
TGACACTAACCCAGGTTGGAGGACAGTGGCGCTTTACGCCAGATGCTGACTGGGCGGACGGTAGCTATACACTGACGGTA
GAGGTAACGGATAACGCAGGAAACGTTCGTCAGTCCACGCCGCTGATAGTGACGGTAGATACGCAAACCAGCATTACTGA
TATTACATTGGTCAATGATCATGGCGTGCCTGATGACAATCTAACTAACAGCACCCGTCCGCAGTTTGAGATCACGGTGC
CGGCGGATGTGAATTCTGTGCAACTGAGCATTGATGGGGGCGCAAACTGGGTGAGCGCGGCGCAGGGTATTGAAGGCGTC
TGGGGCTATACCTGGCCAACGGATATGGGCGATGGAAAACACACCCTAACCGTCATGGTCACCGACAGAGCGGGCAATAC
GGCGACGCAAACGCTTGAATTTTTCATCGACACCCGGTTGTCGACGCCGACTATTGCGCTGGATAGCACGGATGATACCG
GTACGCCTGGCGATGATATGACCAATCGCACCCGACCGACCTTTATTCTGCAGAATATCGATTCGGATGTTATCAACGTT
ACAGTCAGCGTCACGCATAATGGAACGACAACCTCGTTTACCGCGACACAGGGGGCTGGAGGCTGGAGCTTTACACCGCC
AGCGCCGTGGGGCGACGGTGATTATACGCTGACGGTGACAGTGGAGGATCGGGCGGGAAATACGCGTCCGTCTACGCCGC
TGACGGTGACAGTGGATACGCAAATAGCCATTGATCATATTGAATTAGTCAACGATAGCGGCGTCCCTGGCGATAATGTG
ACAAAACATGTGCGTCCGCAGTTCCAGATCTCGGTACCGGATGATGTGGAAAAGGTTCTTCTGAGTATTGACGGCGGCAC
GACCTGGGTTACCGCAATCAAGAGTTCGACGGCTGGCATTTGGGATTACACCTGGCCGACGGATATGCCAGAGGGACAGC
ATACCCTGACCGTGGAAGTGACTGACGGTGCGGGTAATAAGATGACGGAGACGCTCAATTTCACTATCGACATCACGTTG
ATGACGCCAACCATTGAGCTGGCGCCCGATCAGGATACCGGACAGAATAAGAACGATAATCTGACCAGCGTCACTCAGCC
AGTATTTGTGTTGGGGAGTATCGATAAAGATGTTCGACACGTGGAATTGAGTATTGAGCATAACGGCACGTTTAAAACGG
TGGTACTCACCGAATCAGCCGACGGCTGGCGCTATCGACCGGATTCTGCTTTGGCGGACGGTAGCTACACATTCACCGTG
ACGGTAACAGATGTGGCAGGCAACCAGCAAACATCCGCGCCTTTAAAGGTGACGATAGACGGTACGTTGACTACGCCGGT
GATTGAACTGGCAGCTGGCGAAGATAGCGGTACTGTTGGCGATCGCCTCACCAATCACGATCGGCCTGTGTTCGACATAC
GCCAGGTTGATTCTGACGTTACGCGCGTGATGGTCAAAGTAACTTACAACGGTAAAACGCACGAGGAAGCGGCGGTATTC
ACCAATGGTCAATGGCGCTTTGCGCCTTCTGCGAGCTGGGCTGATGGCTCATATCAGTTAGCCGTTGTGGTGGAAGATCT
GGCGGGGAATGTAAAAGAGTCTGCGCCGTTTGAGGTGCGTATTGACACCACGACAACCATTAACAATATCGTATTGCTTA
ATGATACTGGCGTGCAGAATGATCAATTAACGAATGTTGCCAAACCGTCATTCAGAATTGACGTTCCCGGTGATGTCGTC
CAGGTACGCGTAACCCTGGATGGTGGCGCTAACTGGAATGTGATACGCAAAAATGCCGACGGACAGTGGATTTTTGACAG
CCCGAATACTCTGGTTGACGGCACATATACCCTTCGCGTAGAGGCCACGGATGAGGCAGGTAATATTGCGAATAAAGATT
TAGTATTTAATATCGATACTAATATACAGGTTCCGACTATTGCTTTAGACGCAGGACAAGATACCGGAGCGAATACAGCC
GATAATATCACTAATATTTCACGACCCACCTTTACGATTGGTAATGTTGACCCCGATGTTATCAAAGTCGTGGTGACGAT
TGATGGTCATGATTATAACGCGACTAAGGTTGGGGCTGGTTGGCAATTTACGCCAGGCAATGCCATTCCGGATGGTTCTT
ATAATATTACCGTTACGGTTGAAGATAAGGCCGGAAATACCGCGACATCGAAACCATTACCTGTTGTGATAGATACGACG
GCTGAAATTGAAAGCGTCACGTTGGTTACAGATAGTGGTGATAGCGATGTAGATAACATTACCAAAGTCGACAAGCCGCA
GTTTAGTATTGTTACCGCTGATGATATTACCCATGTGCGCGTTAAAATCGATAACGCCGCTAATTGGATTGAACTCACAA
AAGGAGGGGATGGCCGCTGGATATTTAATGTCGGTTCGGCATTACCTGATGGGCAACACACTCTCTTGGTTGATGTGACT
GATATCGCCGGCAACGTTGCGCAAGAAACGCTGCAGTTTACGATTGATACGACTCTGCGAGAGCCGACAATTGTACTCGA
TCCCACCCATGATACTGGTGATGATACTAATGATAATCTTACCAGGATTAACAAACCGGTGTTTATTATCGGTAATGTCG
ATAATGATGTATCACACATTGTGGTTCATATTGATGGTCGGGATTACACCATTGAAAACACAGGGGGGAATTTAACCTTT
ACGCCGGATCAACCGCTGTCTGACGGTCAGCATACGATCTCTGTTACCGTAACGGATATTGCTGGTAATACCAAAACATC
GGCCGAACTGCGGATTGAAATCGACACGCAGGTTCAGATTGACAGTGTTACGTTAACAACAGATAGCGGCGTCAACGATC
ACGATAATGTCACCAATGCTACCCGTCCCTCTTTTGAAATTGCAACGCCTGATGATGTGACATCGGTGCTGGTTTCTTTC
GATGGCGTAAACTGGACGCCCATCAGTAAAAATGCGGCCGGGCAGTGGGAATTTACTGCAGGTAGCGCATTGCCTGATGG
TAATTATACTCTCCATGTCCAGGCGACGGATCGGGCAGGGAATACGGCAAATTCCACGCTGGGCTTCACCGTGGATACGC
AGATTGACGGCCTGAGCGTCGTGATGCTGGACGACGCCGGAAAGGATTCTACGGATGGTATTACGAATATTACCTCTCCA
CGTTTTGAAATTTCAGCCAGAGAACCGCTGCAGAGCGTGACGGTAATTTTAAACGGGAAATCCAGCACACTGACTCAGGG
GGCAGGTAATAAATGGCTGTTTACCCCTGATACACCGTTAGTGGATGGAACTTACAAAATAGAAATAGTGGCTGAAGATA
TCGCAGGTAATAAAATTAGCAAAGAGGTATCATTCACAATAGACACTATTGTTTCTGATCCCAGTATTGATTTGCTGGAT
GCGGATGATACTGGCGAAAGCGCTGTTGATAATATTACGAGTGTCACTACACCACGTTTCGTTATTGGCAATGTACCCGC
CGATATTGATACTGTTGTAATCAGAATTAACGGCGTTTCTTATCCGGTTACGGCAAATGGCAATAACCTCTGGGAATTTC
AGGTTCCCGTTGCGTTAAACGATGGCGTATATGAAGCCGTTGTTGTCTTCAGAGATATTGCCGGAAATACTTCTGAAACT
AAGCTGCCCTTTACCATTGATACCACGACAAGCGTCAGTGTCAGAATGGAGCCAGCGTCTGATACCGGAAATTCCAATAG
CGATAACCTTACGAATAAGCAAAATCCCAAATTCGAAGGTACTGCAGAGCCCAATGCGAAACTGGTGATTACCATTGTTG
ACGATAAGTCAGGTCGGGAGGTTTTAAAACAAACGATTACGGTTGGCGCTGATGGCAACTGGAGTGTGACGCCGAATATA
CTGCCGGATGGCATGTATACCATCAACGTCGTCGCAACAGATGTCGCGGGAAATACTGCGCAAACGCAGGAAAGATTCAC
TATCGATACGGTTACGATCGATCCCACCATTCGCCTTTCGGATCCATCTATTGATGATCAGCATGAAGCAACCAGCCTGC
GTCCTGAGTTCAAAGGGTTTGCCGAAGCGTTCTCGACGATTATGATTCAGTGGGATGGGAAAGTGGTCGGCTCGGCAAAC
GCCAATGCGAATGGCGAATGGAGTTGGACGCCGCCATCAGTATTAGCGCCAGGCTCCTATGTTGTGAGCATTGTTGCCAA
AGATAAAGCGGGTAATGAATCGTCGCAGGTCGACTTTCCTGTCGTAATACCTGTTATTGATGTCACGCCTCCAACCATAA
AGCTCAGCGAGGAGAGCGATAGTGGCGCCTTAGGAGACTTTACCACGAATAATAAAACGCCGACCCTGATTGGGAGCACG
TTACCTAATACGATTGTGAGTATTTATGTGGATGGCGTGAAGGTCGGCGAGGCGACAGCGGATACAGCGGGTCGATATAC
TTTCCAGTTATCGGAAATGAAAGATGGCCATTATGTCGTCCAGGTGGGTATCGTCAACCCTCGCGATAATAGCGAACTGC
GTTCTACCGCCGTTGATGTCACTATCGATACCGAGGTTGCTGAACTGGTATGGAATATATCTGGAATGCATGAGGGCGGA
TATATCAATACGGTGACGCCGGAGATTGGCGGCACCAGTGAGCCAAACAGCAAAATCACTATCTTTGTGAATGGCGTTGA
AAAAGCGATTGCTTATACGACAGGCGCAGGACACTGGGGCGTAGTATTACCCGCTTTGGGTAATGACGGTAATTATGAAT
TAACGTTTAAAGTTGAAGACGTTGCCGGTAATATCAGAGAGTTTGGTCCGCAGAATGTAATACTGGATACAGTAATTTCG
CCGTTAACCGTGGTATTACGCGAAGCTGATGACAGTGGCAAAGTTGGCGACTGGATCACCAATAAATCTCATGTCACCAT
CGATGGTACTGCCGAAGCCGGAAGTACTTTAACCATCAGGAATCCGCAGGGGGTGGTTATTGCTACCCTGGTGGTAGGCA
ATGATGGTCGATGGAGCGCAGAATTAGATCTGCGTGAAGGTAGTAATGCCTTTGTCGTGGTATCGGAAGATAAAGCGGGC
AACAGTCAACAAAAAGAGATTCTGATAGAACATGATACGCAGATTGAAATCAGCGATATTTCATTAAGTCGGGATACTAA
TAGCGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTACTGGTTGCCATGACCGATCCCGGCGCGACGGTAC
AGGTTTATATTAATGGTGTGTTACAAGGCACAGTAGAGGCGAGTTCGTCAGGTAATATTAGCTATACCATGCCGGCAAAT
AGCGCCGACGGCGAGTATCAGGTGCAATTTGTTGCTACGGATACTGCTGGTAACCGGGTTGAGTCTGCGATTACAACCGT
GACAATCGATTCTCAAATTGCTGTCTTTGATATTGATGAAGATTCATTACCGGCCCTCTCTAATAACCGAGCGTTGTCAG
TCTCAGGTGTCGGGGAGGCTGGTTCTCAGGTCAGCATCTTTGTCGATGGTAAATTAGTCAACGTTGTTATGGTTGAGGCT
GATGGCACATGGCGCGCGCCGATACTGCTGCAAGATGATGGTACGTTTAATATTCATTTCAGCATTACTGACGTTGCTGG
CAACACTGAAGTGAGCAAGAATTACAGTGTGGATGTCGATTCATCAACCGACTTCCCAACGCTCAACCTTGAAGATGCAA
GCAACTCTGGTTCACTTGACGATCTGATTACTAATCACAACAAGCCTGTATTAGTTGGCACCGCAGAAGCGGGAGCCACA
ATCCATATTTATGTGGATGAAAAGATCGTGGCAAATGTTCTTGTGCTTGAAGATGGAACCTGGTCCTATCAGTTTGATAA
TGCGTTAAAAGATGGTGAATATTCTATCCGTGTGGTTGCCGAAGACCCGGCAGGTAATACGGCAGAATCGCCTCGCTTAC
TCGTCACGATAGATACCAGTACGTTTATCGATAATCCTGCTATGGTGGCAGGTTCTGATAATGGTATTTTCAGTAATGAT
AGTATAACGAGTCAGACCCGGCCTACGTTTAGTATTTTTGGAGAAATGAACCAGAGTGTTCAGATTTTCATTGATGGGGT
GTTAGTCGATACGATCACGGTGACGGACAGAAATCAAGTTTATCGACCTGAGTCACCGTTGGGCGATGGTTCCCATAGCA
TTTATTATGTTATCACCGATAAAGCAGGCAACACGGCTACCTCGAAAACGCTAAACTTTACTATCGATACCTTTAATACG
ACGCCTGTCGCCATTGATTCTATCGGTGGACAAACGTTAGCAGAGATGACCGGTAGTGATGGCAAAATATATATAACGGA
CACGACGCGTAACTTATTGTTTAGTGGCAGTGCCGAGCCCAATAGCAAAATAGAAATCATCATTAATGGCTTAAATGTGG
GGGAAGTTTGGGTTAATGAAAAAGGCCACTGGCAGATGCCGGTGAACCCGCTTTATTTCACAGAGGGCCAACTGGATATC
ACTGTTAAATCTACGGACCGTGGTGGTAACGTAAATCAAGAAAAGTATTCCATTTGGGTTGATACGCATATCAAGGTATT
TACCAGCGAGCTTGATGACAATAAATCATCATCGAAAACGGAATGGTGGAGTAATAGCGATCTCATTACCATGCGAGGCA
CGGGTGAAATTGGCGCTACGGTATCATTAATCGTGGCTGGCGTCACGCTGGCAACTGCTGTTGTGGCGGCAACAGGACGA
TGGGAATTATCAACAGACAAGCTTCCAGAAGGGACTTACGATATTAGTTTGGTCATTGAAGATAGCGCCGGAAATCGTTG
GGAAGATGTGCGTGAAATATTTATTGACCGAACGCCGCCAAATGCTCCGGTCGTAACGTATTCAGATATTGTCAACGATC
TAATTATTATGCAGGGGACGGCGGAAGCCAAATCTCAGCTAATAATAACCGATAGTGAGGGGAATACTTATACGTTAACC
GTTCCTGATAATGGTAAATGGAGTATGGCGATCCCGTATCCATCGGAAGGGAAGTTTACCATTACGAGTGTGGATGCGAT
TGGTAACCGGAGTGATGATGTCCCTCTCGATATCATGAAAGAGGTTCCCGTTATTTCATTATCTCCAGACTCAGACAGTG
GTACGGTGGGCGATAATATTACGCGAGATAAGCAACCTACCTTTATTATCGGGAATCTGGAAAGCGATGTTGTGGTCGTT
CAGGTCGATATCAATGGGACCGTATATAATGCTGAAAAAAATGCCGATGGCGTTTGGTTCTTTACGCCAGGTACACCGTT
AGCTGATGGTTCCTATACGATATCGGTAATCGCAAGCGATGCCGCGGGTAATCAGAAAAACTCGTTACCCATTACTGTCA
CGATCGACAGCACGCTGACGGTGCCGGAGATTGCGTTGGCAGCAGGTGAAGACAATGGCGCTTCAGACAGCGATAACGTG
ACGAATCACACCCAGCCTAAGTTCACGCTGCAGCATATTGATGCTGATGTGACCGGGGTGACCGTAAACGTGACGCATAA
TGGCGTGACAGACATCTATCAGGCGACGCAAGGCGCGGATGGCTGGACCTTCACGCCGCCAGCCGCCTGGAATGACGGTA
ACTACACGCTGAGCGTGACGGTGGTGGATCGCGCGGGGAATTCACAGCAATCTGCTTCGCTAGCGGTGACGGTTGACTCA
ACGGTGACGGTAACAGCGGATAGCCAGCATGACGATGCGAGCGATGACGCCACGGCAACAGCGGTTACTCCACCGGAGTC
TGAAACAGTGAATGCCGAAAGCGCTACGCATCTTCGTACAGTGCCGTCTGCGGCGGAAGAAAGCGTGGTGAAGGAGACAG
CCTATAGTATTACATTGTTAAACGCTGACTCTGGGGATGAAATAGATCGTTCAATTAGTCAGACACCTTCTTTTGAAATA
TCAGTACCTGAGAATATTGTTAATGTCAGTGTTATGTTTGAAGGAGAAGAGTTTACTCTGCCGATAACTAACCAGAAAGC
AATATTCGAAGTTCCGCTATCTTTGGAAGATGGTGAATATACTATGGACGTGAAATTCATTGATAAGGACGATGATTTCC
TGATTAAGGAAAAAACATTCTCAGTCGATCACTCCTCGGCGGATATTGTGAACGCAATGAATGCAAGAGGAAAGACCGAG
GATGATATTAATGATTCCCCTTCCACGAGTTCTGTAGGGCACAACAATAACGGCGCTATTGATGTTTTCGCCGTTAATGA
AGTTACGCTACCTGTAGATAATCAAGAAGAACACGCATAA

Protein sequence :
MGNKSIQKFFADQNSVIDLSSLGNAKGAKVSLSGPDMNITTPRGSVIIVNGALYSSIKGNNLAVKFKDKTITGAKILGSV
DLKDIQLERIDSSLVDSAQVEKKGNGKRRNKKEEEELKKQLDDAENAKKEADKAKEEAEKAKEAAEKALNEAFEVQNSSK
QIEEMLQNFLADNVAKDNLAQQSDASQQNTQAKATQASKQNDAEKVLPQPINKNTSTGKSNSSKNEENKLDAESVKEPLK
VTLALAAESNSGSKDDSITNFTKPQFVGSTAPNATVIIKINGIAVGQAVADSLGNFTFTAPETLTDGTYNLEAEAKTADG
SGSAKLVITIDSVTDKPTFELSPESSVSGHKGLTPTLTPSIVGTAEENAKVDIYVDNKLVASVDVDKDGNWSYEFKDNEL
SEGENSIKVVAVDKAGNKNETTDSIITDTIPPEKPTIELDDSSDSGIKNDNITNSTLPTFIGVAEPGSTVSIYLGLKHLG
EVIVAKDGTWSYTLTTPLKDGEYNITATATDIAGHTSATANLPFTIDTRISYFSAEIETTNDSGIVGDNVTNNTRPTFTG
KTEPNAIISVINSETGEEVIFKANDKGEWTFNFTSDSVEGINNLTFTVEDVAGNKKDFSFSYVIDTIAPVPPTVSLEDYV
VLPNGIILSGNDLPALVGTAEPKSTILLMRDGKLYDSIEVDSNGTWNYQFSNKFLQGAYDIEIISQDAAGNKSSTVKYSF
TIQTEVVPPKAELDASDDSGAKGDWITNKHNALTLLGTADRFATVNILIDGKTIGVTTADADGNWNFDISRNLSDNVYKI
TVESIDPLGRTSSVDYQLTIDSFTPIPTVMLHDSADSGVKGDMITKINTPLFTGMAEANAKVSIYVDGVLSGEAIAGDDG
VWNFQFTTALSDGSHDVTVKVEDIAGNTASSSAYNFQIVTQTQKPTIELVNDTGVDNTDHIINEKNPALTGTAAPYSTVK
LYIDGALIAEVRTNKDGRWEYTLKADQGLVDGDHRITASVEDIAGNIAHSDPFLISVDTAISIPIVSLSPDSDSGIADDN
LTNIVKPTLHLKDIDPDIISVQVWDAMSDTQIGVATQQPDGSWAYTFTSDLTEGLHQVYVKVEDIAGNKANSAVFDFTID
TTVSTPVISLLSKDDTGVTGDNLTNINKPGFAISGVDADAHRVVVQVMHNGVSEEIELSHLNGSWLFIPGNTWADGSYTL
TVKVEDKAGNTNYSAPLTVVIDTQIAIDGVELVNDSGVKGDNMTNDDRPHFRVTVPTDVNEVRLSIDGGNSWVQATPGVA
GSWEYIWPTDLADGQYTLTVEATDKAGNTVTKTIDFAVDTTLSVPVIVLDSADDTGIQGDNMTNSTQPTFALQHIDDDAV
RVTVSVEHGGVTTTFDATKGTGGWTFTPPTSWADGDYTLSVSVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPDD
NLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPGVWDYIWPDDVADGGYTLTVEATDEAGNKATQTLDFTIDT
TLSVPTLSLDSADDSGIAGDNITSVKTPGFTLNNIDTDVSRVIVEVMHNGIKQEVPLVQTGGQWRFAPTSDWADGDYILT
VKVEDRAGNVKQSAPLTVTVDTHIAIDRIELVNDSGIPDDNLTNEARPHFQVTVPADVNGVRLSIDGGKTWFDATQSATS
GVWDYTWLTNVANGPHTLMVEATDKAGNKTTQKLDFTIDTILSEPTITLDSADDSAAGDNITNVKMPGFTLGNIDADVTK
VVVTVAHDGKNQQIELIKNGGVWRFTPGAAWTDGDYTLTVKVEDKAGNTNYSAPLTVTIDTQTSIDRIELLNDTGIVGDN
LTNEARPQFHITVPTDVNSVQLSLDGGINWVNATLTSDGVWEYIWPTDLVENTYTLTVKATDVAGNTATETLNFIIDTTL
STPTITLDSADDSGTANDNKTNVKTPGFIIGGIDSDVTQVVVQVMRDGHSEEVELTQTNGQWRFVPGSAWTDGDYTLTVT
VKDEAGNIRHSAPLTVTIDTQITIDHIELVNDSGIPDDNLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPGV
WDYTWLADVGEGKHTLTVEATDKAGNKTTQQLDFIIDTLLSEPTIVLDNTDDSGTKGDNLTNVNKPTFLLGNIDADARYV
TVEVQHGGTKEVLTATKDATGNWSVTPTGTWADGDYTLTVRVEDDAGNVKYSASLTVTVDTQITIDVIELVNDSGTRGDN
LTNDANPHFRITVPGDVNEVSLSIDGGVTWVKAMQSATPGVWNYTWPKTVADGDYTLTVKATDNAGNTVTRTLDFTIDTT
LSTPVIVLDSADDSGVHGDNMTNHTQPTFALQHIDDDAVRVTVSVEHGGVTTTFDATKDAGGWTFTPTGAWADGDYTLSV
SVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPNDNLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPG
VWDYTWLADVGEGKHTLTVEATDKAGNQTTQKLDFIIDTLLSEPTIVLDSTDDSGTKGDNLTNANKPTFILGNIDADARY
VTVEVQYGGTKEVLTATKGATGIWSVTPTGTWADGDYTLTVRVEDDAGNVKYSAPLTVTVDTQITIDVIELVNDNGIPGD
NLTNDVRPHFRVTVPGDVNEVRLSIDGGNTWVRATQGTAGIWDYTWPKDVTDGLHTLTVEATDKAGNKTTQTLDFTIDTR
LSTPTITMDSRDDTGAIGDHITSVKRPGFTIGNIDSDAQSVILRITQGGNSQEVTLTQVGGQWRFTPDADWADGSYTLTV
EVTDNAGNVRQSTPLIVTVDTQTSITDITLVNDHGVPDDNLTNSTRPQFEITVPADVNSVQLSIDGGANWVSAAQGIEGV
WGYTWPTDMGDGKHTLTVMVTDRAGNTATQTLEFFIDTRLSTPTIALDSTDDTGTPGDDMTNRTRPTFILQNIDSDVINV
TVSVTHNGTTTSFTATQGAGGWSFTPPAPWGDGDYTLTVTVEDRAGNTRPSTPLTVTVDTQIAIDHIELVNDSGVPGDNV
TKHVRPQFQISVPDDVEKVLLSIDGGTTWVTAIKSSTAGIWDYTWPTDMPEGQHTLTVEVTDGAGNKMTETLNFTIDITL
MTPTIELAPDQDTGQNKNDNLTSVTQPVFVLGSIDKDVRHVELSIEHNGTFKTVVLTESADGWRYRPDSALADGSYTFTV
TVTDVAGNQQTSAPLKVTIDGTLTTPVIELAAGEDSGTVGDRLTNHDRPVFDIRQVDSDVTRVMVKVTYNGKTHEEAAVF
TNGQWRFAPSASWADGSYQLAVVVEDLAGNVKESAPFEVRIDTTTTINNIVLLNDTGVQNDQLTNVAKPSFRIDVPGDVV
QVRVTLDGGANWNVIRKNADGQWIFDSPNTLVDGTYTLRVEATDEAGNIANKDLVFNIDTNIQVPTIALDAGQDTGANTA
DNITNISRPTFTIGNVDPDVIKVVVTIDGHDYNATKVGAGWQFTPGNAIPDGSYNITVTVEDKAGNTATSKPLPVVIDTT
AEIESVTLVTDSGDSDVDNITKVDKPQFSIVTADDITHVRVKIDNAANWIELTKGGDGRWIFNVGSALPDGQHTLLVDVT
DIAGNVAQETLQFTIDTTLREPTIVLDPTHDTGDDTNDNLTRINKPVFIIGNVDNDVSHIVVHIDGRDYTIENTGGNLTF
TPDQPLSDGQHTISVTVTDIAGNTKTSAELRIEIDTQVQIDSVTLTTDSGVNDHDNVTNATRPSFEIATPDDVTSVLVSF
DGVNWTPISKNAAGQWEFTAGSALPDGNYTLHVQATDRAGNTANSTLGFTVDTQIDGLSVVMLDDAGKDSTDGITNITSP
RFEISAREPLQSVTVILNGKSSTLTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKISKEVSFTIDTIVSDPSIDLLD
ADDTGESAVDNITSVTTPRFVIGNVPADIDTVVIRINGVSYPVTANGNNLWEFQVPVALNDGVYEAVVVFRDIAGNTSET
KLPFTIDTTTSVSVRMEPASDTGNSNSDNLTNKQNPKFEGTAEPNAKLVITIVDDKSGREVLKQTITVGADGNWSVTPNI
LPDGMYTINVVATDVAGNTAQTQERFTIDTVTIDPTIRLSDPSIDDQHEATSLRPEFKGFAEAFSTIMIQWDGKVVGSAN
ANANGEWSWTPPSVLAPGSYVVSIVAKDKAGNESSQVDFPVVIPVIDVTPPTIKLSEESDSGALGDFTTNNKTPTLIGST
LPNTIVSIYVDGVKVGEATADTAGRYTFQLSEMKDGHYVVQVGIVNPRDNSELRSTAVDVTIDTEVAELVWNISGMHEGG
YINTVTPEIGGTSEPNSKITIFVNGVEKAIAYTTGAGHWGVVLPALGNDGNYELTFKVEDVAGNIREFGPQNVILDTVIS
PLTVVLREADDSGKVGDWITNKSHVTIDGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAELDLREGSNAFVVVSEDKAG
NSQQKEILIEHDTQIEISDISLSRDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEASSSGNISYTMPAN
SADGEYQVQFVATDTAGNRVESAITTVTIDSQIAVFDIDEDSLPALSNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEA
DGTWRAPILLQDDGTFNIHFSITDVAGNTEVSKNYSVDVDSSTDFPTLNLEDASNSGSLDDLITNHNKPVLVGTAEAGAT
IHIYVDEKIVANVLVLEDGTWSYQFDNALKDGEYSIRVVAEDPAGNTAESPRLLVTIDTSTFIDNPAMVAGSDNGIFSND
SITSQTRPTFSIFGEMNQSVQIFIDGVLVDTITVTDRNQVYRPESPLGDGSHSIYYVITDKAGNTATSKTLNFTIDTFNT
TPVAIDSIGGQTLAEMTGSDGKIYITDTTRNLLFSGSAEPNSKIEIIINGLNVGEVWVNEKGHWQMPVNPLYFTEGQLDI
TVKSTDRGGNVNQEKYSIWVDTHIKVFTSELDDNKSSSKTEWWSNSDLITMRGTGEIGATVSLIVAGVTLATAVVAATGR
WELSTDKLPEGTYDISLVIEDSAGNRWEDVREIFIDRTPPNAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSEGNTYTLT
VPDNGKWSMAIPYPSEGKFTITSVDAIGNRSDDVPLDIMKEVPVISLSPDSDSGTVGDNITRDKQPTFIIGNLESDVVVV
QVDINGTVYNAEKNADGVWFFTPGTPLADGSYTISVIASDAAGNQKNSLPITVTIDSTLTVPEIALAAGEDNGASDSDNV
TNHTQPKFTLQHIDADVTGVTVNVTHNGVTDIYQATQGADGWTFTPPAAWNDGNYTLSVTVVDRAGNSQQSASLAVTVDS
TVTVTADSQHDDASDDATATAVTPPESETVNAESATHLRTVPSAAEESVVKETAYSITLLNADSGDEIDRSISQTPSFEI
SVPENIVNVSVMFEGEEFTLPITNQKAIFEVPLSLEDGEYTMDVKFIDKDDDFLIKEKTFSVDHSSADIVNAMNARGKTE
DDINDSPSTSSVGHNNNGAIDVFAVNEVTLPVDNQEEHA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
SC4140 YP_219127.1 inner membrane protein Not tested SPI-4 Protein 0.0 99
STM4261 NP_463126.1 inner membrane protein Not tested SPI-4 Protein 0.0 99
siiE CAE11797.1 large repetitive protein Virulence SPI-4 Protein 0.0 99

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
SPAB_05250 YP_001591360.1 hypothetical protein VFG0581 Protein 0.0 99