Gene Information

Name : SBG_3705 (SBG_3705)
Accession : YP_004732500.1
Strain : Salmonella bongori NCTC 12419
Genome accession: NC_015761
Putative virulence/resistance : Virulence
Product : large repetitive protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 4110308 - 4126978 bp
Length : 16671 bp
Strand : +
Note : the product of this CDS is composed of multiple degenerate repeats; note similarity to SBG3755 29.701% identity in 3313 aa overlap

DNA sequence :
ATGGGAAATAAAAACGTACAAAAATTTTTTGCCGATCAAAACTCTGTAATTGATCTGTCTTCTTTGGGTAATGCCAAAGG
CGCTAAGGTTTCTCTTTCCGGGCCAGACATGAACATTACCACTTCACGTGGTACTGTGATCATTGTTAACGGTGCGCTTT
ATTCAAGTATTAAAGGTAATAATCTCGCTGTTAAATTTAAAGATAAAACTATCACTGGCTCTAAAATCCTGGGCAGCGTA
GATTTAAAAGATATTCAACTGGAAAGAATTGACAGTTCGCTGGTTGACACTGCCCAGGTAGAAAAAAAAGGTAACGGCAA
GCAACGTAATAAAAAGGAAGACGAGGAATTAAAAAAGCAGCTTGACGAAGCTGAAAATGCTAAGAAAGAAGCGGACAAAG
CGAAGGAAGATGCAGAGAAAGCGAAAGATGCTGCAGAAAAAGCACTCAATGAGGCGTTTGAAGTCCAGAACGCTTCAAAG
CAAATAGAAGAGATGTTGCAGAACTTTTTGGCTGATAATGTAGCAAAAGACAATCTGGCTCAACAAAGTGATGCTGCTCA
ACAAAATACGCAGACTAAAGCAGCGCAGGCGCTTAAACAGGACGATGCAGAAAAAGTTACTCCTCAACCTGTTAATAAAA
ACACTGGCACAGGAAAAAGCAATAGCAGTAAAAATGAGGAAAATCAGTTCGAGGCTGAACCTGTCAAAGAGAAACTTAAA
GTCACATTGACGCTTGCTGGTGAGAGTAATAGCGGTAGTAAAGACGATAGTATAACTAATTTTACTAAACCACAGTTTGT
TGGCAGTACCGCCCCCAATGCGACGGTCATTATTAAAATGAATGGTATTTCTGTTGGCCAGGCTGTCGCTGATGGTTTGG
GCAACTTTACCTTCACGGTGTCTGAGGAATTGACTGACGGGACGTATAACCTGGAGGCTGAGGCGGCGACTGCAGATGCC
AGCGGTAGTACGAAACTTGTGTTTACTATCGATTCTGTTACCGATAAACCAACCTTTGAACTTGCTCCTGAAAGTAGTAT
TCCAGGTCATAAAGGCTTAACGCCGACTCTGACGCCTTCAATTGTGGGTACAGCGGAAGAGAATGCTAAAGTCGACATTT
ATGTCGGTAATAAACTGGTTGCCAGCGTTGATGTCGATAATGACGGAAAGTGGAGCTATGAGTTTAAAGATAATGAGTTA
ACAGAAGGCGAAAATAGTATTAAAGTTGTTGCCGTTGATAAAGCAGGTAATAAAAATGAAACGGCAGACAGTATTATAAC
TGATACTATTCCTCCGGAAAAACCAACGCTTGAGCTGGATGATAGCAGTGATTCCGGTGTTAAAGATGACGGTATTACGA
ACAGTACCTTACCGACATTTATCGGTGTGGCGGAGCCCGGTTCTACAGTCTCTCTCTATCTTGGGCTCAAACATCTGGGA
GATGTGATTGTTGCTAAAGATGGCTCATGGAGCTATACGCTTACCACACCGCTGAAAGATGGCGAATATAACTTAACCGC
AACCGCCACCGACATCGCCGGGCATACCTCTGAGACGACGACTTTGCCATTTACGATTGACACTCGTATCAGCTATTTCA
GTGCTGCGATTGATGCAGCTGATGACAGTGGTATTGTTGGCGATAATGTCACTAATAACGTTCGTCCAACCTTTACGGGT
AAAACCGAGCCAAATGCTGTTATTAGCGTCAGAAATATCGACACGGGTGAAGAGATTAGTTTTAAAGCGAATGACCAGGG
TGAATGGAAATTCGATTTTGCTTCAGACTCCGTTGAAGGTATTAATAATCTCATTTTTACAGTGGAAGATGTCGCTGGTA
ACAAAAAGGATTTTTCTTTTAGTTATATAATAGATACTGTCGCCCCTGTTGTTCCGACGATTTCTTTAGATGACTTTGTT
GTATTGCCGAATGGTATCATTTTATCAGGAAATGACTTGCCGACATTAGTCGGTACGGCAGAACCCAAATCCACCATCTT
ATTAATGCGAGATGGTAAACTTTATGACAGTATCGAAGTTGATTCAAACGGTACCTGGAATTATCAGTTCGATAAAAAAC
TCCTCCAGGGGGCGTATGATATTGAAATTGTCTCTCAGGATGCTGCCGGTAATAAATCCCCCTCTGTTAAATATTCTTTT
ACTATTCAAACCGATGTTGTGCTTCCAAAAGCTGAACTGGAAGACAGTGATGATTCTGGTGTGAAAGGTGACTGGATTAC
TAATCAATATAATGCCCTTACATTACTTGGTACCGCAGATAAGTTTGCTACTGTCAATATCCTGATTGATGGTAAAACGA
TTGGTGTGACAACGGCAGATGCAGATGGTAACTGGACTTTTGATATTTCTCGCAATCTGTCTGACAATGTTTATAAAATT
ACGGTTGAAGCTATCGATCCTTTAGGAAGAACGGCTTCCGTAGATTATCAGCTTACCATTGATAGCTTTACACCCATTCC
GACTGTCATGTTGCATGATAGCGCCGACTCTGGCGTTATAGGCGATATGATTACTAAGATTAATACACCGTTGTTCACCG
GGATAGCTGAAGCTAATGCTAAGGTGTCTATCTATATCGACGGCGTCTTAAGCGGCGAGGCTATTGCAGGTGATGATGGT
GTATGGAATTTCCAGTCTACCACCATTTTACCCGATGGTTCGCATAACGTAACGGTAAAGGTAGAGGATGTTGCCGGTAA
TATTGCCTCGTCATCAGCTTATAATTTTCAGATTATTACACAAACGCAAAAACCCACAATAGAGTTGGTCAACGATACGG
GAATTGATAACACTGACCATATTATTAATGAAAAGAGCCCTGCGCTGACAGGTACGGCTGCACCCTATTCAACCGTTAAA
TTATATATTGACGGTGTACTGTTCGCTGAAGTTAAAACAAATAAAGATGGCGTCTGGGGATATACCCTGAAACTCGACCA
GGGGCTGATTGATGGCGATTATAAAATTACTGCCACAGTTGAAGACGTCGCTGGCAACGTAGCGCACTCAGATCCGTTTT
CAATTAGCGTAGATACTACTATCTCAGTACCGGTAATTTCACTGAGTCCGGATTCAGACTCGGGAATTTCAAATGACAAT
TTGACGAACGTCGTTAAACCCACTCTGCATCTTAAAGATATTGATCCAGACGTCGCCAGTGTTCAGGTATGGGATGCGGT
ATCTAATAAGCAGATAGGCGTCGCTACGCAACAACCTGACGGAACCTGGGCCTATACTTTTACTTCAGATTTAACCGAAG
GTAAGCATCAGGTATATGTCAAGGTTGAAGATATTGCAGGTAATAAAGCGAGCAGCGCAGTATTTGATTTCACTATTGAT
AATACTATATCCACACCGGTTATTTCGTTGCTTCCCCGGGATGATACAGGGCTTAAAGGCGATGATCTGACCAATATCAA
TAAACCCGTCTTCGTTATTAACGGCGTTGATGTGGATGCGCATCGGGTCATCGTGCAGGTATTGCATAATGGCGTGACAC
AAAATATCGAACTCTCCCACAGTAATGGCAACTGGATATTTACACCAGGGGATGCCTGGGCGGATGGCAGTTACACGTTG
ACTGTGGAAGTTAAAGATAAGGCCGGGAATATCAGTCATTCAGCGCCGCTGACGGTGACGGTCGATACCCATATTGCCAT
TAATAATGTAGAGCTGGTCAACGACAACGGCGTCAAGGGCGACAATATGACTAACGACGCCCATCCGCAGTTCCGTGTTA
CGGTGCCGACGGACGTTAAAGAAGTCAGTCTGAGCATTGACGGTGGCGTGACCTGGGTTAAGGCGACACAGAGCGCGACG
CCGGGGGTGTGGAATTATACGTGGCCAACCACCGTGCCGGATGGCGACTACACGCTGGCAGTGAAAGCGACTGACAACGC
GGGTAATACGGTAACGGAGACGCTCCCCTTCACGATTGATACCACGTTGTCGACGCCGGTTATCGTACTGGATGACATGG
ATGACACTGGCGATAAGGGCGATAACATGACCAATCGCACCCAGCCGACATTTACCCTACAGCATATTGATGAAGACGCG
GTCAGCGTGAAGGTCAGCGTGGAGCATGGCGGTGTCTCCACCACATTTTACGCCACGAAAGGTGCGGGCGGATGGACCTT
TACGCCGACAGGGGCATGGACGGATGGTGATTATACCCTAAGTGTGTCGGTCGAAGATGCAGCTGGCAACACCAGCCAAT
CTGCGCCGCTGACGGTGACGGTAGACACGCAAATCGCCATTGATCGCATTGAAATGCTCAATGACAGAGGAATCCCCAAC
GATAATCTGACCAATGAAGTGCGTCCACACTTCCAGGTGAAGGTCCCGACGGATGTCAACCAGGTACGCCTGAGCATTGA
TGACGGCAATACATGGGTAACAGCAGTGCTGAAGTCAACCGGGGCTTGGGAATATATCTGGCCGGATGATATGGCTGATG
GTTCCTACACTCTGACAGTAGAGGCGACCGATGTGGCGGGCAATAAGACGACGCAGACGCTCGATTTCACCATTGATACC
ACGCTGTCAGAACCGACTATCACCCTGGATGACACGGATGACAGTGGAACAAAAGGCGATAACATCACCCACGTTAAAAC
ACCGGGATTTACGCTTCGCAACATTGATACCGATGCTCGCCGGGTAGTGGTGGAGGTCATGCACAATGGCAGTAAACAGG
AGATACCGCTGACTCAGTCCGGCGGAAAGTGGCACTTTACACCAACCAGCAACTGGATGGACGGTGACTATATCCTGACG
GTGAAAGTGGAAGACAGAGCCGGTAATGTGAAGGAGTCCGCGCCGTTGACAGTGACGGTGGACACACAAATCGCCATCAA
CAGTGTTGAACTGGTCAATGACACCAGTAATCCCAACGATAATCTGACTAAAGACGTGCGTCCACACTTCCAGGTGAAGG
TCCCGACGGATGTCAACGAAGTACGCCTGAGCATTGACGGCGGCAAGACTTGGGTGAAGGCAACCCAAAGCGCGACGCCG
GGCGTGTGGGATTACACCTGGCTGAGCGATGTGGGGGAGGGGAAACACACCCTGATAGTGGAAGCGACCGATGCGGCGGG
AAACAAGGCGACTGAGAGGCTTGATTTCACCATCGATACCACACTATCAGAACCGACGATCACGCTGGATAGCCTGGATG
ATAGTGCTGCTGGCGATAATATCACCAATGTTAAAACGCCAGGCTTTACTCTCGGCAATATTGACGCCGACGTGGCCAGC
GTGTCGGTAACGGTGACGCACAATGGTAAGAGTCAACAGGTAGATCTGATTCAGACCGGCGGACAGTGGCGCTTTACGCC
GGGTACAGCATGGGTCGATGGCGACTATACGCTGACGGTGAAGGTGGAAGATAAGGCGGGGAATATAAACTATTCTGCCC
CGTTGACAGTCACTATCGATACGCAAACGGCCATTGATCGTATTGAACTTATGAACGACACAAGTCTCGCTGGCAGTAAC
CTGACCAATGAATTGCGTCCACAGTTTCATATCGCCGTTCCGAAGGATGTGAACTCTGTTCAACTCAGTATTGATGGCGG
CGCCAATTGGGTTAACGCAACGCTAACTGCCGGTGGCGTTTGGGAATATGTCTGGCCGACGGATCTGGTCGAAGGAACGT
ATACGCTGACGGTGAAAGCGACCGATATCGCAGGCAATACGGCGACAGATACGCTGAATTTTACCATCGATAACACGCTG
TCGATACCGACTATCGCTCTGGATGCCATGGATGATACGGGTACTGGTAACGATAATACGACTAACGTTAAAACGCCGGG
CTTTATTATCGGCGGTGTTGATGCTGATGTGATTCAGGTTATCGTACAGATTGCGCACGATGGTGGCAGCGAGGAGGTGG
AGCTGACGCAGAGCGGCGGTCAGTGGCGTTTTACGCCGGGTGCCGCATGGACCGATGGCGACTATACCCTGACGGTAATA
GTAAAAGACGAAGCGGGAAATATTAGCCACTCAGCGCCGTTGACAGTCACCATCGATACCCAAATCGCCATTGATAACAT
TGAACTGATCAATGACAGCGGTATTCCTGACGATAATCTGACCAATGACGTGCGTCCACACTTCCAGGTGAAGGTCCCCA
CGGATGTCAACGAAGTACGCCTGAGCATTGACGGCGGCACGACCTGGGTGAAGGCCACCCAGAGCGCGACGAAAGGCGTC
TGGGATTACACCTGGCTGAGAGATGTGAGCGAGGGGACACACACCCTGACGGTGGAAGCGACCGATGCGGCAGGAAATAA
GACGACGCAGACGCTCGATTTCACCATTGATACCAAACTGTCAGAACCGACTATCACCCTGGATGACACGGATGACAGTG
AAACAAAAGGCGATAACCTGACCAACGTAAATAGGCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTATGTC
ACGGTTGAGGTGCAGCATGGCAGCACGAAAGAAGTGCTGACGGCCACCAAAGGCACGAACGGCGTCTGGAGCGTTATACC
GACCGGAACATGGGCAGACGGCAGTTATACGCTGACGGTGAGGGTGGAAGATAACGCGGAGAACGTAAAATACTCCGCGC
CGCTGACGGTGACAGTCGATACCCATGTTGCCATTAATAATGTAGAGCTGGTCAATGACAATGGCGTCAAGGGCGACAAT
ATGACTAACGACGCCCATCCGCAGTTCCGCGTTACGGTGCCGGTGGACGTTAAAGAAGTCAGTCTGAGCATTGACGGCGG
CACGACCTGGGTTAAGGCGACACAGAGCACGACGCAGGGGGTGTGGAGTTATACGTGGCCAGACATTGTGCCGGATGGCG
ACTACACGCTGGAGGTGAAAGCGACTGACAACGCGGGTAATACGGTAACAAAGAAGCTCGACTTCACGATTGATACCACG
TTGTCGACGCCGGTTATCGTACTGGATGATGTGGATGACACCGGTGACAAGGGCGATAACATAACCAATCACACCCAGCC
GACATTTACCCTGCAGCATATTGATAAAGACGCCGTCAGCGTGAAGATCAGCGTGGAGCATGGTGGTGTCTCCACTACAT
TTGACGCCACGAAAGGCGCGGGTGGATGGACCTTTACGCCGACAGGGGCATGGGCGGATGGTGATTACACTCTGACCGTA
TCCGTCGAAGATGTGGCTGGTAACACCAGTCAATCGGCGTCGCTGACGGTGACGGTGGACACGCAAATCTCCATCAATAA
TATTGAACTGATCAATGACAGCGGTATTACCAACGATAATCTGACTAATGATGTGCGTCCACACTTCCAGGTGAAGGTCC
CCACGGATGTCAACGAAGTACGCCTGAGCATTGACGGTGGCACGACCTGGGTGAAGGCCACCCAGAGCGCGACGAAAGGC
GTCTGGGATTACACCTGGCTGAGTGATGTGAGCGAGGGGAAACACACCCTGACGGTGGAAGCGACCGATGCGGCAGGAAA
TAAGACGACGCAGACGCTCGATTTCACCATTGATACCACGCTGTCAGAACCGACTATCACCCTGGATGACACGAATGACA
GTGGAACAAAAGGCGATAACCTGACCAACGTAAATAAGCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTAT
GTCACGGTTGAGGTGCAGCATGGCAGCACGAAAGAAGTGCTGACGGCCACCAAAGGCACGAACGGCGTCTGGAGCGTTAT
ACCGACCGGAACATGGGCAGACGGCAGTTATACGCTGACGGTGAGGGTGGAAGATAACGCGGAGAACGTAAAATACTCCG
CGCCGCTGACGGTGACAGTCGATACCCATATCAGCATTGATAATATTGAACTGGTTAATGACAACGGTACTCCAGGCGAT
AACCTGACCAATGAAGTTCGGCCGCAGTTCCGTGTCACGGTGCCGGGAGATGTCAATGAGGTACGTCTGAGTATCGACGG
CGGTAAGACGTGGGTTCCCGCTATGCAGGTCAAAGCAGGGATCTGGGATTACACCTGGCCGGAAGATGTAACCGACGGGT
TACACACCCTGGTGGTGGAGGCGGTCGATGCGGCGGGAAATAAGACGACGCAGACGCTCGAATTTACCATCGATACCCAG
CTGTCAACGCCGACCATCACGATGGATGGCAGGGATGATACAGGCATCACTGGCGATCATATTACGAGTGTCAAAACACC
AGCCTTTACCATTGGCAATATTGACGCCGATGCGAAATCGGTTGTTTTGCGGATCACCCAGGGCAGCAATAGCCAGGAAG
TGAAACTGACGCAGGTTGGAGGCCAGTGGCGCTTTACGCCTGATGCAGACTGGGCGGACGGTAGCTATACGCTTACGGTA
GAAGTCAAAGACAACGCAGGGAATATCCGCCAGTCCACGCCACTGGTGGTGACAGTGGACACGCAAACCAGTATTACTGA
TATTACATTGGTCAATGATAATGGCGAGCCTGATGACAATCTGACCAACAGCACCCGCCCACAGTTTGAGATCAAGGTGC
CGGTGGATGTGAACTCTGTGCAATTGAGCATTGATGGTGGCACAAACTGGGTTAACGCGGTGCAAGGCATCAAAGGTGTC
TGGGGCTATACCTGGCCTACGGAGATCGGCGATGGGAAACATATCCTGACCGTGATGGTCAAAGACACCGCGGGCAATAC
GGCTACCCAAACACTTGAATTTACTATCGATACCAAATTGTCGACGCCGACTATTGCGCTGGATGGCATGGATGATACCG
GTACGCCTGGTGATGGGATGACCAAAAAGACCCAGCCGACGTTTGTTCTGCAAAATATCGATTCAGATGTTGTCAAAGTC
ACAGTGAGTGTTACGCATAACGGGACGACAAGCACCTTTGCCGCGACGCAGGGAGCCGGTGGATGGTACTTTACGCCGTT
AACACCGTGGGGCGATGGTAATTATACGTTGACGGTAACAGCAGAAGATCGGGCGGGAAATACGCGTCCATCCACGCCAC
TGACAGTGACGGTGGATACGCAAGTTGCCATTAATCATATTGAATTGGTCAACGATAGCGGCGCCCCTGATATCAACCTG
ACGAAACATGTGCGTCCGCAGTTCCAGATCTCGGTACCTGAGGATGTCAACGAAGTACGCCTGAGCATTGACGGCGGCAC
GACCTGGGTTGCTGCCATTAAGAGTTCGACGGCTGGCATCTGGGATTACACCTGGCCGACGGATGTGCCTGAGGGAGAGC
ATGTCCTGACAGTGGAAGCGACCGATGCTGCGGGCAATACAATAAGACAAACGCTCACTTTCACCATCGACATCACGCTG
TCGACACCAACCATTGAGTTAGCGCCGGATCAGGATACCGGACAGAGTAAGAATGATAACCTGACCAGCGTTACTCAGCC
GGTATTTGTGTTGGGCCATATCGATAAAGATGTTCGACACGTGGAATTGAGTATTGAGCATAACGGCACGTTTAAAACGG
TGGTGCTTACCGAATCCGCCGATGGCTGGCGCTATCGACCGGACTCCGCTTTGGAGGACGGTAGCTACAAATTAACCGTG
ACGGTAACAGATGCAGCGGGCAACCAGCAGACCTCTGCGCCTTTAACGGTGACGATTGACGGCACATTGACGACACCGAC
GATTGAACTGGCACCTGGCGAAGACAGCAGTACTGTCGGCGATCGCCTCACTAACCACGATCGGCCTGTGTTCGATATAC
ACCAGATTGATTCTGACGTTACGCGCGTGATGGTTAAGGTCACTTACAACGGTAAAACGCATGAGGAAGCGGCGGTATTC
AGCAATGGTCAATGGCGCTTTACCCCTTCTGCGAGCTGGGCTGATGGCTCATATCAGTTAGCCGTTGTGGTGGAAGATCG
GGCGGGGAACGTAAAAGAATCCGCACCGTTAGAGGTGCGTATTGATACCACGACGACTGTTAACAATATCGTATTGCTTA
ATGACACCGGTGTGCAGAATGACCAATTAACGAATGTTGCCAAACCGTCATTCAGAATTGAAGTTCCTGCGGATGTCGTT
CAGGTACGCGTCACTCTGGATGGGGGCACTAGCTGGAGTCCGATACGCAAAAATGCCGACGGACAGTGGATTTTTGAAAG
CACGAATACCCTGGTTGACGGTACATATACCCTTCGCGTAGAGGCCACGGATGAGGCAGGGAATATTGCGAATAAAGATT
TAGTATTTAATATCGATACGACTATACAGGTGCCGACTATCGCTTTAGAGGCAGGACAAGATACCGGCGCGAATACCTCC
GATAATATCACCAATATTTCACGTCCTACCTTTGCGATTGGTAATGTTGATCCGGATGTTATCAAAGTCGTGGTGACAAT
TGATGGTCATAATTATAACGCGACTAAGGTTGGGTCTGGTTGGGCGTTTACGCCAGGCAATGCAATTCCTGATGGCGCTT
ATAATATTACTGTTACCGTTGAAGATAAGGCCGGGAATATTGCAACATCGAAACCATTACCTGTTGTGATTGATACGACG
GCTGAAATTAAAAGCGTAACGTTGGTGACAGATAGCGGCGACAGCACGGTAGATAATATTACTAACATCAATAAACCGCA
GTTTAGTATTGTTACCGCTGATGACATTGTCCAGGTGCGTGTTAAAGTCGATAACGCGGCTAATTGGATTGAACTTACAA
AAGGAGGGGATGGCCGCTGGATATTTAATACCAGTTCAGCATTACCGGATGGTCAGCATTCTCTGGTGGTTGACGTTGTT
GATATCGCCGGGAACGTTGCGCAAGAAACGCTGCAGTTTACGGTAGATACGACTCTGCGAGTACCGACAATTGTACTCGA
TCCTGGTCATGATACTGGCGATGATACTAATGATAATCTCACCAGAATTAACAAGCCGGTATTTATTATCGGTGATGTGG
ATAATGATGTCTCACACATTGTAGTTCGCATTGATGGCCGGGATTACACCATTGAAAACACCGGAGGAAAGTTAACCTTT
ACGCCAGATAAACCGCTATCCGATGGCCAGCATACGATCTCTGTTACCGTAACGGATATTGCCGGTAATACCAAAACATC
GGCCGAGCTACAGATTGAAATCGACACACAGGTTCAGATTGATAACGTGACGTTAACGACAGATAGTGGCATCAACGATC
ATGATAATGTCACCAATGCTAAACGTCCTTCTTTTGAAATTGAAACGCCTGCTGATGTGACGATAGTTCAGGTTTCTTTC
GATGGCGTAAACTGGACGCCCATCAGTAAAAACGCGGCCGGACAGTGGGAATTTACTGCTGGTAGCGAACTGTCTGATGG
TCATTATACACTCCATGTCCAGGCGACGGATCGAGCAGGAAACACGGCAAATTCCACGCTGGATTTCACCGTAGATACGC
AGATTAACGGACTTAGCGTCGTTATGCTGGATGACGCCGGAAAGGATACTGCAGACGGTATCACCAATATTACTTCCCCA
CGCTTTGAGATTTCGGCCGGAGAGCCGCTGCAAAGTGTGACGGTAATTTTGAATGGGAAATCCAGCACGTTGACTCAGGG
AGCGGGTAATAAATGGCTATTTACCCCTGACACTCCCTTAGTGGATGGAACTTACAAAATAGAAATTGTTGCTGAAGATA
TCGCAGGCAATAAGGTTAACAAAGAAGTCTCATTCACAATAGATACTATTATTTCTGATCCCAGTATTAACTTACTGGAT
GCGGATGATTCCGGCGAAAGCTCTGTTGATAATATTACCAATGTCACTAAACCACGTTTCGTCATTGGCAATGTCCCTGC
TGATATTGATACCGTTATTATCAGAATTAATGGCATTTCTTATCCGGTTACGGCAAATGGCAATAACCTCTGGGAATTTC
AGGTTCCCGTTGCGTTAAAAGATGGTGTATATGAAGCTGCCGTTGTCTTCAAAGATATTGCAGGAAATACTTCGGAAACG
AAATTACCCTTTACCATTGATACCACGACAAGTGTCACTGTAAGAATGGAGCCTGCATCTGATACCGGAAGCTCTAATAG
TGATAATCTGACTAATAAGCAAAACCCCAAATTCGAAGGCACTGCGGAGCCAAATGCGAAACTGGAGATTACCATTGTTG
ACGATGCGTCTAATGTGGTTCTAAAACAAACGGTTACAGTTGGCCCTGATGGCAACTGGAGTATTACACCGTCTCTACTG
GCGGATGGTACATATACGATTAACGTTACGGCGACAGATGTGGCGGGAAATACTGCGCAAACGCAGGAAAAATTCACTAT
CGATACCGTCACGACCGATCCGACCATTCGTCTTTCAGATCCGTCCGTCGATGATCAGCATGAAGCGACCAGCTTGCGTC
CTGAGTTTAAAGGTATCGCTGAAGCGTTTTCGACGATTATGATTAAGTGGGATGGCAAAGTTGTTGGCTCAGCGAACGCA
AATGCGAATGGCGACTGGAGCTGGACACCGCCGTCGGTATTAGCCCCTGGCTCCTATGTGGTGAGTATTGTTGCCAAAGA
TAAAGCGGGTAATGAATCCTCGCAGGTCGACTTTGCTGTTGTCATCCCCGTTATTGACGTAACACCTCCAACGATAAAGC
TCAGTGATGAAAGTGATACCGGGCCTTTAGGAGACTTTACGACCAGTAATAAAACGCCGACTCTGATAGGGAACACATTA
CCTAATACGATTGTGAGTATTTATGTTGATGGTCTGAAGGTCGGCGAGGCGACAGCGGATACTGCCGGTCGATATACCTT
CCAGCTGCCGGAAATGAATGACGGCCAGTATGTCGTTCAGGTCGGTATCATCAATCCTCGCGATCATAGCGAACTGCGTT
CCACGGCCGTTGATGTCACCATTGATACTCAGGTTGCTGAACTGGTATGGAATGTATCCGGCATGCATGAGGGCGGATAC
ATTAACACGGTGACGCCAGAGATTGGCGGCACCAGTGAGCCAAACAGTAAGGTTATTATCCTTGTGAATGGCGTTGAAAA
AGCGATTGCTTATACCACAGGAACAGGTCACTGGGGGGTTGTATTACCCGCTTTGGGTAATGACGGTAATTATGTATTAA
CCTTTAGGGTTGAAGATGTTGCCGGAAATACTAAAGAGTTTGGCCCGCAGCACATCATACTGGATACGGTCATTGCTCCG
ATGACAGTGGAATTACGTGAAATAGATGACAGTGGCAAAATTGGCGACTGGATCACCAAAAAATCTCATGTCACTCTTGA
GGGTACTGCCGAAGCAGGAAGTACATTAACCATCCGCAATCCGCAGGGCGTGGTTATTGCTACCCTGGTGGTAGGAAATG
ATGGTCGATGGAGCGCGGAAGTCGATCTGCGTGAAGGTAGCAACGCCTTTGTCGTTATATCGGAAGATAAAGCAGGTAAC
AGCCAACAAAAAGAAATCCTGATCGAACATGATACACAGATTGAAATCAGCGATATTTCATTAAGCCGGGATACGAACAG
CGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTGCTGGTTGCTATGACCGACCCCGGCGCAACGGTACAGG
TTTATATTAATGGCGTGTTACAAGGCACGGTTGAGGCAAACTCATCAGGTAATATTAGCTATACCATGCCGGCAAATAGT
GCTGACGGCGAGTATCAGGTGCAATTTGTTGCTACAGATATCGCTGGCAACCGGGTTGAATCTGCGGTTACAACCGTGAC
AATTGATTCTCAAATCGCAGTCTTTGACATTGATGAAAATACATTACCAGCTATCTCTAATAACCGGGCGCTGTCAGTCT
CCGGCGTAGGGGAGGCTGGTTCACAGGTCAGCATTTTTGTCGATGGTAAATTAGTCAACGTTGTTATGGTGGAGGCTGAT
GGCTCGTGGAGTGCGCCAATACTGCTACAAGATGACGGTACGTTTAATATTCATTTCAGCATTACTGACGTTGCCGGAAA
CACTGAAGTCAGTAAGAATTATAGCGTGGATGTCGATTCATCAACTGCCTTCCCAACGCTCAACCTTGATGAGTTGAGCA
ACTCAGGTTCACATGACGATCTGATCACTAATCATAACAAGCCAGTGTTAACTGGTACCGCAGAAGCGGGAGCAACAATC
CATATTTATGTGGATGAAAAGATTGTGGCAAATGTTGTTGTGCTTGAGGATGGAACCTGGTCCTATCAGTTTGATAATGC
CTTAAAAGACGGGGAATATTCTATTCGCGTGGTTGCCGAGGACCTTGCGGGTAATACGGCAGAATCGCCTCGCTTAATCG
TTACGATAGATACCAGCACATACATTGATCCGCCTGCACTGGCTCCCGGGTCTGATAATGGCATGTTCATTAACGACGGT
ATCACAAGTCAAACCCGGCCTAAGTTTAGTATCAACGGTGAGTTTAATCAGAGTGTCCAAATCTACATTGATGGGAAGCT
CGTCGATACGGTAACCGTGACGGACAGAAACCAGGTTTATCAACCTGCGATTCCTTTGGGTGATGGTACCCATAGTATTC
ATTACGTTATCACTGATAAAGCGGGCAACACAGCCACATCGAAACCCCTAAGCTTTACGGTAGATACTACTAATACAACG
CCTGTCCTGATTGATTCTATCGATGGCCAAACGTTAGCCGAAATGACCGCCAGTGATGGGAAGATATATATAACAGATAC
AACACATAACCTGATGTTTAGTGGGAGTGCTGAGCCCGATAGTTTAATAGAGTTAACTATTAATGGACTAGATGTAGGGA
AGATTTGGGTTGACAATACAGGAAAATGGCAGATGCCTGTCAATCCCGTTTATCTCTCGCAAGGTCTTCTGGATATAAAT
GTCAAATCTACGGACCGTGGCGGTAACGTAAATCAGGAAAACTATTCCATTTGGGTTGATACGATGATCCAGGAGTTTAC
CAGCGAGCTTGATGACAATAAGTCGTTGTCGAAAACGGACTGGTGGAGTAATAGCGCTCTTATTACCATGAGAGGTATGG
GTGAAATTGGCGCTACGGTATCATTAATAGTGGCAGGGGTCACGCTGGCAACCGCTGTCGTTGCAGCTAATGGGCAGTGG
GAATTATCGACCGATAAGCTTCCGGAAGGGAAATACGATATCACTTTGAGTATTGAGGATAACGCAGGCAACCGTAAGGA
AGAGGTACATGAAATATTTATTGATCGAACGCCGCCGAGTGCGCCTGTCGTAACGTATTCAGACATAGTTAACGATCTGA
TTATTATGCAGGGAACGGCGGAAGCCAAATCACAGCTAATAATAACCGATAGCGAGGGAAATACTTATACGCTCACGGTT
CCTGATAATGGTAACTGGAGTACGGCAATACCGTACCCATCGGAAGGGAAGTTCACCATTACGAGCGTGGATGCGATGGG
TAACAAGAGCGATGTACTTTCTCTCGATATAATGAAAGACGTGCCTGTTATTTCATTAGCGGTAGACTCGGATGGTAATA
TAGTAGGCGATAATATTACGCAAGATAATCAACCCACCTTTATTATCGGGAACCTGGAAAGCGATGTGGTCACTGTTCAG
GTCGATATCAATGGGACCTTATATAATGCTGAACAACGCGCTGATGGCGTTTGGTTCTTTACGCCAGGTACCGCGCTAGC
CGACGGTTCCTATACCATATCGGTCATTGCGAGTGACGCCGCAGGTAATAAGAAAAACTCATTACCGATTACCGTCACGA
TCGACAGTACGCTGACGGTGCCGGAGATTGCGCTGGCGGCAGGTGAAGACAATGGCGCTTCAGACAGCGATAACGTGACG
AATCATACCCAGCCTAAGTTCACGTTGCAGCATATTGATGCTGATGTGACCGGGGTGACCATAAATGTGGCGCATAGTGG
AGGGACAGACACCTACCAGGCAACGCAGAGTGCGGATGGCTGGACCTTCACGCCGCCGGTCGCATGGAATGATGGCACAT
ACACATTGAGCGTAACGGTGGTAGATGATGCCGGGAATAAAAAGCATTCTGCCTCGCTGACGGTAACGGTTGATTCAACG
GTAACAGTAGCGACGAATGCGTTAAGCGGCCATAGTGATACCGACACACTAACGGACGTTATACAATCTGAGCCCGAAAC
GAAGAATGCTGAAAGTGATACACATGCTCGTACCGGGATGCCTGCGGCTGAAGAAAGCACAGCAGCGGAGGAGGCATATA
ACATTACATTGTTAAATGCTGACGCCGGAGATGAAACAGAACGTTCGATTAGCCAGACACCTTCTTTTGAAATCTCTGTG
CCAGAAAATATTGTTAACGTGAGTGTCATGTTCGAAGGAGAAGAATTTACTCTGCCGATAATTAACCACAAAGCAATATT
CGAAGTTCCATTATCTTTAGAAGATGGTGAATATACTATGGATGTGAAATTCCTTGATAAGGACGATGATTACCTCATCA
AGGAGAAAACATTCTCCGTTGATCAGTCTTCTGCTGATATTGTGAATGCAATGAACGCAAGAGGAAAAACGGAAGATGAT
ATTAATGATTCCCCTTCAGCGAGTTCTGTAGGGCATAATAATGGTGCAATTGAGGCTTTCACCGTTAATGAAGTTACGCT
CCCTGTAGATAATCAAGAAGAATACGCATAA

Protein sequence :
MGNKNVQKFFADQNSVIDLSSLGNAKGAKVSLSGPDMNITTSRGTVIIVNGALYSSIKGNNLAVKFKDKTITGSKILGSV
DLKDIQLERIDSSLVDTAQVEKKGNGKQRNKKEDEELKKQLDEAENAKKEADKAKEDAEKAKDAAEKALNEAFEVQNASK
QIEEMLQNFLADNVAKDNLAQQSDAAQQNTQTKAAQALKQDDAEKVTPQPVNKNTGTGKSNSSKNEENQFEAEPVKEKLK
VTLTLAGESNSGSKDDSITNFTKPQFVGSTAPNATVIIKMNGISVGQAVADGLGNFTFTVSEELTDGTYNLEAEAATADA
SGSTKLVFTIDSVTDKPTFELAPESSIPGHKGLTPTLTPSIVGTAEENAKVDIYVGNKLVASVDVDNDGKWSYEFKDNEL
TEGENSIKVVAVDKAGNKNETADSIITDTIPPEKPTLELDDSSDSGVKDDGITNSTLPTFIGVAEPGSTVSLYLGLKHLG
DVIVAKDGSWSYTLTTPLKDGEYNLTATATDIAGHTSETTTLPFTIDTRISYFSAAIDAADDSGIVGDNVTNNVRPTFTG
KTEPNAVISVRNIDTGEEISFKANDQGEWKFDFASDSVEGINNLIFTVEDVAGNKKDFSFSYIIDTVAPVVPTISLDDFV
VLPNGIILSGNDLPTLVGTAEPKSTILLMRDGKLYDSIEVDSNGTWNYQFDKKLLQGAYDIEIVSQDAAGNKSPSVKYSF
TIQTDVVLPKAELEDSDDSGVKGDWITNQYNALTLLGTADKFATVNILIDGKTIGVTTADADGNWTFDISRNLSDNVYKI
TVEAIDPLGRTASVDYQLTIDSFTPIPTVMLHDSADSGVIGDMITKINTPLFTGIAEANAKVSIYIDGVLSGEAIAGDDG
VWNFQSTTILPDGSHNVTVKVEDVAGNIASSSAYNFQIITQTQKPTIELVNDTGIDNTDHIINEKSPALTGTAAPYSTVK
LYIDGVLFAEVKTNKDGVWGYTLKLDQGLIDGDYKITATVEDVAGNVAHSDPFSISVDTTISVPVISLSPDSDSGISNDN
LTNVVKPTLHLKDIDPDVASVQVWDAVSNKQIGVATQQPDGTWAYTFTSDLTEGKHQVYVKVEDIAGNKASSAVFDFTID
NTISTPVISLLPRDDTGLKGDDLTNINKPVFVINGVDVDAHRVIVQVLHNGVTQNIELSHSNGNWIFTPGDAWADGSYTL
TVEVKDKAGNISHSAPLTVTVDTHIAINNVELVNDNGVKGDNMTNDAHPQFRVTVPTDVKEVSLSIDGGVTWVKATQSAT
PGVWNYTWPTTVPDGDYTLAVKATDNAGNTVTETLPFTIDTTLSTPVIVLDDMDDTGDKGDNMTNRTQPTFTLQHIDEDA
VSVKVSVEHGGVSTTFYATKGAGGWTFTPTGAWTDGDYTLSVSVEDAAGNTSQSAPLTVTVDTQIAIDRIEMLNDRGIPN
DNLTNEVRPHFQVKVPTDVNQVRLSIDDGNTWVTAVLKSTGAWEYIWPDDMADGSYTLTVEATDVAGNKTTQTLDFTIDT
TLSEPTITLDDTDDSGTKGDNITHVKTPGFTLRNIDTDARRVVVEVMHNGSKQEIPLTQSGGKWHFTPTSNWMDGDYILT
VKVEDRAGNVKESAPLTVTVDTQIAINSVELVNDTSNPNDNLTKDVRPHFQVKVPTDVNEVRLSIDGGKTWVKATQSATP
GVWDYTWLSDVGEGKHTLIVEATDAAGNKATERLDFTIDTTLSEPTITLDSLDDSAAGDNITNVKTPGFTLGNIDADVAS
VSVTVTHNGKSQQVDLIQTGGQWRFTPGTAWVDGDYTLTVKVEDKAGNINYSAPLTVTIDTQTAIDRIELMNDTSLAGSN
LTNELRPQFHIAVPKDVNSVQLSIDGGANWVNATLTAGGVWEYVWPTDLVEGTYTLTVKATDIAGNTATDTLNFTIDNTL
SIPTIALDAMDDTGTGNDNTTNVKTPGFIIGGVDADVIQVIVQIAHDGGSEEVELTQSGGQWRFTPGAAWTDGDYTLTVI
VKDEAGNISHSAPLTVTIDTQIAIDNIELINDSGIPDDNLTNDVRPHFQVKVPTDVNEVRLSIDGGTTWVKATQSATKGV
WDYTWLRDVSEGTHTLTVEATDAAGNKTTQTLDFTIDTKLSEPTITLDDTDDSETKGDNLTNVNRPTFLLGNIDADARYV
TVEVQHGSTKEVLTATKGTNGVWSVIPTGTWADGSYTLTVRVEDNAENVKYSAPLTVTVDTHVAINNVELVNDNGVKGDN
MTNDAHPQFRVTVPVDVKEVSLSIDGGTTWVKATQSTTQGVWSYTWPDIVPDGDYTLEVKATDNAGNTVTKKLDFTIDTT
LSTPVIVLDDVDDTGDKGDNITNHTQPTFTLQHIDKDAVSVKISVEHGGVSTTFDATKGAGGWTFTPTGAWADGDYTLTV
SVEDVAGNTSQSASLTVTVDTQISINNIELINDSGITNDNLTNDVRPHFQVKVPTDVNEVRLSIDGGTTWVKATQSATKG
VWDYTWLSDVSEGKHTLTVEATDAAGNKTTQTLDFTIDTTLSEPTITLDDTNDSGTKGDNLTNVNKPTFLLGNIDADARY
VTVEVQHGSTKEVLTATKGTNGVWSVIPTGTWADGSYTLTVRVEDNAENVKYSAPLTVTVDTHISIDNIELVNDNGTPGD
NLTNEVRPQFRVTVPGDVNEVRLSIDGGKTWVPAMQVKAGIWDYTWPEDVTDGLHTLVVEAVDAAGNKTTQTLEFTIDTQ
LSTPTITMDGRDDTGITGDHITSVKTPAFTIGNIDADAKSVVLRITQGSNSQEVKLTQVGGQWRFTPDADWADGSYTLTV
EVKDNAGNIRQSTPLVVTVDTQTSITDITLVNDNGEPDDNLTNSTRPQFEIKVPVDVNSVQLSIDGGTNWVNAVQGIKGV
WGYTWPTEIGDGKHILTVMVKDTAGNTATQTLEFTIDTKLSTPTIALDGMDDTGTPGDGMTKKTQPTFVLQNIDSDVVKV
TVSVTHNGTTSTFAATQGAGGWYFTPLTPWGDGNYTLTVTAEDRAGNTRPSTPLTVTVDTQVAINHIELVNDSGAPDINL
TKHVRPQFQISVPEDVNEVRLSIDGGTTWVAAIKSSTAGIWDYTWPTDVPEGEHVLTVEATDAAGNTIRQTLTFTIDITL
STPTIELAPDQDTGQSKNDNLTSVTQPVFVLGHIDKDVRHVELSIEHNGTFKTVVLTESADGWRYRPDSALEDGSYKLTV
TVTDAAGNQQTSAPLTVTIDGTLTTPTIELAPGEDSSTVGDRLTNHDRPVFDIHQIDSDVTRVMVKVTYNGKTHEEAAVF
SNGQWRFTPSASWADGSYQLAVVVEDRAGNVKESAPLEVRIDTTTTVNNIVLLNDTGVQNDQLTNVAKPSFRIEVPADVV
QVRVTLDGGTSWSPIRKNADGQWIFESTNTLVDGTYTLRVEATDEAGNIANKDLVFNIDTTIQVPTIALEAGQDTGANTS
DNITNISRPTFAIGNVDPDVIKVVVTIDGHNYNATKVGSGWAFTPGNAIPDGAYNITVTVEDKAGNIATSKPLPVVIDTT
AEIKSVTLVTDSGDSTVDNITNINKPQFSIVTADDIVQVRVKVDNAANWIELTKGGDGRWIFNTSSALPDGQHSLVVDVV
DIAGNVAQETLQFTVDTTLRVPTIVLDPGHDTGDDTNDNLTRINKPVFIIGDVDNDVSHIVVRIDGRDYTIENTGGKLTF
TPDKPLSDGQHTISVTVTDIAGNTKTSAELQIEIDTQVQIDNVTLTTDSGINDHDNVTNAKRPSFEIETPADVTIVQVSF
DGVNWTPISKNAAGQWEFTAGSELSDGHYTLHVQATDRAGNTANSTLDFTVDTQINGLSVVMLDDAGKDTADGITNITSP
RFEISAGEPLQSVTVILNGKSSTLTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKVNKEVSFTIDTIISDPSINLLD
ADDSGESSVDNITNVTKPRFVIGNVPADIDTVIIRINGISYPVTANGNNLWEFQVPVALKDGVYEAAVVFKDIAGNTSET
KLPFTIDTTTSVTVRMEPASDTGSSNSDNLTNKQNPKFEGTAEPNAKLEITIVDDASNVVLKQTVTVGPDGNWSITPSLL
ADGTYTINVTATDVAGNTAQTQEKFTIDTVTTDPTIRLSDPSVDDQHEATSLRPEFKGIAEAFSTIMIKWDGKVVGSANA
NANGDWSWTPPSVLAPGSYVVSIVAKDKAGNESSQVDFAVVIPVIDVTPPTIKLSDESDTGPLGDFTTSNKTPTLIGNTL
PNTIVSIYVDGLKVGEATADTAGRYTFQLPEMNDGQYVVQVGIINPRDHSELRSTAVDVTIDTQVAELVWNVSGMHEGGY
INTVTPEIGGTSEPNSKVIILVNGVEKAIAYTTGTGHWGVVLPALGNDGNYVLTFRVEDVAGNTKEFGPQHIILDTVIAP
MTVELREIDDSGKIGDWITKKSHVTLEGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAEVDLREGSNAFVVISEDKAGN
SQQKEILIEHDTQIEISDISLSRDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEANSSGNISYTMPANS
ADGEYQVQFVATDIAGNRVESAVTTVTIDSQIAVFDIDENTLPAISNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEAD
GSWSAPILLQDDGTFNIHFSITDVAGNTEVSKNYSVDVDSSTAFPTLNLDELSNSGSHDDLITNHNKPVLTGTAEAGATI
HIYVDEKIVANVVVLEDGTWSYQFDNALKDGEYSIRVVAEDLAGNTAESPRLIVTIDTSTYIDPPALAPGSDNGMFINDG
ITSQTRPKFSINGEFNQSVQIYIDGKLVDTVTVTDRNQVYQPAIPLGDGTHSIHYVITDKAGNTATSKPLSFTVDTTNTT
PVLIDSIDGQTLAEMTASDGKIYITDTTHNLMFSGSAEPDSLIELTINGLDVGKIWVDNTGKWQMPVNPVYLSQGLLDIN
VKSTDRGGNVNQENYSIWVDTMIQEFTSELDDNKSLSKTDWWSNSALITMRGMGEIGATVSLIVAGVTLATAVVAANGQW
ELSTDKLPEGKYDITLSIEDNAGNRKEEVHEIFIDRTPPSAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSEGNTYTLTV
PDNGNWSTAIPYPSEGKFTITSVDAMGNKSDVLSLDIMKDVPVISLAVDSDGNIVGDNITQDNQPTFIIGNLESDVVTVQ
VDINGTLYNAEQRADGVWFFTPGTALADGSYTISVIASDAAGNKKNSLPITVTIDSTLTVPEIALAAGEDNGASDSDNVT
NHTQPKFTLQHIDADVTGVTINVAHSGGTDTYQATQSADGWTFTPPVAWNDGTYTLSVTVVDDAGNKKHSASLTVTVDST
VTVATNALSGHSDTDTLTDVIQSEPETKNAESDTHARTGMPAAEESTAAEEAYNITLLNADAGDETERSISQTPSFEISV
PENIVNVSVMFEGEEFTLPIINHKAIFEVPLSLEDGEYTMDVKFLDKDDDYLIKEKTFSVDQSSADIVNAMNARGKTEDD
INDSPSASSVGHNNGAIEAFTVNEVTLPVDNQEEYA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
siiE CAE11797.1 large repetitive protein Virulence SPI-4 Protein 0.0 86
STM4261 NP_463126.1 inner membrane protein Not tested SPI-4 Protein 0.0 86
SC4140 YP_219127.1 inner membrane protein Not tested SPI-4 Protein 0.0 86

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
SBG_3705 YP_004732500.1 large repetitive protein VFG0581 Protein 0.0 86