Gene Information

Name : A464_4254 (A464_4254)
Accession : YP_008324847.1
Strain : Salmonella bongori N268-08
Genome accession: NC_021870
Putative virulence/resistance : Virulence
Product : Large repetitive protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 4279288 - 4295958 bp
Length : 16671 bp
Strand : +
Note : -

DNA sequence :
ATGGGAAATAAAAACGTACAAAAATTTTTTGCCGATCAAAACTCTGTAATTGATCTGTCTTCTTTGGGTAATGCCAAAGG
CGCTAAGGTTTCTCTTTCCGGGCCAGACATGAACATTACCACTTCACGTGGTACTGTGATCATTGTTAACGGTGCGCTTT
ATTCAAGTATTAAAGGTAATAATCTCGCTGTTAAATTTAAAGATAAAACTATCACTGGCTCTAAAATCCTGGGCAGCGTA
GATTTAAAAGATATTCAACTGGAAAGAATTGACAGTTCGCTGGTTGACACTGCCCAGGTAGAAAAAAAAGGTAACGGCAA
GCAACGTAATAAAAAGGAAGACGAGGAATTAAAAAAGCAGCTTGACGAAGCTGAAAATGCTAAGAAAGAAGCGGACAAAG
CGAAGGAAGATGCCGAGAAAGCGAAAGATGCTGCAGAAAAAGCACTCAATGAGGCGTTTGAAGTCCAGAACGCTTCAAAG
CAAATAGAAGAGATGTTGCAGAACTTTTTGGCTGATAATGTAGCAAAAGACAATCTGGCTCAACAAAGTGATGCTGCTCA
ACAAAATACGCAGACTAAAGCAGCGCAGGCGCTTAAACAGGACGATGCAGAAAAAGTTACTCCTCAACCTGTTAATAAAA
ACACTGGCACAGGAAAAAGCAATAGCAGTAAAAATGAGGAAAATCAGTTCGAGGCTGAACCTGTCAAAGAGAAACTTAAA
GTCACATTGACGCTTGCTGGTGAGAGTAATAGCGGTAGTAAAGACGATAGTATAACTAATTTTACTAAACCACAGTTTGT
TGGCAGTACCGCCCCCAATGCGACGGTCATTATTAAAATGAATGGTATTTCTGTTGGCCAGGCTGTCGCTGATGGTTTGG
GCAACTTTACCTTCACGGTGTCTGAGGAATTGACTGACGGGACGTATAACCTGGAGGCTGAGGCGGCGACTGCAGATGCC
AGCGGTAGTACGAAACTTGTGTTTACTATCGATTCTGTTACCGATAAACCAACCTTTGAACTTGCTCCTGAAAGTAGTAT
TCCAGGTCATAAAGGCTTAACGCCGACCCTGACGCCTTCAATTGTGGGTACAGCGGAAGAGAATGCTAAAGTCGACATTT
ATGTCGGTAATAAACTGGTTGCCAGCGTTGATGTCGATAAAGACGGAAAGTGGAGCTATGAATTTAAAGATAATGAGTTA
ACAGAAGGCGAAAATAGTATTAAAGTTGTTGCCGTTGATAAAGCAGGTAATAAAAATGAAACGGCAGACAGTATTATAAC
TGATACTATTCCTCCGGAAAAACCAACGCTTGAGCTGGATGATAGCAGTGATTCCGGTGTTAAAGATGACGGTATTACGA
ACAGTACCTTACCGACATTTATCGGTGTGGCGGAGCCCGGTTCTACAGTCTCTCTCTATCTTGGGCTCAAACATCTGGGA
GATGTGATTGTTGCTAAAGATGGCTCATGGAGCTATACGCTTACCACACCGCTGAAAGATGGCGAATATAACTTAACCGC
AACCGCCACCGACATCGCCGGGCATACCTCTGAGACGACGACTTTGCCATTTACGATTGACACTCGTATCAGCTATTTCA
GCGCTGCGATTGATGCAGCTGATGACAGTGGTATTGTTGGCGATAATGTCACTAATAACGTTCGTCCAACCTTTACGGGT
AAAACCGAGCCAAATGCTGTTATTAGCGTCAGAAACATCGACACGGGTGAAGAGATTAGTTTTAAAGCGAATGACCAGGG
GGAATGGAAATTCGACTTTGCTTCAGACTCCGTTGAAGGTATTAATAATCTTATTTTTACAGTGGAAGATGTCGCTGGTA
ACAAAAAGGATTTTTCTTTTAGTTATATAATAGATACTGTCGCCCCTGTTGTTCCGACGATTTCTTTAGATGACTTTGTT
GTATTGCCGAATGGTATCATTTTATCAGGAAATGACTTGCCGACATTAGTCGGTACGGCAGAACCCAAATCCACCATCTT
ATTAATGCGAGATGGTAAACTTTATGACAGTATCGAAGTTGATTCAAACGGTACCTGGAATTATCAGTTCGATAAAAAGC
TCCTCCAGGGGGCGTATGATATTGAAATTGTCTCTCAGGATGCTGCCGGTAATAAATCCCCCTCTGTTAAATATTCTTTT
ACTATTCAAACCGATGTTGTGCTTCCAAAAGCTGAACTGGAAGACAGTGATGATTCTGGTGTGAAAGGTGACTGGATTAC
TAATCAATATAATGCCCTTACATTACTTGGTACCGCAGATAAGTTTGCTACTGTCAATATCCTGATTGATGGTAAAACGA
TTGGTGTGACAACGGCAGATGCAGATGGTAACTGGACTTTTGATATTTCTCGCAATCTGTCTGACAATGTTTATAAAATT
ACGGTTGAAGCTATCGATCCTTTAGGAAGAACGGCTTCCGTAGATTATCAGCTTACCATTGATAGCTTTACACCCATTCC
GACTGTCATGTTGCATGATAGCGCCGACTCTGGCGTTATAGGCGATATGATTACTAAGATTAATACACCGTTGTTCACCG
GGATAGCTGAAGCTAATGCTAAGGTGTCTATCTATATCGACGGCGTCTTAAGCGGCGAGGCTATTGCAGGTGATGATGGT
GTATGGAATTTCCAGTCTACCACCATTTTACCCGATGGTTCGCATAACGTAACGGTAAAAGTAGAGGATGTTGCCGGTAA
TATTGCCTCGTCATCAGCTTATAATTTCCAGATTATTACACAAACGCAAAAACCCACAATAGAGTTGGTCAACGATACGG
GAATTGATAGCACTGACCATATTATTAATGAAAAGAGTCCTGCGCTGACAGGTACGGCTGCACCCTATTCAACCGTTAAA
TTATATATTGACGGTGTACTGTTCGCTGAAGTTAAAACAAATAAAGATGGCGTCTGGGGATATACCCTGAAACCCGACCA
GGGGCTGATTGATGGCGATTATAAAATTACTGCCACAGTTGAAGACGTCGCTGGCAACGTGGCGCACTCAGATCCGTTTT
CAATTAGCGTAGATACTACTATCTCAGTACCGGTAATTTCACTGAGTCCCGATTCAGATTCGGGAATTTCAAATGACAAT
TTGACGAACGTCGTTAAACCCACTCTGCATCTTAAAGATATTGATCCAGACGTCGCCAGTGTTCAGGTATGGGATGCGGT
ATCTAATAAGCAGATAGGCGTCGCTACGCAACAACCTGACGGAACCTGGGCCTATACTTTTACTTCAGATTTAACTGAAG
GCAAGCATCAGGTATATGTCAAGGTTGAAGATATTGCAGGTAATAAAGCGAGCAGCGCAGTATTTGATTTCACTATTGAT
AATACTATATCCACACCGGTTATTTCGTTGCTTCCCCGGGATGATACAGGGCTTAAAGGCGATGATCTGACCAATATCAA
TAAACCCGTCTTCGTTATTAACGGCGTTGATGTGGATGCGCATCGGGTCATCGTGCAGGTGTTGCATAATGGCGTGACCC
AAAAAATCGAACTCTCCCACAGTAATGGCAACTGGATATTTACACCAGGGGATGCCTGGGCGGATGGCAGTTACACGTTG
ACTGTGGAAGTTAAAGATAAGGCCGGGAATATCAGTCATTCAGCGCCGCTGACGGTGACGGTCGATACCCATATTGCCAT
TAATAATGTAGAGCTGGTCAACGACAACGGCGTCAAGGGCGACAATATGACTAACGACGCCCATCCGCAGTTCCGTGTTA
CGGTGCCGGCGGACGTTAATGAAGTCAGTCTGAGCATTGACGGCGGCACGACCTGGGTTAAGGCGACACAGAGCACGACG
CCGGGGGTGTGGAATTATACGTGGCCAACCACCGTGCCGGATGGCGACTACACGCTGGCAGTGAAAGCGACTGACAACGC
GGGTAATACGGTAACGGAGACGCTCCCCTTCACGATTGATACCACGTTGTCGACGCCGGTTATCGTACTGGATGACATGG
ATGACACCGGCGATAAGGGCGATAACATGACCAATCGCACCCAGCCGACATTTACCCTGCAGCATATTGATGAAGACGCG
GTCAGCGTGAAGGTCAGCGTGGAGCATGGCGGTGTCTCCACCACATTTTACGCCACGAAAGGTGCGGGCGGATGGACCTT
TACGCCGACAGGGGCATGGACGGATGGTGATTATACCCTAAGTGTGTCGGTCGAAGATGCAGCTGGCAACACCAGCCAAT
CTGCGCCGCTGACGGTGACGGTAGACACGCAAATCGCCATTGATCGCATTGAAATGCTCAATGACAGAGGAATCCCCAAC
GATAATCTGACCAATGAAGTGCGTCCACACTTCCAGGTGAAGGTCCCGACGGATGTCAACCAGGTACGCCTGAGCATTGA
TGACGGCAATACATGGGTAACAGCAGTGCTGAAGTCAACCGGGGCTTGGGAATATATCTGGCCGGATGATATGGCTGATG
GTTCCTACACTCTGACAGTGGAGGCGACCGATGTGGCGGGCAATAAAACGACGCAGACGCTCGATTTCACCATTGATACC
ACGCTGTCAGAACCGACGATCACCCTGGATGACACGGATGACAGTGGAACAAAAGGCGATAACATCACCCACGTTAAAAC
ACCGGGATTTACGCTTGGCAACATTGATACCGATGCTCGCCGGGTAGTGGTGGAGGTCATGCACAATGGCAGTAAACAGG
AGATACCGCTGACTCAGTCCGGCGGAAAGTGGCACTTTACACCAACCAGCAACTGGATGGACGGTGACTATATCCTGACG
GTGAAAGTGGAAGACAGAGCCGGTAATGTGAAGGAGTCCGCGCCGTTGACAGTGACGGTGGACACGCAAATCGCCATCAA
CAGTGTTGAACTGGTCAATGACACCAGTAATCCCAACGATAATCTGACTAAAGACGTGCGTCCACACTTCCAGGTGAAGG
TCCCGACGGATGTCAACGAAGTACGCCTGAGCATTGACGGCGGCAAGACCTGGGTGAAGGCAACCCAAAGCGCGACGCCG
GGCGTGTGGGATTACACCTGGCTGAGCGATGTGGGGGAGGGGAAACACACCCTGATAGTGGAAGCGACCGATGCGGCGGG
AAACAAGGCGACTGAGAGGCTTGATTTCACCATCGATACCACACTTTCAGAACCGACGATCACGCTGGATAGCCTGGATG
ATAGTGCTGCTGGCGATAATATCACCAATGTTAAAACGCCAGGCTTTACTCTCGGCAATATTGACGCCGACGTGGCCAGC
GTGTCGGTAACGGTGACGCACAATGGTAAGAGTCAACAGGTAGATCTGATTCAGACCGGCGGACAGTGGCGCTTTACGCC
GGGTACAGCATGGGTCGATGGCGACTATACGCTGACGGTGAAGGTGGAAGATGAGGCGGGGAATATAAACTATTCTGCCC
CGTTGACAGTCACTATCGATACGCAAACGGCCATTGATCGTATTGAACTTATGAACGACACAAGTCTCGCTGGCAGTAAC
CTGACCAATGAATTGCGTCCACAGTTTCATATCGCCGTTCCGAAGGATGTGAACTCTGTTCAACTCAGTATTGATGGCGG
CGCCAATTGGGTTAACGCAACGCTAACTGCCGGTGGCGTTTGGGAATATGTCTGGCCGACGGATCTGGCCGAAGGAACGT
ATACGCTGACGGTGAAAGCGACCGATATCGCAGGCAATACGGCGACAGATACGCTGAATTTTACTATCGATAACACGCTG
TCGATACCGACTATCGCGCTGGATGCCATGGATGATACGGGTACTGGTAACGATAATACGACTAACGTTAAAACGCCGGG
CTTTATTATCGGCGGTGTTGATGCTGATGTGATTCAGGTTATCGTACAGATTGCGCACGATGGTGGCAGCGAGGAGGTGG
AGCTGACGCAGAGCGGCGGTCAGTGGCGTTTTACGCCGGGTGCCGCATGGACCGATGGCGACTATACCCTGACGGTAATA
GTAAAAGACGAAGCGGGAAATATTAGCCACTCAGCGCCGTTGACAGTCACCATCGATACCCAAATCGCCATTGATAACAT
TGAACTGATCAATGACAGCGGTATTCCTGACGATAATCTGACCAATGACGTGCGTCCACACTTCCAGGTGAAGGTCCCCA
CGGATGTCAACGAAGTACGCCTGAGCATTGACGGCGGCACGACCTGGGTGAAGGCCACCCAGAGCGCGACGAAAGGCGTC
TGGGATTACACCTGGCTGAGAGATGTGAGTGAGGGGACACACACCCTGACGGTGGAAGCGACCGATGCGGCAGGAAATAA
GACGACGCAGACGCTCGATTTCACCATTGATACCAAACTGTCAGAACCGACTATCACCCTGGATGACACGGATGACAGTG
AAACAAAAGGCGATAACCTGACCAACGTAAATAGGCCGACGTTTTTACTGGGCAATATTGACGTAGACGCGCGGTATGTC
ACGGTTGAGGTGCAGCATGGCAGCACGAAAGAAGTGCTGACGGCCACCAAAGGCACGAACGGCGTCTGGAGCGTTATACC
GACCGGAACATGGGCAGACGGCAGTTATACGCTGACGGTGAGGGTGGAAGATAACGCGGAGAACGTAAAATACTCCGCGC
CGCTGACGGTGACAGTCGATACCCATGTTGCCATTAATAATGTAGAGCTGGTCAATGACAATGGCGTCAAGGGCGACAAT
ATGACTAACGACGCCCATCCGCAGTTCCGCGTTACGGTGCCGGTGGACGTTAAAGAAGTCAGTCTGAGCATTGACGGCGG
CACGACCTGGGTTAAGGCGACACAGAGCACGACGCCGGGGGTGTGGAGTTATACGTGGCCAGACATTGTGCCGGATGGCG
ACTACACGCTGGAGGTGAAAGCGACTGACAACGCGGGTAATACGGTAACAAAGAAGCTCGACTTCACGATTGATACCACG
TTGTCGACGCCGGTTATCGTACTGGATGATGTGGATGACACCGGTGACAAGGGCGATAACATAACCAATCACACCCAGCC
GACATTTACCCTGCAGCATATTGATAAAGACGCCGTCAGCGTGAAGGTCAGCGTGGAGCATGGTGGTGTCTCCACTACAT
TTGACGCCACGAAAGGCGCGGGTGGATGGACCTTTACGCCGACAGGGGCATGGGCGGATGGCGATTACACTCTGACCGTA
TCCGTCGAAGATGTGGCTGGTAACACCAGTCAATCGGCGTCGCTGACGGTGACGGTGGACACGCAAATCTCCATCAATAA
TATTGAACTGATCAATGACAGCGGTATTACCAACGATAATCTGACCAATGATGTGCGTCCACACTTCCAGGTGAAGGTCC
CGACGGATGTCAACGAAGTACGCCTGAGCATTGACGGTGGCACGACCTGGGTGAAGGCCACCCAGAGCGCGACGAAAGGC
GTCTGGGATTACACCTGGCTGAGTGATGTGAGCGAGGGGAAACACACCCTGACGGTGGAAGCGACCGATGCGGCAGGAAA
TAAGACGACGCAGACGCTCGATTTCACCATTGATACCACGCTGTCAGAACCGACTATCACCCTGGATGACACGAATGACA
GTGGAACAAAAGGCGATAACCTGACCAACGTAAATAAGCCGACGTTTTTACTGGGCAATATTGACGTAGACGCGCGGTAT
GTCACGGTTGAGGTGCAGCATGGCAGCACGAAAGAAGTGCTGACGGCCACCAAAGGCACGAACGGCCTCTGGAGCGTTAT
ACCGACCGGAACATGGGCAGACGGCAGCTATACGCTGACGGTGAGGGTGGAAGATAACGCGGAGAACGTAAAATACTCCG
CGCCGCTGACGGTGACAGTCGATACCCATATCAGCATTGATAATATTGAACTGGTTAATGACAACGGTACTCCTGGCGAT
AACCTGACCAATGAAGTTCGACCGCAGTTCCGTGTCACGGTGCCGGGAGATGTCAATGAGGTACGTCTGAGTATCGACGG
CGGTAAGACGTGGGTTCCCGCTATGCAGGTTAAAGCAGGGATCTGGGATTACACCTGGCCGGAAGATGTAACCGACGGTT
TACACACCCTGGTGGTGAAGGCGGTCGATGCGGCGGGAAATAAGACGACGCAGACGCTCGAATTTACCATCGATACCCAG
CTGTCAACGCCGACCATCACGATGGATGGCAGGGATGATACAGGCATCACGGGCGATCATATTACGAGTGTCAAAACACC
AGCCTTTACCATTGGCAATATTGACGCCGATGCGAAATCGGTTGTTTTGCGGATCACCCAGGGCAGCAATAGCCAGGAAG
TGAAACTGACGCAGGTTGGAGGCCAGTGGCGCTTTACGCCTGATGCAGACTGGGCGGACGGTAGCTATACGCTTACGGTA
GAAGTCAAAGACAACGCAGGGAATATCCGCCAGTCCACGCCACTGGTGGTGACAGTGGACACGCAAACCAGTATTACTGA
TATTACATTGGTCAATGATAATGGCGAGCCTGATGACAATCTGACCAACAGCACCCGCCCACAGTTTGAGATCAAGGTGC
CGGTGGATGTGAACTCTGTGCAATTGAGCATTGATGGTGGCACAAACTGGGTTAACGCGGTGCAAGGCATCAAAGGTGTC
TGGGGCTATACCTGGCCTACGGAGATCGGCGATGGGAAACATATCCTGACCGTGATGGTCAAAGACACCGCGGGCAATAC
GGCGACCCAAACACTTGAATTTACTATCGATACCAAATTGTCGACGCCGACTATTGCGCTGGATGGCATGGATGATACCG
GTACGCCTGGTGATGGGATGACCAAAAAGACCCAGCCAACGTTTGTTCTGCAAAATATCGATTCAGATGTTGTCAAAGTC
ACAGTGAGTGTTACGCATAACGGGACGACAAGCACCTTTGCCGCGACGCAGGGAGCCGGTGGATGGTACTTTACGCCGTT
AACACCGTGGGGCGATGGTAATTATACGTTGACGGTAACCGCAGAAGATCGGGCGGGAAATACGCGTCCATCCACGCCAC
TGACAGTGACGGTGGATACGCAAGTTGCCATTAATCATATTGAATTGGTCAACGATAGCGGCGCCCCTGATATCAACCTG
ACGAAACATGTGCGTCCGCAGTTCCAGATCTCGGTACCTGAGGATGTCAACGAAGTACGCCTGAGCATTGACGGCGGCAC
GACCTGGGTTGCTGCCATTAAGAGTTCGACGGCTGGTATCTGGGATTACACCTGGCCGACGGATGTGCCTGAGGGAGAGC
ATGTCCTGACAGTGGAAGCGACCGATGCTGCGGGCAATACAATAAGACAAACGCTCTCTTTCACCATCGACATCACGCTG
TCGACACCAACCATTGAGTTAGCGCCGGATCAGGATACCGGACAGAGTAAGAATGATAACCTGACCAGCGTTACTCAGCC
GGTATTTGTGTTGGGCCATATCGATAAAGATGTTCGACACGTGGAATTGAGTATTGAGCATAACGGCACGTTTAAAACGG
TGGTGCTTACCGAATCCGCCGATGGCTGGCGCTATCGACCGGACTCCGCTTTGGAGGACGGTAGCTACAAATTAACCGTG
ACGGTAACAGATGCAGCGGGCAACCAGCAGACCTCTGCGCCTTTAACGGTGACGATAGACGGCACATTGACGACACCGAC
GATTGAACTGGCACCTGGCGAAGACAGCAGTACTGTCGGCGATCGCCTCACTAACCACGATCGGCCTGTGTTCGATATAC
ACCAGATTGATTCTGACGTTACGCGCGTGATGGTTAAGGTCACTTACAACGGTAAAACGCATGAGGAAGCGGCGGTATTC
AGCAATGGTCAATGGCGCTTTACCCCTTCTGCAAGCTGGGCTGATGGCTCATATCAGTTAGCCGTTGTGGTGGAAGATCG
GGCGGGGAACGTAAAAGAATCCGCACCGTTAGAGGTACGTATTGATACCACGACGACCGTTAACAATATCGTATTGCTTA
ATGACACCGGTGTGCAGAATGACCAATTAACGAATGTTGCCAAACCGTCATTCAGAATTGAAGTTCCTGCGGATGTCGTT
CAGGTACGCGTCACTCTGGATGGGGGCACTAGCTGGAGTCCGATACGCAAAAATGCCGACGGACAGTGGATTTTTGAAAG
CACGAATACCCTGGTTGACGGTACATATACCCTTCGCGTAGAGGCCACGGATGAGGCAGGGAATATTGCGAATAAAGATT
TAGTATTTAATATCGATACGACTATACAGGTGCCGACTATCGCTTTAGAGGCAGGACAAGATACCGGCGCGAATACCTCC
GATAATATCACCAATATTTCACGTCCTACCTTTGCGATTGGTAATGTTGATCCGGATGTTATCAAAGTCGTGGTGACAAT
TGATGGTCATAATTATAACGCGACTAAGGTTGGGTCTGGTTGGGCGTTTACGCCAGGCAATGCAATTCCTGATGGCGCTT
ATAATATTACTGTTACCGTTGAAGATAAGGCCGGGAATATTGCAACATCGAAACCATTACCTGTTGTGATTGATACGACG
GCTGAAATTAAAAGCGTAACGTTGGTGACAGATAGCGGCGACAGCACGGTAGATAATATTACTAACATCAATAAACCGCA
GTTTAGTATTGTTACCGCTGATGACATTGTCCAGGTGCGTGTTAAAGTCGATAACGCGGCTAATTGGATTGAACTTACAA
AAGGAGGGGATGGCCGCTGGATATTTAATACCAGTTCAGCATTACCGGATGGTCAGCATTCTCTGGTGGTTGACGTTGTT
GATATCGCCGGGAACGTTGCGCAAGAAACGCTGCAGTTTACGGTAGATACGACTCTGCGAGTACCGACAATTGTACTCGA
TCCTGGCCATGATACTGGCGATGATACTAATGATAATCTCACCAGAATTAACAAGCCGGTATTTATTATCGGTGATGTGG
ATAATGATGTCTCACACATTGTAGTTCGCATTGATGGTCGGGATTACACCATTGAAAACACCGGAGGAAAGTTAACCTTT
ACGCCAGATAAACCGCTATCCGATGGCCAGCATACGATCTCTGTTACCGTAACGGATATTGCCGGTAATACCAAAACATC
GGCCGAGCTACAGATTGAAATCGACACCCAGGTTCAGATTGATAACGTGACGTTAACGACAGATAGTGGCATCAACGATC
ATGATAATGTCACCAATGCTAAACGTCCTTCTTTTGAAATTGAAACGCCTGCTGATGTGACGATAGTTCAGGTTTCTTTC
GATGGCGTAAACTGGACGCCCATCAGTAAAAACGCGGCCGGACAGTGGGAATTTACTGCTGGTAGCGAACTGTCTGATGG
TCATTATACACTCCATGTCCAGGCGACGGATCGAGCAGGAAACACGGCAAATTCCACGCTGGATTTCACCGTAGATACGC
AGATTAACGGACTTAGCGTCGTTATGCTGGATGACGCCGGAAAGGATACTGCAGACGGTATCACCAATATTACTTCCCCA
CGCTTTGAGATTTCGGCCGGAGAGCCGCTGCAAAGTGTGACGGTAATTTTGAATGGGAAATCCAGCACGTTGACTCAGGG
AGCGGGTAATAAATGGCTATTTACCCCTGACACTCCCTTAGTGGATGGAACTTACAAAATAGAAATTGTTGCTGAAGATA
TCGCAGGCAATAAGGTTAACAAAGAAGTCTCATTCACAATAGATACTATTATTTCTGATCCCAGTATTAACTTACTGGAT
GCGGATGATTCCGGCGAAAGCTCTGTTGATAATATTACCAATGTCACTAAACCACGTTTCGTCATTGGCAATGTCCCTGC
TGATATTGATACCGTTATTATCAGAATTAATGGCATTTCTTATCCGGTTACGGCAAATGGCAATAACCTCTGGGAATTTC
AGGTTCCCGTTGCGTTAAAAGATGGTGTATATGAAGCTGCCGTTGTCTTCAAAGATATTGCAGGAAATACTTCGGAAACG
AAATTACCCTTTACCATTGATACCACGACAAGTGTCACTGTAAGAATGGAGCCTGCATCTGATACCGGAAGCTCTAATAG
TGATAATCTGACTAATAAGCAAAACCCCAAATTCGAAGGCACTGCGGAGCCAAATGCGAAACTGGAGATTACCATTGTTG
ACGATGCGTCTAATGTGGTTCTAAAACAAACGGTTACAGTTGGCCCTGATGGCAACTGGAGTATTACACCGTCTCTACTG
GCGGATGGTACATATACGATTAACGTTACGGCGACAGATGTGGCGGGAAATACTGCGCAAACGCAGGAAAAATTCACTAT
CGATACCGTCACGACCGATCCGACCATTCGTCTTTCAGATCCGTCCGTCGATGATCAGCATGAAGCGACCAGCTTGCGTC
CTGAGTTTAAAGGTATCGCCGAAGCGTTTTCGACGATTATGATTAAGTGGGATGGCAAAGTTGTTGGCTCAGCGAACGCA
AATGCGAATGGCGACTGGAGCTGGACACCGCCGTCGGTATTAGCCCCTGGCTCCTATGTGGTGAGTATTGTTGCCAAAGA
TAAAGCGGGTAATGAATCCTCGCAGGTCGACTTTGCTGTTGTCATCCCCGTTATTGACGTAACACCTCCAACGATAAAGC
TCAGTGATGAAAGTGATACCGGGCCTTTAGGAGACTTTACGACCAGTAATAAAACGCCGACTCTGATAGGGAACACATTA
CCTAATACGATTGTGAGTATTTATGTTGATGGTCTGAAGGTCGGCGAGGCGACAGCGGATACTGCCGGTCGATATACCTT
CCAGCTGCCGGAAATGAATGATGGCCAGTATGTCGTTCAGGTCGGTATCATCAATCCTCGCGATCATAGCGAACTGCGTT
CCACGGCCGTTGATGTCACCATTGATACTCAGGTTGCTGAACTGGTATGGAATGTATCCGGCATGCATGAGGGCGGATAC
ATTAACACGGTGACGCCAGAGATTGGCGGCACCAGTGAGCCAAACAGTAAGGTTATTATCCTTGTGAATGGCGTTGAAAA
AGCGATTGCTTATACCACAGGAACAGGTCACTGGGGGGTTGTATTACCCGCTTTGGGTAATGACGGTAATTATGTATTAA
CCTTTAGAGTTGAAGATGTTGCCGGAAATACTAAAGAGTTTGGCCCGCAGCACATCATACTGGATACGGTCATTGCTCCG
ATGACAGTGGAATTACGTGAAATAGATGACAGTGGCAAAATTGGCGACTGGATCACCAAAAAATCTCATGTCACTCTTGA
GGGTACTGCCGAAGCAGGAAGTACATTAACCATCCGCAATCCGCAGGGCGTGGTTATTGCTACCCTGGTGGTAGGAAATG
ATGGTCGATGGAGCGCGGAAGTCGATCTGCGTGAAGGTAGCAACGCCTTTGTCGTTATATCGGAAGATAAAGCAGGTAAC
AGCCAACAAAAAGAAATCCTGATCGAACATGATACACAGATTGAAATCAGCGATATTTCATTAAGCCGGGATACGAACAG
CGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTGCTGGTTGCTATGACCGACCCCGGCGCAACGGTACAGG
TTTATATTAATGGCGTGTTACAAGGCACGGTTGAGGCAAACTCATCAGGTAATATTAGCTATACCATGCCGGCAAATAGT
GCTGACGGCGAGTATCAGGTGCAATTTGTTGCTACAGATATCGCTGGCAACCGGGTTGAATCTGCGGTTACAACCGTGAC
AATTGATTCTCAAATCGCAGTCTTTGACATTGATGAAAATACATTACCAGCTATCTCTAATAACCGGGCGCTGTCAGTCT
CCGGCGTAGGGGAGGCTGGTTCACAGGTCAGCATTTTTGTCGATGGTAAATTAGTCAACGTTGTTATGGTGGAGGCTGAT
GGCTCGTGGAGTGCGCCGATACTGCTACAAGATGACGGTACGTTTAATATTCATTTCAGCATTACTGACGTTGCCGGAAA
CACTGAAGTCAGTAAGAATTATAGCGTGGATGTCGATTCATCAACTGCCTTCCCAACGCTCAACCTTGATGAGTTGAGCA
ACTCAGGTTCACATGACGATCTGATCACTAATCATAACAAGCCAGTGTTAAATGGTACCGCAGAAGCGGGAGCAACAATC
CATATTTATGTGGATGAAAAGATTGTGGCAAATGTTGTTGTGCTTGAGGATGGAACCTGGTCCTATCAGTTTGATAATGC
CTTAAAAGACGGGGAATATTCTATTCGCGTGGTTGCCGAGGACCTTGCGGGTAATACGGCAGAATCGCCTCGCTTAATCG
TTACGATAGATACCAGCACATACATTGATCCGCCTGCACTGGCTCCCGGGTCTGATAATGGCATGTTCATTAACGACGGT
ATCACAAGTCAAACCCGGCCTAAGTTTAGTATCAACGGTGAGTTTAATCAGAGTGTCCAAATCTACATTGATGGGAAGCT
CGTCGATACGGTAACCGTGACGGACAGAAACCAGGTTTATCAACCTGCGATTCCTTTGGGTGATGGTACCCATAGTATTC
ATTACGTTATCACTGATAAAGCGGGCAACACAGCCACATCGAAACCCCTAAGCTTTACGGTAGATACTACTAATACAACG
CCTGTCCTGATTGATTCTATCGATGGCCAAACGTTAGCCGAAATGACCGCCAGTGATGGGAAGATATATATAACAGATAC
AACACATAACCTGATGTTTAGTGGGAGTGCTGAGCCCGATAGTTTAATAGAGTTAACTATTAATGGACTAGATGTAGGGA
AGATTTGGGTTGACAATACAGGAAAATGGCAGATGCCTGTCAATCCCGTTTATCTCTCGCAAGGTCTTCTGGATATAAAT
GTCAAATCTACGGACCGTGGCGGTAACGTAAATCAGGAAAACTATTCCATTTGGGTTGATACGATGATCCAGGAGTTTAC
CAGCGAGCTTGATGACAATAAGTCGTTGTCGAAAACGGACTGGTGGAGTAATAGCGCTCTTATTACCATGAGAGGTATGG
GTGAAATTGGCGCTACGGTATCATTAATAGTGGCAGGGGTCACGCTGGCAACCGCTGTCGTTGCAGCTAATGGGCAGTGG
GAATTATCGACCGATAAGCTTCCGGAAGGGAAATACGATATCACTTTGAGTATTGAGGATAACGCAGGCAACCGTAAGGA
AGAGGTACATGAAATATTTATTGATCGAACGCCGCCGAGTGCGCCTGTCGTAACGTATTCAGACATAGTTAACGATCTGA
TTATTATGCAGGGAACGGCGGAAGCCAAATCACAGTTAATAATAACCGATAGCGAGGGAAATACTTATACGCTCACGGTT
CCTGATAATGGTAACTGGAGTACGGCAATACCGTACCCATCGGAAGGGAAGTTCACCATTACGAGCGTGGATGCGATGGG
TAACAAGAGCGATGTACTTTCTCTCGATATAATGAAAGACGTGCCTGTTATTTCATTAGCGGTAGACTCGGATGGTAATA
TAGTAGGCGATAATATTACGCAAGATAATCAACCCACCTTTATTATCGGGAACCTGGAAAGCGATGTGGTCACTGTTCAG
GTCGATATCAATGGGACCTTATATAATGCTGAACAACGCGCTGATGGCGTTTGGTTCTTTACGCCAGGTACCGCGCTAGC
CGACGGTTCCTATACCATATCGGTCATTGCGAGTGACGCCGCAGGTAATAAGAAAAACTCATTACCGATTACCGTCACGA
TCGACAGTACGCTGACGGTGCCGGAGATTGCGCTGGCGGCAGGTGAAGACAATGGCGCTTCAGACAGCGATAACGTGACG
AATCACACCCAGCCTAAGTTCACGTTGCAGCATATTGATGCTGATGTGACCGGGGTGACCATAAATGTGGCGCATAGTGG
AGGGACAGACACCTACCAGGCAACGCAGAGTGCGGATGGCTGGACCTTCACGCCGCCGGTCGCATGGAATGATGGCACAT
ACACATTGAGCGTAACGGTGGTAGATGATGTCGGGAATAAAAAGCATTCTGCCTCGCTGACGGTAACGGTTGATTCAACG
GTAACAGTAGCGACGAATGCGTTAAGCGGCCATAGTGATACCGACACACTAACGGACGTTATACAATCTGAGCCCGAAAC
GAAGAATGCTGAAAGTGATACACATGCTCGTACCGGGATGCCTGCAGCTGAAGAAAGCACAGCAGCGGAGGAGGCATATA
ACATTACATTGTTAAATGCTGACGCCGGAGATGAAACAGAACGTTCGATTAGCCAGACACCTTCTTTTGAAATCTCTGTG
CCAGAAAATATTGTTAACGTGAGTGTCATGTTCGAAGGAGAAGAATTTACTCTGCCGATAATTAACCACAAAGCAATATT
CGAAGTTCCATTATCTTTAGAAGATGGTGAATATACTATGGATGTGAAATTCCTTGATAAGGACGATGATTACCTCATCA
AGGAGAAAACATTCTCCGTTGATCAGTCTTCTGCTGATATTGTGAATGCAATGAACGCAAGAGGAAAAACGGAAGATGAT
ATTAATGATTCCCCTTCAGCGAGTTCTGTAGGGCATAATAATGGTGCAATTGAGGCTTTCACCGTTAATGAAGTTACGCT
CCCTGTAGATAATCAAGAAGAATACGCATAA

Protein sequence :
MGNKNVQKFFADQNSVIDLSSLGNAKGAKVSLSGPDMNITTSRGTVIIVNGALYSSIKGNNLAVKFKDKTITGSKILGSV
DLKDIQLERIDSSLVDTAQVEKKGNGKQRNKKEDEELKKQLDEAENAKKEADKAKEDAEKAKDAAEKALNEAFEVQNASK
QIEEMLQNFLADNVAKDNLAQQSDAAQQNTQTKAAQALKQDDAEKVTPQPVNKNTGTGKSNSSKNEENQFEAEPVKEKLK
VTLTLAGESNSGSKDDSITNFTKPQFVGSTAPNATVIIKMNGISVGQAVADGLGNFTFTVSEELTDGTYNLEAEAATADA
SGSTKLVFTIDSVTDKPTFELAPESSIPGHKGLTPTLTPSIVGTAEENAKVDIYVGNKLVASVDVDKDGKWSYEFKDNEL
TEGENSIKVVAVDKAGNKNETADSIITDTIPPEKPTLELDDSSDSGVKDDGITNSTLPTFIGVAEPGSTVSLYLGLKHLG
DVIVAKDGSWSYTLTTPLKDGEYNLTATATDIAGHTSETTTLPFTIDTRISYFSAAIDAADDSGIVGDNVTNNVRPTFTG
KTEPNAVISVRNIDTGEEISFKANDQGEWKFDFASDSVEGINNLIFTVEDVAGNKKDFSFSYIIDTVAPVVPTISLDDFV
VLPNGIILSGNDLPTLVGTAEPKSTILLMRDGKLYDSIEVDSNGTWNYQFDKKLLQGAYDIEIVSQDAAGNKSPSVKYSF
TIQTDVVLPKAELEDSDDSGVKGDWITNQYNALTLLGTADKFATVNILIDGKTIGVTTADADGNWTFDISRNLSDNVYKI
TVEAIDPLGRTASVDYQLTIDSFTPIPTVMLHDSADSGVIGDMITKINTPLFTGIAEANAKVSIYIDGVLSGEAIAGDDG
VWNFQSTTILPDGSHNVTVKVEDVAGNIASSSAYNFQIITQTQKPTIELVNDTGIDSTDHIINEKSPALTGTAAPYSTVK
LYIDGVLFAEVKTNKDGVWGYTLKPDQGLIDGDYKITATVEDVAGNVAHSDPFSISVDTTISVPVISLSPDSDSGISNDN
LTNVVKPTLHLKDIDPDVASVQVWDAVSNKQIGVATQQPDGTWAYTFTSDLTEGKHQVYVKVEDIAGNKASSAVFDFTID
NTISTPVISLLPRDDTGLKGDDLTNINKPVFVINGVDVDAHRVIVQVLHNGVTQKIELSHSNGNWIFTPGDAWADGSYTL
TVEVKDKAGNISHSAPLTVTVDTHIAINNVELVNDNGVKGDNMTNDAHPQFRVTVPADVNEVSLSIDGGTTWVKATQSTT
PGVWNYTWPTTVPDGDYTLAVKATDNAGNTVTETLPFTIDTTLSTPVIVLDDMDDTGDKGDNMTNRTQPTFTLQHIDEDA
VSVKVSVEHGGVSTTFYATKGAGGWTFTPTGAWTDGDYTLSVSVEDAAGNTSQSAPLTVTVDTQIAIDRIEMLNDRGIPN
DNLTNEVRPHFQVKVPTDVNQVRLSIDDGNTWVTAVLKSTGAWEYIWPDDMADGSYTLTVEATDVAGNKTTQTLDFTIDT
TLSEPTITLDDTDDSGTKGDNITHVKTPGFTLGNIDTDARRVVVEVMHNGSKQEIPLTQSGGKWHFTPTSNWMDGDYILT
VKVEDRAGNVKESAPLTVTVDTQIAINSVELVNDTSNPNDNLTKDVRPHFQVKVPTDVNEVRLSIDGGKTWVKATQSATP
GVWDYTWLSDVGEGKHTLIVEATDAAGNKATERLDFTIDTTLSEPTITLDSLDDSAAGDNITNVKTPGFTLGNIDADVAS
VSVTVTHNGKSQQVDLIQTGGQWRFTPGTAWVDGDYTLTVKVEDEAGNINYSAPLTVTIDTQTAIDRIELMNDTSLAGSN
LTNELRPQFHIAVPKDVNSVQLSIDGGANWVNATLTAGGVWEYVWPTDLAEGTYTLTVKATDIAGNTATDTLNFTIDNTL
SIPTIALDAMDDTGTGNDNTTNVKTPGFIIGGVDADVIQVIVQIAHDGGSEEVELTQSGGQWRFTPGAAWTDGDYTLTVI
VKDEAGNISHSAPLTVTIDTQIAIDNIELINDSGIPDDNLTNDVRPHFQVKVPTDVNEVRLSIDGGTTWVKATQSATKGV
WDYTWLRDVSEGTHTLTVEATDAAGNKTTQTLDFTIDTKLSEPTITLDDTDDSETKGDNLTNVNRPTFLLGNIDVDARYV
TVEVQHGSTKEVLTATKGTNGVWSVIPTGTWADGSYTLTVRVEDNAENVKYSAPLTVTVDTHVAINNVELVNDNGVKGDN
MTNDAHPQFRVTVPVDVKEVSLSIDGGTTWVKATQSTTPGVWSYTWPDIVPDGDYTLEVKATDNAGNTVTKKLDFTIDTT
LSTPVIVLDDVDDTGDKGDNITNHTQPTFTLQHIDKDAVSVKVSVEHGGVSTTFDATKGAGGWTFTPTGAWADGDYTLTV
SVEDVAGNTSQSASLTVTVDTQISINNIELINDSGITNDNLTNDVRPHFQVKVPTDVNEVRLSIDGGTTWVKATQSATKG
VWDYTWLSDVSEGKHTLTVEATDAAGNKTTQTLDFTIDTTLSEPTITLDDTNDSGTKGDNLTNVNKPTFLLGNIDVDARY
VTVEVQHGSTKEVLTATKGTNGLWSVIPTGTWADGSYTLTVRVEDNAENVKYSAPLTVTVDTHISIDNIELVNDNGTPGD
NLTNEVRPQFRVTVPGDVNEVRLSIDGGKTWVPAMQVKAGIWDYTWPEDVTDGLHTLVVKAVDAAGNKTTQTLEFTIDTQ
LSTPTITMDGRDDTGITGDHITSVKTPAFTIGNIDADAKSVVLRITQGSNSQEVKLTQVGGQWRFTPDADWADGSYTLTV
EVKDNAGNIRQSTPLVVTVDTQTSITDITLVNDNGEPDDNLTNSTRPQFEIKVPVDVNSVQLSIDGGTNWVNAVQGIKGV
WGYTWPTEIGDGKHILTVMVKDTAGNTATQTLEFTIDTKLSTPTIALDGMDDTGTPGDGMTKKTQPTFVLQNIDSDVVKV
TVSVTHNGTTSTFAATQGAGGWYFTPLTPWGDGNYTLTVTAEDRAGNTRPSTPLTVTVDTQVAINHIELVNDSGAPDINL
TKHVRPQFQISVPEDVNEVRLSIDGGTTWVAAIKSSTAGIWDYTWPTDVPEGEHVLTVEATDAAGNTIRQTLSFTIDITL
STPTIELAPDQDTGQSKNDNLTSVTQPVFVLGHIDKDVRHVELSIEHNGTFKTVVLTESADGWRYRPDSALEDGSYKLTV
TVTDAAGNQQTSAPLTVTIDGTLTTPTIELAPGEDSSTVGDRLTNHDRPVFDIHQIDSDVTRVMVKVTYNGKTHEEAAVF
SNGQWRFTPSASWADGSYQLAVVVEDRAGNVKESAPLEVRIDTTTTVNNIVLLNDTGVQNDQLTNVAKPSFRIEVPADVV
QVRVTLDGGTSWSPIRKNADGQWIFESTNTLVDGTYTLRVEATDEAGNIANKDLVFNIDTTIQVPTIALEAGQDTGANTS
DNITNISRPTFAIGNVDPDVIKVVVTIDGHNYNATKVGSGWAFTPGNAIPDGAYNITVTVEDKAGNIATSKPLPVVIDTT
AEIKSVTLVTDSGDSTVDNITNINKPQFSIVTADDIVQVRVKVDNAANWIELTKGGDGRWIFNTSSALPDGQHSLVVDVV
DIAGNVAQETLQFTVDTTLRVPTIVLDPGHDTGDDTNDNLTRINKPVFIIGDVDNDVSHIVVRIDGRDYTIENTGGKLTF
TPDKPLSDGQHTISVTVTDIAGNTKTSAELQIEIDTQVQIDNVTLTTDSGINDHDNVTNAKRPSFEIETPADVTIVQVSF
DGVNWTPISKNAAGQWEFTAGSELSDGHYTLHVQATDRAGNTANSTLDFTVDTQINGLSVVMLDDAGKDTADGITNITSP
RFEISAGEPLQSVTVILNGKSSTLTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKVNKEVSFTIDTIISDPSINLLD
ADDSGESSVDNITNVTKPRFVIGNVPADIDTVIIRINGISYPVTANGNNLWEFQVPVALKDGVYEAAVVFKDIAGNTSET
KLPFTIDTTTSVTVRMEPASDTGSSNSDNLTNKQNPKFEGTAEPNAKLEITIVDDASNVVLKQTVTVGPDGNWSITPSLL
ADGTYTINVTATDVAGNTAQTQEKFTIDTVTTDPTIRLSDPSVDDQHEATSLRPEFKGIAEAFSTIMIKWDGKVVGSANA
NANGDWSWTPPSVLAPGSYVVSIVAKDKAGNESSQVDFAVVIPVIDVTPPTIKLSDESDTGPLGDFTTSNKTPTLIGNTL
PNTIVSIYVDGLKVGEATADTAGRYTFQLPEMNDGQYVVQVGIINPRDHSELRSTAVDVTIDTQVAELVWNVSGMHEGGY
INTVTPEIGGTSEPNSKVIILVNGVEKAIAYTTGTGHWGVVLPALGNDGNYVLTFRVEDVAGNTKEFGPQHIILDTVIAP
MTVELREIDDSGKIGDWITKKSHVTLEGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAEVDLREGSNAFVVISEDKAGN
SQQKEILIEHDTQIEISDISLSRDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEANSSGNISYTMPANS
ADGEYQVQFVATDIAGNRVESAVTTVTIDSQIAVFDIDENTLPAISNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEAD
GSWSAPILLQDDGTFNIHFSITDVAGNTEVSKNYSVDVDSSTAFPTLNLDELSNSGSHDDLITNHNKPVLNGTAEAGATI
HIYVDEKIVANVVVLEDGTWSYQFDNALKDGEYSIRVVAEDLAGNTAESPRLIVTIDTSTYIDPPALAPGSDNGMFINDG
ITSQTRPKFSINGEFNQSVQIYIDGKLVDTVTVTDRNQVYQPAIPLGDGTHSIHYVITDKAGNTATSKPLSFTVDTTNTT
PVLIDSIDGQTLAEMTASDGKIYITDTTHNLMFSGSAEPDSLIELTINGLDVGKIWVDNTGKWQMPVNPVYLSQGLLDIN
VKSTDRGGNVNQENYSIWVDTMIQEFTSELDDNKSLSKTDWWSNSALITMRGMGEIGATVSLIVAGVTLATAVVAANGQW
ELSTDKLPEGKYDITLSIEDNAGNRKEEVHEIFIDRTPPSAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSEGNTYTLTV
PDNGNWSTAIPYPSEGKFTITSVDAMGNKSDVLSLDIMKDVPVISLAVDSDGNIVGDNITQDNQPTFIIGNLESDVVTVQ
VDINGTLYNAEQRADGVWFFTPGTALADGSYTISVIASDAAGNKKNSLPITVTIDSTLTVPEIALAAGEDNGASDSDNVT
NHTQPKFTLQHIDADVTGVTINVAHSGGTDTYQATQSADGWTFTPPVAWNDGTYTLSVTVVDDVGNKKHSASLTVTVDST
VTVATNALSGHSDTDTLTDVIQSEPETKNAESDTHARTGMPAAEESTAAEEAYNITLLNADAGDETERSISQTPSFEISV
PENIVNVSVMFEGEEFTLPIINHKAIFEVPLSLEDGEYTMDVKFLDKDDDYLIKEKTFSVDQSSADIVNAMNARGKTEDD
INDSPSASSVGHNNGAIEAFTVNEVTLPVDNQEEYA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
SC4140 YP_219127.1 inner membrane protein Not tested SPI-4 Protein 0.0 86
STM4261 NP_463126.1 inner membrane protein Not tested SPI-4 Protein 0.0 85
siiE CAE11797.1 large repetitive protein Virulence SPI-4 Protein 0.0 85

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
A464_4254 YP_008324847.1 Large repetitive protein VFG0581 Protein 0.0 85