Gene Information

Name : CFSAN001992_12575 (CFSAN001992_12575)
Accession : YP_007472253.1
Strain : Salmonella enterica CFSAN001992
Genome accession: NC_020307
Putative virulence/resistance : Virulence
Product : large repetitive protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 2542320 - 2559005 bp
Length : 16686 bp
Strand : -
Note : COG1404 Subtilisin-like serine proteases

DNA sequence :
ATGGGAAATAAAAGCATACAAAAGTTTTTTGCCGATCAAAATTCTGTAATTGATTTATCTTCTTTGGGTAATGCCAAAGG
CGCAAAAGTTTCTCTTTCCGGGCCAGACATGAACATTACGACGCCGCATGGGTCAGTGATCATTGTCAATGGCGCTCTTT
ATTCAAGTATCAAAGGCAATAACCTCGCTGTTAAATTTAAAGATAAGACTATTACCGGCGCTAAAATTCTGGGCAGCGTA
GATTTAAAAGATATTCAACTAGAGAGAATTGACAGCTCATTGGTTGATTCTGCTCAGGTAGAAAAGAAAGGTAATGGCAA
ACGACGAAATAAGAAGGAAGAAGAGGAATTAAAAAAGCAGCTTGACGAGGCTGAAAACGCAAAGAAAGAAGCTGATAAGG
CGAAGGAAGAAGCTGAGAAAGCTAAGGAGGCTGCAGAAAAAGCGCTCAATGAAGCGTTTGAAGTACAGAACTCGTCAAAG
CAAATTGAAGAAATGCTGCAGAACTTTTTGGCTGACAATGTAGCAAAAGACAATCTGGCTCAGCAAAGCGATGCTTCCCA
GCAAAATACACAGGCTAAAGCAACGCAGGCTTCTAAACAGAACGATGCTGAAAAAGTTCTTCCTCAACCTATTAATAAAA
ATACCAGCACTGGCAAAAGTAATAGCAGTAAAAATGAGGAAAATAAGCTCGATGCCGAGTCTGTTAAAGAGCCGCTTAAA
GTCACATTAGCGCTTGCGGCCGAGAGTAACAGCGGTAGCAAAGATGATAGTATAACTAATTTTACCAAACCTCAGTTTGT
AGGTAGCACTGCTCCCAATGCCACGGTCATTATTAAAATTAATGGTATTGCTGTCGGTCAGGCTGTAGCGGATAGTTTGG
GTAACTTCACCTTCACTGCGCCTGAAACATTGACTGATGGAACATACAATCTGGAGGCAGAGGCCAAGACTGCTGATGGG
AGCGGTAGCACCAAACTTGTCATTACTATCGATTCCGTTACCGATAAGCCAACATTTGAACTTTCGCCTGAAAGTAGTGT
GTCTGGTCATAAGGGCTTAACTCCGACCTTGACGCCTTCAATTGTTGGTACGGCGGAAGAGAATGCCAAGGTTGACATTT
ATGTAGATAATAAACTGGTTGCCAGCGTTGATGTCGATAAAGATGGAAACTGGAGTTATGAATTTAAAGATAATGAATTA
TCTGAGGGCGAAAATAGTATAAAAGTCGTTGCCGTAGATAAAGCAGGTAATAAAAACGAAACGACGGATAGTATCATAAC
CGACACCATTGCTCCGGAAAAGCCGACGATTGAGCTGGATGATAGTAGTGATTCCGGCATTAAAAATGACAGCATTACAA
ATAGCACCCTGCCAACATTTATTGGTGTGGCGGAACCCGGTTCTACAGTCTCTATTTATCTTGGACTTAAACATCTTGGT
GAGGTCATTGTTGCTAAAGATGGGACATGGAGCTATACGCTTACTACGCCGCTCAAGGATGGCGAATACAATATAACAGC
AACAGCTACTGATATTGCCGGGCATACCTCAGCGACGGCAAATCTGCCTTTTACTATTGATACACGTATCAGCTATTTCA
GCGCTGAGATTGAAACTACTGATGATAGCGGTATTGTTGGAGATAACGTTACTAACAATACTCGCCCAACCTTTACAGGT
AAAACTGAGCCAAATGCTATTATCAGTGTCATAAATAGTGAGACTGGCGAAGAGGTTATTTTTAAAGCGAATGACAAGGG
CGAATGGACGTTCAATTTCACTTCCGACTCAGTGGAAGGGGTTAACAATCTTACGTTCACTGTTGAAGATGTCGCTGGCA
ACAAAAAGGATTTTTCCTTTAGTTACGTTATCGATACTGTTGCCCCTGTACCTCCGACAGTTTCTTTGGAGGATTTTGTT
GTTTTACCGAATGGTATAATTTTATCAGGGAATGATTTACCGGCTTTAGTCGGTACGGCAGAGCCAAAGTCTACCATCTT
ATTGATGCGAGATGGTAAATTATATGACAGCATTGAGGTTGACTCAAACGGGACCTGGAATTATCAGTTTAGTAATAAAT
TTCTTCAGGGTGCCTATGATATTGAAATCATTTCTCAGGATGCCGCCGGTAATAAATCCTCTACTGTTAAATATTCTTTT
ACTATTCAAACTGAAGTTGTACCTCCAAAAGCGGAACTCGATGCCAGTGATGATTCCGGTGCAAAAGGCGACTGGATTAC
CAATAAACATAATGCTCTGACGTTACTGGGAACAGCGGATAGGTTTGCTACCGTAAATATCCTTATTGATGGTAAAACGA
TAGGCGTGACGACTGCGGATGCAGACGGTAACTGGAATTTTGATATTTCCCGAAATCTGTCTGACAATGTTTATAAGATT
ACGGTTGAATCCATCGATCCTTTAGGAAGAACGTCATCTGTAGATTATCAGCTTACCATTGATAGCTTTACGCCGATCCC
TACTGTTATGTTGCATGATAGCGCTGATTCTGGCGTTAAAGGCGATATGATTACTAAAATTAATACGCCGTTGTTTACCG
GGATGGCTGAAGCTAATGCTAAGGTTTCCATCTATGTTGACGGTGTGTTAAGTGGCGAGGCTATTGCTGGCGATGATGGT
GTATGGAATTTTCAATTTACCACAGCGTTATCCGATGGCTCGCATGACGTAACGGTAAAGGTAGAAGATATTGCCGGTAA
TACTGCCTCCTCATCAGCGTATAATTTCCAAATCGTAACGCAAACACAAAAACCAACAATAGAGTTGGTCAACGATACGG
GGGTTGATAATACAGACCATATTATTAATGAAAAGAATCCTGCACTGACAGGAACCGCTGCACCCTATTCAACGGTTAAA
CTCTATATTGATGGTGCACTGATCGCTGAGGTCAGAACAAATAAAGATGGCAGATGGGAGTATACTCTGAAAGCCGATCA
AGGTTTGGTTGATGGCGATCATAGAATAACTGCTTCAGTTGAAGATATCGCTGGCAACATTGCCCATTCGGATCCTTTCT
TAATTAGCGTCGATACTGCTATTTCAATACCGATAGTTTCATTGAGCCCGGATTCAGATTCGGGAATTTCAGATGATAAT
TTAACGAATATCGTTAAACCTACCTTGCACCTAAAAGATATTGATCCGGACATTATCAGTGTTCAGGTATGGGATGCCGC
GTCTGATACGCAGATCGGTGTTGCCACGCAACAACCTGATGGTTCATGGGCCTATACCTTTACTTCAGATTTAACGGAAG
GCTTGCATCAGGTTTATGTCAAGGTTGAGGACATTGCGGGTAATAAAGCGAACAGCGCGGTATTCGATTTTACTATCGAT
ACCACAGTATCAACGCCGGTGATTTCCCTGCTTTCTAAGGATGATACGGGGGTTACAGGCGATAACCTGACCAACATCAA
TAAGCCAGGTTTTGCTATTTCCGGTGTTGATGCCGATGCGCATCGGGTCGTCGTACAGGTGATGCACAATGGCGTGAGCG
AAGAGATCGAACTTTCTCACCTCAATGGTAGTTGGTTATTTACACCAGGGAATACGTGGGCGGATGGCAGCTACACGTTA
ACGGTGAAAGTAGAAGATAAGGCAGGAAATACCAACTACTCAGCGCCGCTGACGGTCGTTATCGATACCCAAATCGCCAT
TGATGGGGTGGAACTGGTCAACGATAGCGGCGTGAAAGGCGATAATATGACCAATGACGACCGTCCCCACTTTCGTGTGA
CGGTACCGACGGATGTCAATGAAGTCCGTCTGAGCATTGACGGTGGTAATTCGTGGGTTCAGGCAACTCCGGGCGTGGCA
GGAAGCTGGGAGTATATCTGGCCGACAGACCTGGCAGATGGTCAATACACGCTAACGGTGGAAGCGACTGATAAAGCAGG
CAATACAGTGACGAAGACCATCGATTTCGCGGTGGATACCACGCTGTCAGTGCCGGTCATCGTACTGAATAGCGCGGACG
ATACCGGTGTCCAGGGCGATAACATGACGAATAGCACCCAGCCGACATTTGCCCTGCAGCATATTGATGATGATGCCGTT
CGCGTTACGGTCAGCGTGGAGCATGGCGGCGTCACCACCACATTTGACGCCACGAAAGGCGTAGGCGGATGGAGCTTTAC
GCCGACAGGGGCGTGGGCGGATGGTGATTATACCCTGAGTGTGTCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCGG
CATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAACATTGAACTGGTCAATGACAGCGGTATTCCCAACGAT
AATCTGACTAATAACGTGCGTCCGCACTTCCAGGTGACGGTACCGACGGATGTCAACGTGGTGCGCCTGAGCATTGACGG
CGGCAAGACGTGGTTCAACGCTACCCAGAACGCGACGCCGGGCGTCTGGGATTATATCTGGCCGGATGATGTGGCCGACG
GAGGCTATACCCTGACGGTAGAAGCGACCGATGAGGCGGGAAATAAGACAACACAGACGCTCGATTTCACCATCGATACC
ACTCTGTCTGTGCCGACCCTCTCGCTGGACAGCGCAGATGACAGCGGCATCGCGGGCGATAATATCACCAATGTTAAAAC
GCCGGGCTTTACCCTCAACAATATTGATACCGATGTCAGCCGGGTAACAGTGGAGGTAATGCACAATGGCATTAAACAGG
AGGTGCCACTGGTTCAGACCGGCGGACAGTGGCGCTTTGCGCCGACCAGCGACTGGGCGGACGGCGACTATATCCTGACG
GTGAAGGTAGAAGATAGGGCCGGAAATGTGAAGCAGTCCGCGCCGTTGACGGTGACAGTGGACACTCATATCGCCATTGA
CCGTATTGAACTGGTTAACGACAGCGGTATCCCCGACGATAATCTGACCAATGAAGCGCGCCCGCACTTTCAGGTGACAG
TACCGGCGGATGTTAACGGTGTAAGACTGAGCATTGATGGCGGCAAAACGTGGTTTGACGCCACGCAGAGCGCGACGCCG
GGCGTCTGGGATTATATCTGGCTGACGAATGTGGCTAACGGCCCTCACACCCTGATGGTGGAAGCGTCCGACAAGGCGGG
AAACAAAACGACGCAGAAACTGGACTTCATCATCGATACCATGCTGTCAGAACCGACGATTACCCTGGACAGTGCGGATG
ACAGCGCCGCTGGCGATAACATCACCAACGTTAAGATGCCAGGCTTTACCCTCGGTAATATCGACGCCGACGTGACCAAA
GTGGTGGTGACGGTGGCGCATGATGGTAAGAACCAACAGATAGAGTTGATTAAGAACGGCGGTGTGTGGCGCTTTACGCC
GGGCGCAGCCTGGACCGATGGCGACTATACGTTGACGGTAAAGGTAGAAGATAAGGCGGGTAATACAAATTATTCTGCGC
CGCTGACGGTGACTATCGATACGCAAACGTCTATTGATCGCATTGAACTTCTTAATGACACGGGTATTGTCGGGGATAAC
CTGACCAATGAAGCACGTCCACAGTTTCATATTACGGTACCGACGGACGTGAACTCTGTGCAACTGAGTCTTGATGGCGG
CATCAACTGGGTTAACGCAACGCTGACGCCCGACGGCGTTTGGGAGTATATATGGCCGACAGATCTGGTCGAAAATACGT
ATACCCTGACAGTGAAAGCAACCGATGTTGCAGGCAACACGGCGACGGAAACGCTCAATTTTATCATTGATACCACATTG
TCGACACCGACCATCACGCTGGATAGCGCAGATGATAGCGGCACCGCCAACGATAATAAGACTAACGTTAAAACACCGGG
TTTTATTATCGGCGGTATTGATTCTGACGTGACTCAGGTCGTCGTGCAGGTGATGCGCGATGGTCACAGCGAGGAGGTGG
AGCTGACGCAGACTAACGGGCAGTGGCGTTTTGTACCCGGCAGCGCGTGGACTGATGGCGACTATACGCTGACGGTAACG
GTGAAAGATGAGGCGGGTAATATTCGCCACTCAGCGCCGTTGACGGTTACCATCGATACGCAAATCGCCATTGACCATAT
TGAACTGGTCAATGACAGCGGTATTCCCGACGATAATCTGACTAATAACGTGCGTCCGCACTTCCAGGTGACGGTACCGA
CGGATGTCAACGTGGTGCGTCTGAGCATTGACGGCGGCAAGACGTGGTTCAACGCTACCCAGAGCGCGACGCCGGGCGTC
TGGGATTATACCTGGCTGGCTGATGTAGGAGAGGGGAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAACAA
AACGACGCAGCAACTGGACTTCATCATCGATACCATGCTGTCAGAACCGACTATCGTGCTGGACAACACGGACGACAGCG
GAACAAAAGGCGATAACCTGACCAACGTAAATAAGCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTATGTC
ACGGTTGAGGTGCAGCATGGCGGCACGAAAGAAGTGCTGACGGCCACCAAAGACGCGACCGGCAACTGGAGCGTAACACC
GACCGGCACATGGGCAGATGGCGACTATACGCTGACGGTGAGGGTGGAAGATGAGGCGGGGAACGAAAAACACTCAGCGT
CGCTGACGGTCACTGTTGATACCCAAATCACCATTGATGCTATTGAACTGGTTAATGATAACGGTATTCCCGGCGACAAT
ATGACTAACGACGCCCATCCGCAGTTCCGCGTGACGGTACCGGGGGACGTTAACGAAGTCAGTCTGAGCATTGACGGTGG
CGTGACCTGGGTTAAGGCGACACAGAGCGCGACGCCGGGCGTCTGGAATTATACCTGGCCGGGCACCGTGCCGGATGGCG
ACTATACGCTGAATGTGAAAGCGACTGACAATGCGGGTAATACGGTGACGGAGACACTCCACTTCACTATTGATACCACG
CTGTCGACGCCGGTCATCGTACTGGATAGCGCGGACGACACCGGCATCCAGGGCGATAACATGACTAATCGCACCCAGCC
GACATTTAACCTGCAACATATTGATGATGATGCCGTTCGCGTTACGGTCAGCGTGGAGCATGGCGGCGTCACCACCACAT
TTGACGCCACGAAAGGTGTAGGCGGATGGACCTTTACGCCGCCGACATCATGGGGGGCGGGCGATTATACCCTGAGTGTG
TCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCGGCATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAA
CATTGAACTGGTCAATGACAGCGGTATTCCCGACGATAATCTGACTAATAACGTGCGTCCGCAGTTCCAGGTGAAGGTAC
CGACGGATGTTAACGAGGTGCGCCTGAGCATTGACGGCGGCAAGACATGGTTCAACGCTACCCAGAGCGCGACGCCGGGC
GTCTGGGATTATACCTGGCTGGCTGATGTGGGAGAGGGGAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAA
CCAGACGACGCAGAAACTGGACTTCATCATCGATACCCTACTGTCAGAACCGACTATCGTGCTGGACAACACGGACGATA
GCGGAATAAAAGGCGATAACCTGACCAACGCGAATAAGCCGACGTTTTTACTGGGTAATATTGACGCAGACGCGCGGTAT
GTCACGGTTGAGGTGCAGCATGGCAGCACGAAAGAAGTGCTGACGGCCACCAAAGGCGCGACCGGCATCTGGAGCGTGAC
ACCGACCGGCACATGGGCAGATGGCGACTATACGCTGACGGTGAGGGTGGAGGATGAAGCGGGTAACGTAAAATACTCGG
CGCCGCTGACGGTCACGGTTGATACCCAAATCACCATCGATGTTATTGAACTGGTTAATGATAACGGTATTCCCGGCGAC
AACCTGACCAATGACGTTCGTCCACACTTCCGTGTCACGGTGCCAGGGGATGTCAACGAGGTACGTCTGAGTATCGACGG
CGGTAATACGTGGGTTCGTGCAACACAGGGCACGGCAGGGATCTGGGATTACACCTGGCCGAAAGATGTGACCGACGGGC
TACATACCCTGACGGTAGAAGCGACCGATAAGGCGGGAAATAAGACGACGCAGACGCTCGATTTTACCATTGATACCCGG
CTGTCAACGCCTACCATCACTATGGATAGCAGGGACGATACAGGTGCCATTGGCGATCATATTACGAGCGTCAAAAGACC
GGGCTTTACCATTGGCAATATTGACTCCGATGCGCAATCGGTCATTTTGCGGATCACACAGGGCGGCAATAGCCAGGAAG
TGACACTAACCCAGGTTGGAGGACAGTGGCGCTTTACGCCAGATGCTGACTGGGCGGACGGTAGCTATACACTGACGGTA
GAGGTAACGGATAACGCAGGAAACGTTCGTCAGTCCACGCCGCTGATAGTGACGGTAGATACGCAAACCAGCATTACTGA
TATTACATTGGTCAATGATCATGGCGTGCCGGATGACAATCTAACTAACAGCACCCGTCCGCAGTTTGAGATCACGGTGC
CGGCGGATGTGAATTCTGTGCAACTGAGCATTGATGGCGGCGCAAACTGGGTGAGCGCGGCGCAGGGTATCGAAGGCGTC
TGGGGCTATACCTGGCCAACGGATATGGGCGATGGAAAACACACCCTAACCGTCATGGTCACCGACAGAGCGGGCAATAC
GGCGACGCAAACGCTTGAATTTTTCATCGACACCCGGTTGTCGACGCCGACCATTGCGCTGGATAGTACGGATGATACCG
GTACGCCTGGCGATGATATGACCAATCGCACCCGACCGACCTTTATTCTGCAGAATATCGATTCGGATGTTATCAACGTT
ACAGTCAGCGTCACGCATAATGGAACGACAACCTCGTTTACTGCGACACAGGGGGCTGGAGGATGGAGCTTTACACCGCC
AGCACCGTGGGGCGACGGTGATTATACGCTGACGGTGACAGTGGAGGATCGGGCGGGAAATACGCGTCCGTCTACGCCGC
TGACGGTGACAGTGGATACGCAAATAGCCATTGATCATATTGAATTAGTCAACGATAGCGGCGTCCCTGGCGATAATGTC
ACAAAACATGTGCGTCCGCAGTTCCAGATCTCGGTACCGGATGATGTGGAAAAGGTTCTTCTGAGTATTGACGGCGGCAC
GACCTGGGTTACTGCAATCAAGAGTTCGACGGCTGGCATTTGGGATTACACCTGGCCGACGGATATGCCAGAGGGACAGC
ATACCCTGATCGTGGAAGTGACTGACGGTGCGGGTAATAAGATGACGGGGACGCTCGATTTCACTATCGACATCACGTTG
TTGACGCCAACCATTGAGCTAGCGCCCGATCAGGATACCGGACAGAATAAGAACGATAATCTGACCAGTGTCACTCAGCC
GGTATTTGTGTTGGGGAGTATCGATAAAGATGTTCGACACGTGGAATTGAGTATTGAGCATAACGGCACGTTTAAAACGG
TGGTACTCACCGAATCAGCCGACGGCTGGCGTTATCGACCGGATTCTGCTTTGGCGGACGGTAGCTACACATTCACCGTG
ACGGTAACAGATGTGGCAGGCAACCAGCAAACATCCGCGCCTTTAAAGGTGACGATAGACGGTACGTTGACTACGCCGGT
GATTGAACTGGCAGCTGGCGAAGATAGCGGTACTGTTGGCGATCGCCTCACCAATCACGATCGGCCGGTGTTCGACATAC
GCCAGGTTGATTCTGACGTTACGCGCGTGATGGTCAAAGTAACTTACAACGGTAAAACGCACGAGGAAGCGGCGGTATTC
ACCAATGGTCAATGGCGCTTTACGCCTTCTGCGAGCTGGGCTGATGGCTCATATCAGTTAGCCGTTGTGGTGGAAGATCT
GGCGGGGAATGTAAAAGAATCTGCGCCGTTAGAGGTGCGTATTGATACCACGACAACCATTAACAATATCGTATTGCTTA
ATGATACTGGCGTGCAGAATGATCAATTAACGAATGTTGCCAAACCGTCATTCAGAATTGACGTTCCCGGTGATGTCATC
CAGGTACGCGTAACCCTGGATGGTGGCGCTAACTGGAATGTGATACGCAAAAATGCCGACGGACAGTGGATTTTTGACAG
CCCGAATACTCTGGTTGACGGCACATATACCCTTCGCGTAGAGGCCACGGATGAGGCAGGTAATATTGCGAATAAAGATT
TAGTATTTAATATCGATACTAATATACAGGTTCCGACTATTGCTTTAGACGCAGGACAAGATACCGGAGCGAATACAGCC
GATAATATCACTAATATTTCACGACCCACCTTTACGATTGGTAATGTTGACCCCGATGTTATTAAAGTCGTGGTGACGAT
TGATGGTCATGATTATAACGCGACTAAGGTTGGGGCTGGTTGGCAATTTACACCAGGCAATGCCATTCCGGATGGTTCTT
ATAATATTACCGTTACGGTTGAAGATAAGGCCGGAAATACCGCGACATCGAAACCATTACCTGTTGTGATAGATACGACG
GCTGAAATTGAAAGCGTCACGTTGGTTACAGATAGCGGTGATAGCGATGTAGATAACATTACCAAAGTCGACAAGCCGCA
GTTTAGTATTGTTACCGCTGATGATATTACCCATGTGCGCGTTAAAATCGATAACGCCGCTAATTGGATTGAACTCACAA
AAGGAGGGGATGGCCGCTGGATATTTAATGTCGGTTCGGCATTACCTGATGGGAAACACACTCTCTTGGTTGATGTGACT
GATATCGCTGGCAACGTTGCGCAAGAAACGCTGCAGTTTACGATTGATACGACTCTGCGAGAGCCGACAATTGTACTCGA
TCCCACCCATGATACTGGTGATGATACTAATGATAATCTTACCAGGATTAACAAACCGGTGTTTATTATCGGTAATGTCG
ATAATGATGTATCACACATTGTGGTTCATATTGATGGTCGGGATTACACCATTGAAAACACAGGGGGGAATTTAACCTTT
ACGCCGGATCAACCGCTGTCTGACGGTCAGCATACGATCTCTGTTACCGTAACGGATATTGCTGGTAATACCAAAACATC
GGCCGAACTGCAGATTGAAATCGACACGCAGGTTCAGATTGACAGTGTTACGTTAACAACAGATAGCGGCGTCAACGATC
ACGATAATGTCACCAATGCTACCCGTCCCTCTTTTGAAATTGCAACGCCTGATGATGTGACATCGGTGCTGGTTTCTTTC
GATGGCGTAAACTGGACGCCTATCAGTAAAAATGCGGCCGGGCAGTGGGAATTTACTGCAGGTAGCGCATTGCCTGATGG
TCATTATACTCTCCATGTCCAGGCGACGGATCGGGCAGGAAATACGGCAAATTCCACGCTGGGCTTCACCGTGGATACGC
AGATTGACGGCCTGAGCGTCGTGATGCTGGATGACGCCGGAAAGGATTCTACGGATGGTATTACGAATATTACCTCTCCA
CGTTTTGAAATTTCAGCCAGAGAACCGCTGCAGAGCGTGACGGTAATTTTAAACGGGAAATCCAGCACACTGACTCAGGG
GGCAGGTAATAAATGGCTGTTTACCCCTGATACACCGTTAGTGGATGGAACTTACAAAATAGAAATAGTGGCTGAAGATA
TCGCAGGTAATAAAATTAGCAAAGAGGTATCATTCACAATAGACACTATTGTTTCTGATCCCAGTATTGATTTGCTGGAT
GCGGATGATACTGGCGAAAGCGCTGTTGATAATATTACGAGTGTCACTAAACCACGTTTCGTTATTGGCAATGTACCCGC
CGATATTGATACTGTTGTAATCAGAATTAACGGCGTTTCTTATCCGGTTACGGCAAATGGCAATAACCTCTGGGAATTTC
AGGTTCCCGTTGCGTTAAACGATGGCGTATATGAAGCCGTTGTTGTCTTCAGAGATATTGCCGGAAATACTTCTGAAACT
AAGCTGCCCTTTACCATTGATACCACGACAAGCGTCAGTGTCAGAATGGAGCCAGCATCTGATACCGGCAGCTCCAATAG
CGATAACCTTACGAATAAGCAAAATCCCAAATTCGAAGGTACTGCGGAGCCTAATGCGAAACTGGTGATTACCATTGTTG
ATGATAAGTCAGGTCGGGAGGTTCTAAAACACACGATTACGGTTGGCGCCGATGGCAACTGGAGTGTGACGCCGAATATA
CTGCCGGATGGCATGTATACCATCAACGTCGTCGCAACAGATGTCGCGGGAAATACTGCGCAAACGCAGGAAAGATTCAC
TATCGATACGGTTACGATCGATCCTACCATTCGCCTTTCGGATCCATCTATTGATGATCAGTATGAAGCAACCAGCCTGC
GTCCTGAGTTCAAAGGGCTAGCCGAAGCGTTCTCGACGATTATGATTCAGTGGGATGGGAAAGTAGTCGGCTCGGCAAAC
GCCAATGCGAATGGCGAATGGAGTTGGACGCCGCCATCAGTATTAGCGCCAGGCTCCTATGTTGTGAGCATTGTTGCCAA
AGATAAAGCGGGTAATGAATCGTCGCAGGTCGACTTTCCTGTCGTAATACCTGTTATTGATGTCACGCCTCCAACCATAA
AGCTCAGCGAGGAGAGCGATAGTGGTGCCTTAGGAGATTTTACCACGAATAATAAAACGCCGACCCTGGTTGGGAACACG
TTACCTAATGCGATTGTGAGTATTTATGTGGATGGCGTGAAGGTCGGCGAGGCGACAGCGGATACAGCGGGTCGATATAC
TTTCCAGTTATCGGAAATGAAAGATGGCCATTATGTCGTCCAGGTGGGTATCGTCAACCCTCGCGATAATAGCGAACTGC
GTTCCACCGCCGTTGATGTCACTATCGATACCGAGGTTGCTGAACTGGTATGGAATATATCTGGAATGCATGAGGGCGGA
TATATCAATACGGTGACGCCGGAGATTGGCGGCACCAGTGAGCCAAACAGCAAAATCACTATCTTTGTGAATGGCGTTGA
AAAAGCGATTGCTTATACGACAGGCGCAGGACACTGGGGCGTAGTATTACCTGCTTTGGGTAATGACGGTAATTATGTAT
TAACGTTTAAAGTTGAAGATGTTGCCGGCAATATCAGAGAGTTTGGTCCGCAGAATGTGATACTGGATACGGTAATTTCG
CCGTTAACCGTGGTATTACGCGAAGCTGATGACAGTGGCAAAGTTGGCGACTGGATCACCAATAAATCTCATGTCACCAT
CGATGGTACTGCCGAAGCCGGAAGTACTTTAACCATCAGGAATCCGCAGGGGGTGGTTATTGCTACCCTGGTGGTAGGCA
ATGATGGTCGATGGAGCGCAGAATTAGATCTGCGTGAAGGTAGTAATGCCTTTGTCGTGGTATCGGAAGATAAAGCGGGC
AACAGCCAACAAAAAGATATCCTGATAGAACATGATACGCAGATTGAAATCAGCGATATTTCATTAAGTCGGGATACTAA
TAGCGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTACTGGTTGCCATGACCGATCCCGGCGCGACGGTAC
AGGTTTATATTAATGGTGTGTTACAAGGCACAGTAGAGGCGAGTTCGTCAGGTAATATTAGCTATACCATGCCGGCAAAT
AGCGCCGACGGCGAGTATCAGGTGCAATTTGTTGCTACGGATACTGCTGGTAACCGGGTTGAGTCTGCGATTACAACCGT
GACAATCGATTCTCAAATTGCTGTCTTTGACATTGATGAAGATTCATTACCGGCCCTCTCTAATAACCGGGCGTTGTCAG
TCTCAGGTGTCGGGGAGGCAGGTTCTCAGGTCAGCATCTTTGTCGATGGTAAATTAGTCAACGTTGTTATGGTTGAGGCT
GATGGCACATGGCGCGCGCCGATACTGCTGCAAGATGATGGTACGTTTAATATTCATTTCAGCATTACTGACGTTGCTGG
CAACACTGAAGTGAGCAAGGATTATAGCGTGGATGTCGATTCATCAACTGACTTCCCAACGCTCAACCTTGAAGATGCGA
GCAACTCTGGTTCACTTGACGATCTGATTACTAGTCACAACAAACCTGTGTTAGTTGGCACCGCAGAAGCGGGAGCCACA
ATCCATATTTATGTGGATGAAAAGATCGTGGCAAATGTTCTTGTGCTTGAAGATGGAACCTGGTCCTATCAGTTTGATAA
TGCGTTAAAAGATGGTGAATATTCTATCCGAGTGGTTGCCGAAGACCCGGCAGGTAATACGGCAGAATCGCCTCGCTTAC
TCGTCACGATAGATACCAGTACGTTTATCGATAATCCTGTTATGATGGCAGGTTCTGATAACGGTATTTTCAGTAATGAT
AGTATAACGAGTCAAACCCGGCCTGCGTTTAGTATTTATGGAGAAATGAACCAGAGTGTTCAGATTTTCATTGATGGGGT
GTTAGTCGATACGATCACGGTGACGGACAGAAATCAAGTTTATCGACCTGAGTCACCGTTGGGCGATGGTTCCCATAGCA
TTTATTATGTTATCACCGATAAAGCAGGCAACACGGCTACCTCGAAAACGCTAAACTTTACTATCGATACCTTAAATACG
ACGCCTGTCGCTATTGATTCTATCGGCGGACAAACGTTAGCAGAGATGACCGGTAGTGATGGCAAAATATATATAACGGA
CACGACACGTAACTTATTGTTTAGTGGCAGTGCCGAGCCCAATAGCAAAATAGAAATCATCATTAATGGCTTAAATGTGG
GGGAAGTTTGGGTTAATGACAAAGGCCACTGGCAGATGCCGGTGAACCCGCTTTATTTCACAGAAGGCCAGTTGGATATC
ACTGTTAAATCTACGGACCGTGCTGGTAACGTAAATCAGGAAAAGTATTCCATTTGGGTCGATACGCATATCCAGGTATT
TACCAGCGAGCTTGATGACAATAAATCATCATCGAAAACGGACTGGTGGAGTAATAGCTCCACTATTACCATGAGAGGTA
TGGGGGAAATTGGCGCTACGGTATCATTAATCGTGGCAGGGGTCACACTGGCAACCGCTGTCGTTGCGGCTAATGGGCAG
TGGGAGTTATCGACCGATCAGCTTCCGGAAGGGAAATACGATATCACTTTGAGTATTGAGGATAACGCAGGCAACCGTAA
GGAAGAGGTACATGAAATATTTATTGATCGAACGCCGCCAAACGCTCCGGTCGTAACTTATTCAGATATTGTCAACGATC
TAATTATTATGCAGGGGACGGCGGAAGCCAAATCTCAGCTAATAATAACCGATAGTAATGGGAATACTTATACGTTAACC
GTTCCTGATAATGGTAAATGGAGTATGGCGATCCCGTATCCATCGGAAGGGAAGTTTACCATTACGAGTGTGGATGCGAT
TGGTAACCGGAGTGATGATGTCCCTCTCGATATCATGAAAGAGGTTCCCGTTATTTCATTATCTCCAGACTCAGACAGTG
GTACGGTGGGCGATAATATTACGCGAGATAATCAGCCTACCTTTATTATCGGGAATCTGGAAAGCGATGTTGTGGTCGTT
CAGGTCGATATCAATGGGACCGTATATAATGCTGAAAAAAATGCCGATGGCGTTTGGTTCTTTACGCCAGGTACACCGTT
AGCTGATGGTTCCTATACGATATCGGTAATCGCAAGCGATGCCGCGGGTAATCAGAAAAACTCGTTACCCATTACCGTTA
CGATCGACAGTACGCTGACCGTGCCGGAGATTGCGCTGGCAGCAGGTGAAGGCAATGGCGTTTCAGACAGCGATAACGTG
ACGAATCACAATCACACCCAGCCTAAGTTCACGCTGCAGCATATTGATGCTGACGTGACCGGGGTGACCGTAAACGTGAC
GCATAATGGTGTGACAGACATCTATCAGGCGACGCAAGGCGCGGATGGCTGGACCTTCACGCCGCCAGCCGCCTGGAATG
ATGGTACCTACACGCTGAGCGTGACGGTGGTGGATCGCGCGGGGAACTCACTGCAATCTGCTTCGCTGGAGGTGACGGTT
GACTCAACGGTGACGGTAACAGCGGATAGCCAGCATGACGATGCGAGCGATGACGCCACGCCAACAGCGGTTACTCCACC
GGAGTCTGAAACAGTGAATGCCGAAAGCGCTACGCATCTTCGTACAGTGCCATCTGCGGCGGAAGAAAGCGTGGTGAAGG
AGACAGCCTATAGTATTACATTGTTAAACGCTGACTCTGGGGATGAAATAGATCGTTCAATTAGTCAGACACCTTCTTTT
GAAATATCAGTACCTGAGAATATTGTTAATGTCAGTGTTATGTTTGAAGGAGAAGAGTTTACTCTGCCGATAACTAACCA
GAAAGCAATATTCGAAGTTCCGCTATCTTTGGAAGATGGTGAATATACTATGGACGTGAAATTCCTTGATAAGGACGATG
ATTTCCTGATTAAGGAGAAAACATTCTCAGTCGATCACTCCTCGGCGGATATTGTGAACGCAATGAATGCAAGAGGAAAG
ACCGAGGATGATATTAATGATTCCCCTTCAACGAGTTCTGTAGGGCACAACAATAACGGCGCTATTGAAGTTTTCGCCGT
TAATGAAGTTACGTTACCTGTAGATAATCAAGAAGAACACGCATAA

Protein sequence :
MGNKSIQKFFADQNSVIDLSSLGNAKGAKVSLSGPDMNITTPHGSVIIVNGALYSSIKGNNLAVKFKDKTITGAKILGSV
DLKDIQLERIDSSLVDSAQVEKKGNGKRRNKKEEEELKKQLDEAENAKKEADKAKEEAEKAKEAAEKALNEAFEVQNSSK
QIEEMLQNFLADNVAKDNLAQQSDASQQNTQAKATQASKQNDAEKVLPQPINKNTSTGKSNSSKNEENKLDAESVKEPLK
VTLALAAESNSGSKDDSITNFTKPQFVGSTAPNATVIIKINGIAVGQAVADSLGNFTFTAPETLTDGTYNLEAEAKTADG
SGSTKLVITIDSVTDKPTFELSPESSVSGHKGLTPTLTPSIVGTAEENAKVDIYVDNKLVASVDVDKDGNWSYEFKDNEL
SEGENSIKVVAVDKAGNKNETTDSIITDTIAPEKPTIELDDSSDSGIKNDSITNSTLPTFIGVAEPGSTVSIYLGLKHLG
EVIVAKDGTWSYTLTTPLKDGEYNITATATDIAGHTSATANLPFTIDTRISYFSAEIETTDDSGIVGDNVTNNTRPTFTG
KTEPNAIISVINSETGEEVIFKANDKGEWTFNFTSDSVEGVNNLTFTVEDVAGNKKDFSFSYVIDTVAPVPPTVSLEDFV
VLPNGIILSGNDLPALVGTAEPKSTILLMRDGKLYDSIEVDSNGTWNYQFSNKFLQGAYDIEIISQDAAGNKSSTVKYSF
TIQTEVVPPKAELDASDDSGAKGDWITNKHNALTLLGTADRFATVNILIDGKTIGVTTADADGNWNFDISRNLSDNVYKI
TVESIDPLGRTSSVDYQLTIDSFTPIPTVMLHDSADSGVKGDMITKINTPLFTGMAEANAKVSIYVDGVLSGEAIAGDDG
VWNFQFTTALSDGSHDVTVKVEDIAGNTASSSAYNFQIVTQTQKPTIELVNDTGVDNTDHIINEKNPALTGTAAPYSTVK
LYIDGALIAEVRTNKDGRWEYTLKADQGLVDGDHRITASVEDIAGNIAHSDPFLISVDTAISIPIVSLSPDSDSGISDDN
LTNIVKPTLHLKDIDPDIISVQVWDAASDTQIGVATQQPDGSWAYTFTSDLTEGLHQVYVKVEDIAGNKANSAVFDFTID
TTVSTPVISLLSKDDTGVTGDNLTNINKPGFAISGVDADAHRVVVQVMHNGVSEEIELSHLNGSWLFTPGNTWADGSYTL
TVKVEDKAGNTNYSAPLTVVIDTQIAIDGVELVNDSGVKGDNMTNDDRPHFRVTVPTDVNEVRLSIDGGNSWVQATPGVA
GSWEYIWPTDLADGQYTLTVEATDKAGNTVTKTIDFAVDTTLSVPVIVLNSADDTGVQGDNMTNSTQPTFALQHIDDDAV
RVTVSVEHGGVTTTFDATKGVGGWSFTPTGAWADGDYTLSVSVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPND
NLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQNATPGVWDYIWPDDVADGGYTLTVEATDEAGNKTTQTLDFTIDT
TLSVPTLSLDSADDSGIAGDNITNVKTPGFTLNNIDTDVSRVTVEVMHNGIKQEVPLVQTGGQWRFAPTSDWADGDYILT
VKVEDRAGNVKQSAPLTVTVDTHIAIDRIELVNDSGIPDDNLTNEARPHFQVTVPADVNGVRLSIDGGKTWFDATQSATP
GVWDYIWLTNVANGPHTLMVEASDKAGNKTTQKLDFIIDTMLSEPTITLDSADDSAAGDNITNVKMPGFTLGNIDADVTK
VVVTVAHDGKNQQIELIKNGGVWRFTPGAAWTDGDYTLTVKVEDKAGNTNYSAPLTVTIDTQTSIDRIELLNDTGIVGDN
LTNEARPQFHITVPTDVNSVQLSLDGGINWVNATLTPDGVWEYIWPTDLVENTYTLTVKATDVAGNTATETLNFIIDTTL
STPTITLDSADDSGTANDNKTNVKTPGFIIGGIDSDVTQVVVQVMRDGHSEEVELTQTNGQWRFVPGSAWTDGDYTLTVT
VKDEAGNIRHSAPLTVTIDTQIAIDHIELVNDSGIPDDNLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPGV
WDYTWLADVGEGKHTLTVEATDKAGNKTTQQLDFIIDTMLSEPTIVLDNTDDSGTKGDNLTNVNKPTFLLGNIDADARYV
TVEVQHGGTKEVLTATKDATGNWSVTPTGTWADGDYTLTVRVEDEAGNEKHSASLTVTVDTQITIDAIELVNDNGIPGDN
MTNDAHPQFRVTVPGDVNEVSLSIDGGVTWVKATQSATPGVWNYTWPGTVPDGDYTLNVKATDNAGNTVTETLHFTIDTT
LSTPVIVLDSADDTGIQGDNMTNRTQPTFNLQHIDDDAVRVTVSVEHGGVTTTFDATKGVGGWTFTPPTSWGAGDYTLSV
SVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPDDNLTNNVRPQFQVKVPTDVNEVRLSIDGGKTWFNATQSATPG
VWDYTWLADVGEGKHTLTVEATDKAGNQTTQKLDFIIDTLLSEPTIVLDNTDDSGIKGDNLTNANKPTFLLGNIDADARY
VTVEVQHGSTKEVLTATKGATGIWSVTPTGTWADGDYTLTVRVEDEAGNVKYSAPLTVTVDTQITIDVIELVNDNGIPGD
NLTNDVRPHFRVTVPGDVNEVRLSIDGGNTWVRATQGTAGIWDYTWPKDVTDGLHTLTVEATDKAGNKTTQTLDFTIDTR
LSTPTITMDSRDDTGAIGDHITSVKRPGFTIGNIDSDAQSVILRITQGGNSQEVTLTQVGGQWRFTPDADWADGSYTLTV
EVTDNAGNVRQSTPLIVTVDTQTSITDITLVNDHGVPDDNLTNSTRPQFEITVPADVNSVQLSIDGGANWVSAAQGIEGV
WGYTWPTDMGDGKHTLTVMVTDRAGNTATQTLEFFIDTRLSTPTIALDSTDDTGTPGDDMTNRTRPTFILQNIDSDVINV
TVSVTHNGTTTSFTATQGAGGWSFTPPAPWGDGDYTLTVTVEDRAGNTRPSTPLTVTVDTQIAIDHIELVNDSGVPGDNV
TKHVRPQFQISVPDDVEKVLLSIDGGTTWVTAIKSSTAGIWDYTWPTDMPEGQHTLIVEVTDGAGNKMTGTLDFTIDITL
LTPTIELAPDQDTGQNKNDNLTSVTQPVFVLGSIDKDVRHVELSIEHNGTFKTVVLTESADGWRYRPDSALADGSYTFTV
TVTDVAGNQQTSAPLKVTIDGTLTTPVIELAAGEDSGTVGDRLTNHDRPVFDIRQVDSDVTRVMVKVTYNGKTHEEAAVF
TNGQWRFTPSASWADGSYQLAVVVEDLAGNVKESAPLEVRIDTTTTINNIVLLNDTGVQNDQLTNVAKPSFRIDVPGDVI
QVRVTLDGGANWNVIRKNADGQWIFDSPNTLVDGTYTLRVEATDEAGNIANKDLVFNIDTNIQVPTIALDAGQDTGANTA
DNITNISRPTFTIGNVDPDVIKVVVTIDGHDYNATKVGAGWQFTPGNAIPDGSYNITVTVEDKAGNTATSKPLPVVIDTT
AEIESVTLVTDSGDSDVDNITKVDKPQFSIVTADDITHVRVKIDNAANWIELTKGGDGRWIFNVGSALPDGKHTLLVDVT
DIAGNVAQETLQFTIDTTLREPTIVLDPTHDTGDDTNDNLTRINKPVFIIGNVDNDVSHIVVHIDGRDYTIENTGGNLTF
TPDQPLSDGQHTISVTVTDIAGNTKTSAELQIEIDTQVQIDSVTLTTDSGVNDHDNVTNATRPSFEIATPDDVTSVLVSF
DGVNWTPISKNAAGQWEFTAGSALPDGHYTLHVQATDRAGNTANSTLGFTVDTQIDGLSVVMLDDAGKDSTDGITNITSP
RFEISAREPLQSVTVILNGKSSTLTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKISKEVSFTIDTIVSDPSIDLLD
ADDTGESAVDNITSVTKPRFVIGNVPADIDTVVIRINGVSYPVTANGNNLWEFQVPVALNDGVYEAVVVFRDIAGNTSET
KLPFTIDTTTSVSVRMEPASDTGSSNSDNLTNKQNPKFEGTAEPNAKLVITIVDDKSGREVLKHTITVGADGNWSVTPNI
LPDGMYTINVVATDVAGNTAQTQERFTIDTVTIDPTIRLSDPSIDDQYEATSLRPEFKGLAEAFSTIMIQWDGKVVGSAN
ANANGEWSWTPPSVLAPGSYVVSIVAKDKAGNESSQVDFPVVIPVIDVTPPTIKLSEESDSGALGDFTTNNKTPTLVGNT
LPNAIVSIYVDGVKVGEATADTAGRYTFQLSEMKDGHYVVQVGIVNPRDNSELRSTAVDVTIDTEVAELVWNISGMHEGG
YINTVTPEIGGTSEPNSKITIFVNGVEKAIAYTTGAGHWGVVLPALGNDGNYVLTFKVEDVAGNIREFGPQNVILDTVIS
PLTVVLREADDSGKVGDWITNKSHVTIDGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAELDLREGSNAFVVVSEDKAG
NSQQKDILIEHDTQIEISDISLSRDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEASSSGNISYTMPAN
SADGEYQVQFVATDTAGNRVESAITTVTIDSQIAVFDIDEDSLPALSNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEA
DGTWRAPILLQDDGTFNIHFSITDVAGNTEVSKDYSVDVDSSTDFPTLNLEDASNSGSLDDLITSHNKPVLVGTAEAGAT
IHIYVDEKIVANVLVLEDGTWSYQFDNALKDGEYSIRVVAEDPAGNTAESPRLLVTIDTSTFIDNPVMMAGSDNGIFSND
SITSQTRPAFSIYGEMNQSVQIFIDGVLVDTITVTDRNQVYRPESPLGDGSHSIYYVITDKAGNTATSKTLNFTIDTLNT
TPVAIDSIGGQTLAEMTGSDGKIYITDTTRNLLFSGSAEPNSKIEIIINGLNVGEVWVNDKGHWQMPVNPLYFTEGQLDI
TVKSTDRAGNVNQEKYSIWVDTHIQVFTSELDDNKSSSKTDWWSNSSTITMRGMGEIGATVSLIVAGVTLATAVVAANGQ
WELSTDQLPEGKYDITLSIEDNAGNRKEEVHEIFIDRTPPNAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSNGNTYTLT
VPDNGKWSMAIPYPSEGKFTITSVDAIGNRSDDVPLDIMKEVPVISLSPDSDSGTVGDNITRDNQPTFIIGNLESDVVVV
QVDINGTVYNAEKNADGVWFFTPGTPLADGSYTISVIASDAAGNQKNSLPITVTIDSTLTVPEIALAAGEGNGVSDSDNV
TNHNHTQPKFTLQHIDADVTGVTVNVTHNGVTDIYQATQGADGWTFTPPAAWNDGTYTLSVTVVDRAGNSLQSASLEVTV
DSTVTVTADSQHDDASDDATPTAVTPPESETVNAESATHLRTVPSAAEESVVKETAYSITLLNADSGDEIDRSISQTPSF
EISVPENIVNVSVMFEGEEFTLPITNQKAIFEVPLSLEDGEYTMDVKFLDKDDDFLIKEKTFSVDHSSADIVNAMNARGK
TEDDINDSPSTSSVGHNNNGAIEVFAVNEVTLPVDNQEEHA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
SC4140 YP_219127.1 inner membrane protein Not tested SPI-4 Protein 0.0 99
siiE CAE11797.1 large repetitive protein Virulence SPI-4 Protein 0.0 98
STM4261 NP_463126.1 inner membrane protein Not tested SPI-4 Protein 0.0 98

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
CFSAN001992_12575 YP_007472253.1 large repetitive protein VFG0581 Protein 0.0 98