Gene Information

Name : CFSAN002050_04535 (CFSAN002050_04535)
Accession : YP_008258863.1
Strain : Salmonella enterica CFSAN002050
Genome accession: NC_021818
Putative virulence/resistance : Virulence
Product : membrane protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 591676 - 608361 bp
Length : 16686 bp
Strand : +
Note : Derived by automated computational analysis using gene prediction method: GeneMarkS+.

DNA sequence :
ATGGGAAATAAAAGTATACAAAAGTTTTTTGCCGATCAAAATTCTGTAATTGATTTATCTTCTTTGGGTAATGCCAAAGG
CGCAAAAGTTTCTCTTTCGGGGCCAGACATGAACATTACCACGCCGCGTGGTTCAGTGATCATTGTCAATGGCGCTCTTT
ATTCAAGTATCAAAGGCAATAACCTCGCTGTTAAATTTAAAGATAAGACTATTACCGGCGCTAAAATTCTGGGCAGCGTA
GATTTAAAAGATATTCAACTGGAGAGAATTGACAGCTCATTGGTTGATTCTGCTCAGGTAGAAAAGAAAGGTAATGGCAA
ACGACGAAATAAGAAGGAAGAGGATGAATTAAAAAAGCAGCTTGACGATGCTGAAAACGCAAAGAAAGAAGCTGATAAGG
CGAAGGAAGAAGCAGAGAAAGCTAAGGAGGCTGCAGAAAAAGCGCTCAATGAAGCGTTTGAAGTACAGAACTCGTCAAAG
CAAATGGAAGAAATGCTGCAGGAATTTTTGGCTGACAATGTAGCAAAAGACAATCTGGCTCAGCAAAGCGATGCTTCCCA
GCAAAATACACAGGCTAAAGCAACGCAGGCTTCTAAACAGAACGATGCTGAAAAAGTTCTTCCTCAACCTATTAATAAAA
ATACCAGCACTGGCAAAAGTAATAGCAGTAAAAATGAGGAAAATAAGCTCGATGCCGAGTCTGTTAAAGAGCCGCTTAAA
GTCACATTAGCGCTTGCGGCCGAGAGTAACAGCGGTAGCAAAGATGATAGTATAACTAATTTTACCAAACCTCAGTTTGT
AGGTAGCACTGCTCCCAATGCCACGGTTATTATTAAAATTAATGGTATTGCTGTCGGTCAGGCTGTAGCGGATAGTTTGG
GTAACTTCACCTTTACAGCGCCTGAAACATTGACTGATGGAACATACAATCTGGAGGCAGAGGCCAAGACTGCTGATGGG
AGCGGTAGCGCTAAACTTGTCATTACTATCGATTCCGTTACCGATAAACCAACATTTGAACTTTCGCCTGAAAGTAGTGT
GTCCGGTCATAAGGGCTTAACGCCGACCTTGACGCCTTCAATTGTTGGTACGGCGGAAGAGAATGCTAAGGTTGACATTT
ATGTAGATAATAAACTGGTTGCCAGCGTTGATGTCGATAAAGATGGAAACTGGAGTTATGAATTTAAGGATAATGAATTA
TCTGAGGGCGAAAATAGTATAAAAGTCGTTGCTGTAGATAAAGCAGGTAATAAAAACGAAACGACGGATAGTATCATAAC
CGACACCGTTCCTCCGGAAAAGCCGACGATTGAGCTGGATGATAGTAGTGATTCCGGCATTAAAAATGACAACATTACAA
ATAGCACCCTGCCAACATTTATTGGTGTGGCGGAACCCGGTTCTACAGTCTCTATTTATCTTGGACTTAAGCATCTTGGT
GAGGTCATTGTTGCTAAAGATGGGACATGGAGCTATACGCTTACTACGCCGCTCAAGGATGGCGAATACAATATAACAGC
AACAGCTACTGATATTGCCGGGCATACCTCAGCGACGGCAAATCTGCCTTTTACTATTGATACACGTATCAGCTATTTCA
GCGCTGAGATTGAAACGACGAATGATAGCGGTATTGTCGGAGATAACGTTACTAACAATACTCGCCCAACCTTTACAGGT
AAAACTGAGCCAAATGCTATTATCAGTGTCATAAATAGTGAGACTGGCGAAGAGGTTATTTTTAAAGCGAATGACAAGGG
CGAATGGACGTTCAATTTCACTTCCGACTCAGTGGAAGGGATTAACAATCTTACGTTCACTGTTGAAGATGTCGCTGGCA
ACAAAAAGGATTTTTCCTTTAGTTACGTTATCGATACTATTGCCCCTGTACCTCCGACGGTTTCTTTGGAGGATTATGTT
GTTTTGCCGAATGGTATAATTTTATCAGGGAATGATTTACCGGCTTTAGTCGGTACGGCAGAGCCAAAGTCTACCATCTT
ATTGATGCGAGATGGTAAATTATATGACAGCATTGAGGTTGACTCAAACGGGACCTGGAATTATCAGTTTAGTAATAAAT
TTCTTCAGGGCGCCTATGATATTGAAATCATTTCTCAGGATGCCGCTGGTAATAAATCCTCTACTGTTAAATATTCTTTT
ACTATTCAAACTGAAGTTGTACCTCCAAAAGCGGAACTCGATGCCAGTGATGATTCCGGTGCAAAAGGCGACTGGATTAC
CAATAAACATAATGCTCTGACATTACTGGGAACAGCGGATAGGTTTGCTACCGTAAATATCCTTATCGATGGTAAAACGA
TAGGCGTGACGACTGCGGATGCAGACGGTAACTGGAATTTTGATATTTCCCGAAATCTGTCTGACAATGTTTATAAGATT
ACGGTTGAATCCATCGATCCTTTAGGAAGAACGTCATCTGTAGATTATCAGCTTACCATTGATAGCTTTACGCCGATCCC
CACTGTTATGTTGCATGATAGCGCTGATTCTGGCGTTAAAGGCGATATGATTACTAAAATTAATACGCCGTTGTTTACCG
GGATGGCTGAAGCTAATGCTAAGGTTTCCATCTATGTTGACGGTGTGTTAAGTGGTGAGGCTATTGCTGGCGATGATGGT
GTATGGAATTTTCAGTTTACCACAGCGTTATCCGATGGCTCGCATGACGTAACGGTAAAGGTAGAAGATATTGCCGGTAA
TACTGCCTCCTCATCAGCGTATAATTTCCAAATCGTAACGCAAACGCAAAAACCAACAATAGAGTTGGTCAACGATACGG
GGGTTGATAATACAGACCATATTATTAATGAAAAGAATCCTGCACTGACAGGGACCGCTGCACCCTATTCAACGGTTAAA
CTCTATGTTGATGGCGCACTGATCGCTGAGGTCAGAACAAATAAAGATGGCAGATGGGAGTATACCCTGAAAGCCGATCA
AGGTTTGGTTGATGGCGATCATAGAATAACCGCTTCAGTTGAAGATATCGCTGGCAACATTGCCCATTCGGATCCTTTCT
TAATTAGCGTCGATACTGCTATTTCAATACCGATAGTTTCATTGAGCCCGGATTCAGATTCGGGAATTGCAGATGATAAT
TTAACGAATATCGTTAAACCTACCTTGCACCTAAAAGATATTGATCCGGACATTATCAGTGTTCAGGTATGGGATGCCAT
GTCTGATACGCAGATCGGTGTTGCCACGCAACAACCTGATGGTTCATGGGCCTATACCTTTACTTCAGATTTAACGGAAG
GCTTGCATCAGGTTTATGTCAAGGTTGAGGACATTGCGGGTAATAAAGCGAACAGCGCGGTATTCGATTTTACTATCGAT
ACCACAGTATCAACGCCGGTGATTTCCCTGCTTTCTAAGGATGATACGGGGGTTACAGGCGATAACCTGACCAACATCAA
TAAGCCAGGTTTTGCTATTTCCGGTGTTGATGCCGATGCGCATCGGGTCGTCGTACAGGTGATGCACAATGGCGTGAGCG
AAGAGATCGAACTTTCCCACCACAACGGTAGCTGGTTATTTACACCAGGGAATACGTGGGCGGATGGCAGCTACACGTTA
ACGGTGAAAGTAGAAGATAAGGCAGGAAATACCAACTACTCAGCACCGCTGACGGTCGTTATCGATACCCAAATCGCCAT
TGATGGGGTGGAACTGGTCAACGATAGCGGCGTGAAAGGCGATAATATGACCAACGACGACCGTCCCCACTTTCGTGTGA
CGGTACCTACGGATGTCAATGAAGTCCGTCTGAGCATTGACGGTGGTAATTCGTGGGTTCAGGCAACTCCGGGCGTGGCA
GGAAGCTGGGAGTATATCTGGCCGACAGACCTGGCAGATGGTCAATACACGCTAACGGTGGAAGCGACTGATAAAGCAGG
CAATACAGTGACGAAGACCATCGATTTCGCGGTGGATACCACGCTGTCAGTGCCGGTCATCGTACTGAATAGCGCGGACG
ATACCGGTGTCCAGGGTGATAACATGACGAATAGCACCCAGCCGACATTTGCCCTGCAGCATATTGATGATGATGCCGTT
CGCGTTACGGTCAGCGTGGAGCATGGCGGCGTCACCACCACATTTGACGCCACGAAAGGCACAGGCGGATGGACCTTTAC
GCCGCCGGCATTATGGGCGGATGGTGATTATACCCTGAGTGTGTCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCTG
CATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAACATTGAACTGGTCAATGACAGCGGTATTCCCAACGAT
AATCTGACTAATAACGTGCGTCCGCAGTTCCAGGTGACGGTACCGACGGATGTCAACGTGGTGCGCCTGAGCATTGACGG
CGGCAAGACGTGGTTCAACGCTACTCAGGGCGCGACGCCGGGCGCCTGGGATTATATCTGGCCGGATGATGTGGCCGACG
GAGGCTATACCCTGACGGTAGAAGCGACCGACAAGGCGGGAAACCAGACGACGCAGGAACTTGATTTCACCATCGATACC
ACTCTGTCTGTGCCGACCCTCTCGCTGGACAGCGCAGATGACAGCGGCATCGCGGGCGATAATATCACCAATGTTAAAAC
GCCGGGCTTTACCCTCAACAATATTGATACCGATGTCAGCCGGGTGATAGTGGAGGTAATGCACAATGGCATTAAACAGG
AGGTGCCACTGGTTCAGACCGGCGGACAGTGGCGCTTTGCGCCGACCAGCGACTGGGGGGACGGCGACTATATCCTGACG
GTGAAGGTAGAAGATAGGGCCGGAAATGTGAAGCAGTCCGCGCCGTTGACGGTGACAGTGGACACGCATATCGCCATTGA
CCGTATTGAACTGGTTAACGACAGCGGTATCCCCGGCGATAATCTGACCAATGAAGCGCGCCCGCACTTTCAGGTGACAG
TACCGGCGGATGTTAACGGTGTAAGACTGAGTATTGATGGCGGCAAAACGTGGTTTGACGCCACGCAGAGCGCGACGTCG
GGCGTCTGGGATTACACCTGGCTGACGAATGTGGCTAACGGCCCTCACACCCTGATGGTGGAAGCGTCCGACAAGGCGGG
AAACAAAACGACGCAGAAACTGGACTTCACCATCGATACCATTCTGTCAGAACCGACGATTACCCTGGACAGCGCGGATG
ATAGCGCCGCTGGCGATAACATCACCAACGTTAAGATGCCAGGCTTTACCCTCGGTAATATCGACGCCGACGTGACCAAA
GTGGTGGTGACGGTGGCGCATGATGGTAAGAACCAACAGATAGAGTTGATTAAGAACGGCGGTGTGTGGCGCTTTACGCC
GGGCGCAGCCTGGACCGATGGCGACTATACGCTGACGGTAAAGGTAGAAGATAAGGCGGGTAATACAAATTATTCTGCGC
CGCTGACGGTGACTATCGATACGCAAACGTCTATTGATCGCATTGAGCTTCTTAATGACACGGGTATTGTCGGGGATAAC
CTGACCAATGAAGCACGTCCACAGTTTCATATTACGGTACCGACGGACGTGAACTCTGTGCAACTGAGTCTTGATGGCGG
CATCAACTGGGTTAACGCAACGCTGACGTCTGACGGCGTTTGGGAGTATATATGGCCGACAGATCTGGTCGAAAATACGT
ATACCCTGACAGTGAAAGCAACCGATGTTGCAGGCAACACGGCGACGGAAACGCTCAATTTTACCATTGATACCACATTG
TCGACACCGACCATCACGCTGGACAGCGCAGATGATAGCGGCACCGCCAACGATAATAAGACTAACGTTAAAACGCCGGG
TTTTGTTATCGGCGGTATTGATTCTGACGTGACTCAGGTCGTCGTGCAGGTGATGCGCGATGGTCACAGCGAGGAGGTGG
AGCTGACGCAGACTAACGGGCAGTGGCGTTTTGTACCCGGCAGCGCGTGGACTGATGGCGACTATACGCTGACGGTAACG
GTGAAAGATGAGGCGGGTAATATTCGCCACTCAGCGCCGCTGAAGGTCACTGTCGATACCCAAATCGGCATCGACAATAT
TGAACTGGTTAACGACAGTGGTATCCCCAATGACAATCTGACCAACAACGTGCGCCCGCAGTTCCAGGTGACGGTACCGA
CGGATGTCAACGTGGTGCGCCTGAGCATTGACGGCGGCAAAACGTGGTTTAACGCCACACAGAGCGCGACGCCGGGCGTC
TGGGATTACACCTGGCTGACCGATGTGGCTAACGGTTCTCACACTCTGACGGTGGAAGCGACCGACGCGGCGGGAAACAA
GGCAACACAGAACCTGGAGTTCAACATCGATACCCTACTGTCAGAGCCGACTATCGCTCTGGACAGCACGGACGACAGCG
GAACAAAAGGCGATAACCTGACCAACGTGAATAAGCCGACATTTATACTGGGCAATATTGACGCGGACGCACGGTATGTC
ACGGTTGAGGTGCAGCATGGCGGCACGAAAGAGGTGCTGACGGCCACCAAAGGCGCGACCGGCATCTGGAGCGTGACACC
GACCGGTATGTGGGCGGATGGCAGTCATACGCTGACGGTGAGGGTGGAGGATGAAGCGGGTAACGTAAAATACTCAGTGC
CGCTGACGATTACGGTCGATACCCAAATCACCATTGATGATATTGAACTGGTTAATGACAGCGGTACTAAGGGCGACAAT
CTAACTAACGACGCCAATCCACATTTCCGCATCACGGTGCCAGGGGATGTCAACGAAGTCAGTCTGAGTATTGACGGCGG
TGTAACCTGGGTTAAGGCGATGCAAAGCTCGACGTCGGGCGTCTGGAATTATACCTGGCCAAAGACATTGGCAGATGATG
ACTACACGTTAACGGTGAAAGCGACTGATAACGCAGGCAATACGGTGACCTGGACGCTCGACTTCACTATTGATACCACG
CTGTCGACGCCGGTTATTGTACTGGATAGTGCGGACGATACCGGTGTCCAGGGCGATAACATGACCAATCGCACCCAGCC
GACATTTAACCTGCAACATATTGATGATGATGCCGTTCGCGTTACGGTCAGCGTGGAGCATGGCGGCGTCACCACCACAT
TTGACGTGACTAAAGACGCAGGAGGATGGACCTTTACGCCGCCGACATCATGGGGGGCGGGTGATTATACCCTGAGTGTG
TCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCTGCATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAA
CATTGAACTGGTCAATGACAGCGGTATTCCCGACGATAATCTGACTAATAACGTGCGTCCGCAGTTCCAGGTGAAGGTAC
CGACGGATGTTAACGAGGTACGCCTGAGCATTGACGGCGGCAAGACGTGGTTCAACGCTACCCAGAGCGCGACGCCGGGC
GTCTGGGATTATACCTGGCTGGCTGATGTGGGAGAGGGTAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAA
CCAGACGACGCAGAAACTGGACTTCATCATCGATACCCTACTGTCAGAACCGACTATCGCTCTGGACAGCACGGACGACA
GCGGAACAAAAGGCGATAACCTGACCAGCGTGAATAAGCCGACGTTTATACTGGGCAATATTGACGCGGACGCACGGTAT
GTCACGGTTGAGGTACAGCATGGCGGCACGAAAGAGGTGCTGACGGCCACCAAAGGCGCGACCGGCATCTGGAGCGTGAC
ACCGACCGGTATGTGGGCGGATGGCAGTCATACGCTGACGGTGAGGGTGGAGGATGATGCGGGTAACGTAAAATACTCAG
CGCCGCTGACGGTTACGGTCGATACCCATATTGCCATTGATGATATTGAACTGGTTAATGATAACGGTATTCCCGGCGAC
AACCTGACCAATGACGTTCGTCCACACTTCCGCGTCACGGTGCCAGGGGATGTCAACGAGGTACGTCTGAGTATCGACGG
CGGTAATACGTGGGTTCGTGCAACACAGGGCACGGCAGGGATCTGGGATTACACCTGGCCGAAAGATGTGACCGACGGGC
TACATACCCTGACGGTAGAAGCGACCGATAAGGCGGGAAACCAGACGACGCAGACGCTCGATTTTACCATTGATACCCGG
CTGTCAACGCCTACCATCGCTATGGATAGCAGGGACGATACAGGTGCCATTGGCGATCATATTACGAGCGTCAAAAGACC
GGGCTTTACCATTGGCAATATTGACGCCGATGCGCACTCGGTCATTTTGCGGATCACACAGGGCGGCAATAGCCAGGAAG
TGACACTAACCCAGGTTGGAGGACAGTGGCGCTTTACGCCAGATGCTGACTGGGCGGACGGTAGCTATACGCTAACGGTA
GAAGTCCAGGATAACGCGGGGAATATCCGCCAGTCCACGCCGCTGATAGTGACGGTAGATACGCAAACCAGCATTACTGA
TATTACATTGGTCAATGATCATGGCGTGCCTGATGACAATCTAACTAACAGTACCCGTCCGCAGTTTGAGATCACGGTGC
CGGCGGATGTGAATTCTGTGCAACTGAGCATTGATGGGGGCGCAAACTGGGTGAGCGCGGCGCAGGGTATCGAAGGCGTC
TGGGGCTATACCTGGCCAACGGATATGGGCGATGGAAAACACACCCTAACCGTCATGGTCACCGACAGAGCGGGCAATAC
GGCGACGCAAACGCTTGAATTTTTCATCGACACCCGGTTGTCGACGCCGACCATTGCGCTGGATAGCACGGATGATACCG
GTACGCCTGGCGATGATATGACCAATCGCACCCGACCGACCTTTATTCTGCAGAATATCGATTCGGATGTTATCAACGTT
ACAGTCAGCGTCACGCATAATGGAACGACAACCTCGTTTACCGCGACACAGGGGGCTGGAGGATGGAGCTTTACACCGCC
AGCGCCGTGGGGCGACGGTGATTATACGCTGACGGTGACAGTGGAGGATCGGGCGGGAAATACGCGTCCGTCTACGCCGC
TGACGGTGACAGTGGATACGCAAATAGCCATTGATCGTATTGAATTAGTCAACGATAGCGGCGTCCCTGGCGATAATGTG
ACAAAACATGTGCGTCCGCAGTTCCAGATCTCGGTACCGGATGATGTGGAAAAGGTTCTTCTGAGTATTGACGGCGGCAC
GACCTGGGTTACTGCAATCAAGAGTTCGACGGCTGGCATTTGGGATTACACCTGGCCGACGGATATGCCAGAGGGACAGC
ATACCCTGACCGTGGAAGTGACTGACGGTGCGGGTAATAAGATGACGGAGACGCTCAATTTCACTATCGACATCACGTTG
TTGACGCCAACCATTGAGCTGGCGCCCGATCAGGATACCGGACAGAATAAGAACGATAATCTGACCAGCGTCACTCAACC
AGTATTTGTGTTGGGGAGTATCGATAAAGATGTTCGACACGTGGAATTGAGTATTGAGCATAACGGCACGTTTAAAACGG
TGGTACTCACCGAATCAGCCGACGGCTGGCGCTATCGACCGGATTCTGCTTTGGCGGACGGTAGCTACACATTCACCGTG
ACGGTAACAGATGTGGCAGGCAACCAGCAAACATCCGCGCCTTTAAAGGTGACGATAGACGGTTCGTTGACTACGCCGGT
GATTGAGCTGGCGGCCGGCGAAGATAGCGGTACTGTTGGCGATCGCCTCACCAAACACGATCGGCCTGTGTTCGACATAC
GCCAGGTTGATTCTGACGTTACGCGCGTGATGGTCAAAGTAACTTACAACGGTAAAACGCACGAGGAAGCGGCGGTATTC
ACCAATGGTCAATGGCGCTTTACGCCTTCTGCGAGCTGGGCTGATGGCTCATATCAGTTAGCCGTTGTGGTGGAAGATCT
GGCGGGGAATGTAAAAGAATCTGCACCGTTAGAGGTGCGTATTGATACCACGACAACCATTAACAATATCGTATTGCTTA
ATGATACTGGCGTGCAGAATGATCAATTAACGAATGTTGCTAAACCGTCATTCAGAATTGACGTTCCCGGTGATGTCATC
CAGGTACGCGTAACCCTGGATGGTGGCGCTAACTGGAATGTGATACGCAAAAATGCCGACGGACAGTGGATTTTTGACAC
CCCGAATACTCTGGTTGACGGCACATATACCCTTCGCGTAGAGGCCACGGATCAGGCAGGTAATATTGCGAATAAAGATT
TAGTATTTAATATCGATACTAATATACAGGTTCCGACTATTGCTTTAGACGCAGGACAAGATACCGGAGCGAATACCGCC
GATAATATCACTAATATTTCACGACCCACCTTTACGATTGGTAATGTTGACCCCGATGTTATCAAAGTCGTGGTGACGAT
TGATGGTCATGATTATAACGCGACTAAGGTTGGGGCTGGTTGGCAATTTACACCAGGCAATGCCATTCCGGATGGTTCTT
ATAATATTACCGTTACGGTTGAAGATAAGGCAGGGAATACCGCGACATCGAAACCATTACCTGTTGTGATAGATACGACG
GCTGAAATTGAAAGCGTCACGTTGGTTACAGATAGCGGCGATAGCGATGTAGATAACATTACCAAAGTCGACAAGCCGCA
GTTTAGTATTGTTACCGCTGATGATATTACCCATGTGCGCGTTAAAATCGATAACGCCGCTAATTGGATTGAACTCACAA
AAGGAGGGGATGGCCGCTGGATATTTAATGTCGTTTCGGCATTACCTGATGGGCAACACACTCTCTTGGTTGATGTGACT
GATATCGCCGGCAACGTTGCGCAAGAAACGCTGCAGTTTACGATTGATACGACTCTGCGAGAGCCGACAATTGTACTCGA
TCCCACCCATGATACTGGTGATGATACTAATGATAATCTTACCAGGATTAACAAACCGGTGTTTATTATCGGTAATGTCG
ATAATGATGTATCACACATTGTGGTTCATATTGATGGTCGGGATTACACCATTGAAAACACAGGGGGGAATTTAACCTTT
ACGCCGGATCAACCACTGTCTGACGGTCAGCATACGATCTCTGTTACCGTAACGGATATTGCTGGTAATACCAAAACATC
GGCCGAACTGAAGATTGAAATCGACACGCAGGTTCAGATTGACAGTGTTACGTTAACAACAGATAGCGGCGTCAACGATC
ACGATAATGTCACCAATGCTACCCGTCCCTCTTTTGAAATTGCAACGCCTGATGATGTGACATCGGTGCTGGTTTCTTTC
GATGGCGTAAACTGGACGCCTGTCAGTAAAAATGCGGCCGGGCAGTGGCAATTTACTGCAGGTAGCGCATTGTCTGATGG
TCATTATACTCTCCATGTCCAGGCGACGGATCGGGCAGGGAATACGGCAAATTCCACGCTGGGCTTCACCGTGGATACGC
AGATTGACGGCCTGAGCGTCGTGATGCTGGACGACGCCGGAAAGGATTCTACGGATGGTATTACGAATATTACCTCTCCA
CGTTTTGAAATTTCAGCCAGAGAACCGCTGCAGAGCGTGACGGTAATTTTAAACGGGAAATCCAGCACACTGACTCAGGG
GGCAGGTAATAAATGGCTATTTACCCCTGATACACCGTTAGTGGATGGAACTTACAAAATAGAAATAGTGGCTGAAGATA
TCGCAGGTAATAAAATTAGCAAAGAGGTATCATTCACAATAGACACTGTTGTTTCTGATCCCCGTATTGATTTGCTGGAT
GCGGATGATACTGGCGAAAGCGCTGTTGATAATATTACGAGTGTCACTAAACCACGTTTCGTTATTGGCAATGTACCCGC
CGATATTGATACTGTGGTAATCAGAATTAACGGCGTTTCTTATCCGGTTACGGCAAATGGCAATAACCTCTGGGAATTTC
AGGTTCCCGTTGCGTTAAACGATGGCGTATATGAAGCCGTTGTTGTCTTCAGAGATATTGCCGGAAATACTTCTGAAACT
AAGCTGCCCTTTACCATTGATACCACGACAAGCGTCAGTGTCAGAATGGAGCCAGCGTCTGATACCGGCAGCTCCAATAG
CGATAACCTTACGAATAAGCAAAATCCCAAATTCGAAGGTACTGCAGAGCCTAATGCGAAACTGGTGATTACCATTGTTG
ACGATAAGTCAGGTCGGGAGGTTTTAAAACACACGATTACGGTTGGCGCCGATGGCAACTGGAGTGTGACGCCGAATATA
CTGCCGGATGGCATGTATACCATCAACGTCGTCGCAACAGATGTCGCGGGAAATACTGCGCAAACGCAGGAAAGATTCAC
TATCGATACGGTTACGATCGATCCTACCATTCGCCTTTCGGATCCATCTATTGATGATCAGTATGAGGCAACCAGCCTGC
GTCCTGAGTTCAAAGGGCTCGCCGAAGCGTTCTCGACGATTATGATTCAGTGGGATGGGAAAGTGGTCGGCTCGGCAAAC
GCCAATGCGAATGGCGAATGGAGTTGGACGCCGCCATCAGTATTAGCGCCAGGCTCCTATGTTGTGAGCATTGTTGCCAA
AGATAAAGCGGGTAATGAATCGTCGCAGGTCGACTTTCCTGTAGTAATACCGGTTATTGATGTCACGCCTCCAACCATAA
AGCTCAGCGAGGAGAGCGATAGTGGCGCCTTAGGAGACTTTACCACGAATAATAAAACGCCGACCCTGGTTGGGAACACG
TTACCTAATGCGATTGTGAGTATTTATGTGGATGGCGTGAAGGTCGGCGAGGCGACAGCGGATACAGCGGGTCGATATAC
TTTCCAGTTATCGGAAATGAAAGATGGCCATTATGTCGTCCAGGTGGGTATCGTCAACCCTCGCGATAATAGCGAACTGC
GTTCCACTGCCGTTGATGTCACTATCGATACCGAGGTTGCTGAACTGGTATGGAATATATCTGGAATGCATGAGGGCGGA
TATATCAATACGGTGACGCCGGAGATTGGCGGCACCAGTGAGCCAAACAGCAAAATCACTATCTTTGTGAATGGCGTTGA
AAAAGCGATTGCTTATACGACAGGCGCAGGACACTGGGGCGTAGTATTACCCGCTTTGGGTAATGACGGTAATTATGAAT
TAACGTTTAAAGTTGAAGACGTTGCCGGCAATATCAGAGAGTTTGGTCCGCAGAATGTAATACTGGATACGGTAATTTCG
CCGTTAACCGTGGTATTACGCGAAGCTGATGACAGTGGCAAAGTTGGCGACTGGATCACCAATAAATCTCATGTCACCAT
CGATGGTACTGCCGAAGCCGGAAGTACTTTAACCATCAGGAATCCGCAGGGGGTGGTTATTGCTACCCTGGTGGTAGGCA
ATGATGGTCGATGGAGCGCAGAATTAGATCTGCGTGAAGGTAGTAATGCCTTTGTCGTGGTATCGGAAGATAAAGCGGGC
AACAGCCAACAAAAAGATATTCTGATAGAACATGATACGCAGATTGAAATCAGCGATATTTCATTAAGTCGGGATACTAA
TAGCGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTACTGGTTGCCATGACCGATCCCGGCGCGACGGTAC
AGGTTTATATTAATGGTGTGTTACAAGGCACAGTAGAGGCGAGTTCGTCAGGTAATATTAGCTATACCATGCCGGCAAAT
AGCGCCGACGGCGAGTATCAGGTGCAATTTGTTGCTACGGATACTGCTGGTAACCGGGTTGAGTCTGCGATTACAACCGT
GACAATCGATTCTCAAATTGCTGTCTTTGACATTGATGAAGATTCATTACCGGCCCTCTCTAATAACCGGGCGTTGTCAG
TCTCAGGTGTCGGGGAGGCTGGTTCTCAGGTCAGCATCTTTGTCGATGGTAAATTAGTCAACGTTGTTATGGTTGAGGCT
GATGGCACATGGCGCGCGCCGATACTGCTGCAAGATGATGGTAAGTTTAATATTCATTTCAGCATTACTGACGTTGCTGG
TAACACTGAAGTGAGCAAGGATTATAGCGTGGATGTCGATTCATCAACCGACTTCCCAACGCTCAACCTTGAAGATGCGA
GCAACTCTGGTTCACTTGACGATCTGATTACTAGTCACAACAAGCCTGTGTTAGTAGGCACCGCAGAAGCGGGAGCCACA
ATCCATATTTATGTGGATGAAAAGATCGTGGCAAATGTGCTTGTGCTTGAAGATGGAACCTGGTCCTATCAGTTTGATAA
TGCGTTAAAAGATGGTGAATATTCTATCCGTGTGGTTGCCGAAGACCCGGCAGGTAATACGGCAGAATCGCCTCGCTTAC
TCGTCACGATAGATACCAGTACGTTTATCGATAATCCTGTTATGATGGCAGGTTCTGATAACGGTATTTTCAGTAATGAT
AGTATAACGAGTCAGACCCGGCCTGCGTTTAGTATTTTTGGAGAAATGAACCAGAGTGTTCAGATTTTCATTGATGGGGT
GTTAGTCGATACGATCACGGTGACGGACAGAAATCAAGTTTATCGACCTGAGTCACCGTTGGGCGATGGTTCCCATAGCA
TTTATTATGTTATCACCGATAAAGCAGGCAACACGGCTACCTCGAAAACGCTAAACTTTACTATCGATACCTTTAATACG
ACGCCTGTCGCCATTGATTCTATCGGCGGACAAACGTTAGCAGAGATGACCGGTAGTGATGGCAAAATATATATAACGGA
CACGACACGTAACTTATTGTTTAGTGGCAGTGCCGAGCCCAATAGTAAAATAGAAATCATCATTAATGGCTTAAATGTGG
GGGAAGTTTGGGTTAATGACAAAGGCCACTGGCAGATGCCGGTGAACCCGCTTTATTTCACAGAAGGCCAGCTGGATATC
ACTGTTAAATCTACGGACCGTGCTGGTAACGTCAATCAGGAAAAGTATTCCATTTGGGTCGATACGCATATCCAGGTATT
TACCAGCGAGCTTGATGACAATAAATCATCATCGAAAACGGACTGGTGGAGTAATAGCTCCACTATTACCATGAGAGGTA
TGGGGGAAATTGGCGCTACGGTATCATTAATCGTGGCAGGGGTCACGCTGGCAACCGCTGTCGTTGCGGCTAATGGGCAG
TGGGAGTTATCGACCGATCAGCTTCCGGAAGGGAAATACGATATCACTTTGAGTATTGAGGATAACGCAGGCAACCGTAA
GGAAGAGGTACATGAAATATTTATTGATCGAACGCCGCCAAACGCTCCGGTCGTAACTTATTCAGATATTGTCAACGATC
TCATTATTATGCAGGGAACGGCGGAAGCCAAATCTCAGCTAATAATAACCGATAGTAATGGAAATACTTATACGTTAACC
GTTCCTGATAATGGTAAATGGAGTATGGCGATTCCGTATCCATCGGAAGGGAAGTTTACCATTACGAGTGTGGATGCGAT
TGGTAACCGGAGTGATGATGTCCCTCTCGATATCATGAAAGAGGTTCCCGTTATTTCATTATCTCCAGACTCGGACAGTG
GTACGGTGGGCGATAATATTACGCGAGATAAGCAACCTACCTTTATTATCGGGAATCTGGAAAGCGATGTTGTGGTCGTT
CAGGTCGATATCAATGGGACCGTATATAATGCTGAAAAAAATGCCGATGGCGTTTGGTTCTTTACGCCAGGTACACCGTT
AGCTGATGGTTCCTATACGATATCGGTAATCGCAAGCGATGTCGCGGGTAATCAGAAAAACTCGTTACCCATTACCGTTA
CGATCGACAGTACGCTGACCGTGCCGGAGATTGCGCTGGCAGCAGGTGAAGACAATGGCGCTTCAGACAGCGATAACGTG
ACGAATCACAATCACACCCAGCCTAAGTTCACGCTGCAGCATATTGATGCTGATGTGACCGGGGTGACTGTAAACGTGAC
GCATAATGGCGTGACAGACATCTATCAGGCGACGCAAGGCGCGGATGGCTGGACCTTCACGCCGCCAGCCGCCTGGAATG
ATGGTACCTACACGCTGAGCGTGACGGTGGTGGATCGCGCGGGGAACTCACTGCAATCTGCTTCGCTGGAGGTGACGGTT
GACTCAACGGTGACGGTAACAGCGGATAGCCAGCATGACGATGCGAGCGATGACGCCACGGCAACAGCGGTTACTCCACC
GGAGTCTGAAACAGTGAATGCCGAAAGCGCTACGCATCTTCGTACAGTGCCGTCGGCGGCGGAAGAAAGCGTGGTGAAGG
AGACAGCCTATAGTATTACATTGTTAAACGCTGACTCTGGGGATGAAATAGATCGTTCAATTAGTCAGACACCTTCTTTT
GAAATATCAGTACCTGAGAATATTGTTAATGTCAGTGTTATGTTTGAAGGAGAAGAGTTTACTCTGCCGATAACTAACCA
GAAAGCAATATTCGAAGTTCCGCTATCTTTGGAAGATGGTGAATATACTATGGACGTGAAATTCATTGATAAGGACGATG
ATTTCCTGATTAAGGAGAAAACATTCTCAGTCGATCACTCCTCGGCGGATATTGTGAACGCAATGAATGCAAGAGGAAAG
ACCGAGGATGATATTAATGATTCCCCTTCCACGAGTTCTGTAGGGCACAACAATAACGGCGCTATTGATGTTTTCGCCGT
TAATGAAGTTACGCTACCTGTAGATAATCAAGAAGAACACGCATAA

Protein sequence :
MGNKSIQKFFADQNSVIDLSSLGNAKGAKVSLSGPDMNITTPRGSVIIVNGALYSSIKGNNLAVKFKDKTITGAKILGSV
DLKDIQLERIDSSLVDSAQVEKKGNGKRRNKKEEDELKKQLDDAENAKKEADKAKEEAEKAKEAAEKALNEAFEVQNSSK
QMEEMLQEFLADNVAKDNLAQQSDASQQNTQAKATQASKQNDAEKVLPQPINKNTSTGKSNSSKNEENKLDAESVKEPLK
VTLALAAESNSGSKDDSITNFTKPQFVGSTAPNATVIIKINGIAVGQAVADSLGNFTFTAPETLTDGTYNLEAEAKTADG
SGSAKLVITIDSVTDKPTFELSPESSVSGHKGLTPTLTPSIVGTAEENAKVDIYVDNKLVASVDVDKDGNWSYEFKDNEL
SEGENSIKVVAVDKAGNKNETTDSIITDTVPPEKPTIELDDSSDSGIKNDNITNSTLPTFIGVAEPGSTVSIYLGLKHLG
EVIVAKDGTWSYTLTTPLKDGEYNITATATDIAGHTSATANLPFTIDTRISYFSAEIETTNDSGIVGDNVTNNTRPTFTG
KTEPNAIISVINSETGEEVIFKANDKGEWTFNFTSDSVEGINNLTFTVEDVAGNKKDFSFSYVIDTIAPVPPTVSLEDYV
VLPNGIILSGNDLPALVGTAEPKSTILLMRDGKLYDSIEVDSNGTWNYQFSNKFLQGAYDIEIISQDAAGNKSSTVKYSF
TIQTEVVPPKAELDASDDSGAKGDWITNKHNALTLLGTADRFATVNILIDGKTIGVTTADADGNWNFDISRNLSDNVYKI
TVESIDPLGRTSSVDYQLTIDSFTPIPTVMLHDSADSGVKGDMITKINTPLFTGMAEANAKVSIYVDGVLSGEAIAGDDG
VWNFQFTTALSDGSHDVTVKVEDIAGNTASSSAYNFQIVTQTQKPTIELVNDTGVDNTDHIINEKNPALTGTAAPYSTVK
LYVDGALIAEVRTNKDGRWEYTLKADQGLVDGDHRITASVEDIAGNIAHSDPFLISVDTAISIPIVSLSPDSDSGIADDN
LTNIVKPTLHLKDIDPDIISVQVWDAMSDTQIGVATQQPDGSWAYTFTSDLTEGLHQVYVKVEDIAGNKANSAVFDFTID
TTVSTPVISLLSKDDTGVTGDNLTNINKPGFAISGVDADAHRVVVQVMHNGVSEEIELSHHNGSWLFTPGNTWADGSYTL
TVKVEDKAGNTNYSAPLTVVIDTQIAIDGVELVNDSGVKGDNMTNDDRPHFRVTVPTDVNEVRLSIDGGNSWVQATPGVA
GSWEYIWPTDLADGQYTLTVEATDKAGNTVTKTIDFAVDTTLSVPVIVLNSADDTGVQGDNMTNSTQPTFALQHIDDDAV
RVTVSVEHGGVTTTFDATKGTGGWTFTPPALWADGDYTLSVSVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPND
NLTNNVRPQFQVTVPTDVNVVRLSIDGGKTWFNATQGATPGAWDYIWPDDVADGGYTLTVEATDKAGNQTTQELDFTIDT
TLSVPTLSLDSADDSGIAGDNITNVKTPGFTLNNIDTDVSRVIVEVMHNGIKQEVPLVQTGGQWRFAPTSDWGDGDYILT
VKVEDRAGNVKQSAPLTVTVDTHIAIDRIELVNDSGIPGDNLTNEARPHFQVTVPADVNGVRLSIDGGKTWFDATQSATS
GVWDYTWLTNVANGPHTLMVEASDKAGNKTTQKLDFTIDTILSEPTITLDSADDSAAGDNITNVKMPGFTLGNIDADVTK
VVVTVAHDGKNQQIELIKNGGVWRFTPGAAWTDGDYTLTVKVEDKAGNTNYSAPLTVTIDTQTSIDRIELLNDTGIVGDN
LTNEARPQFHITVPTDVNSVQLSLDGGINWVNATLTSDGVWEYIWPTDLVENTYTLTVKATDVAGNTATETLNFTIDTTL
STPTITLDSADDSGTANDNKTNVKTPGFVIGGIDSDVTQVVVQVMRDGHSEEVELTQTNGQWRFVPGSAWTDGDYTLTVT
VKDEAGNIRHSAPLKVTVDTQIGIDNIELVNDSGIPNDNLTNNVRPQFQVTVPTDVNVVRLSIDGGKTWFNATQSATPGV
WDYTWLTDVANGSHTLTVEATDAAGNKATQNLEFNIDTLLSEPTIALDSTDDSGTKGDNLTNVNKPTFILGNIDADARYV
TVEVQHGGTKEVLTATKGATGIWSVTPTGMWADGSHTLTVRVEDEAGNVKYSVPLTITVDTQITIDDIELVNDSGTKGDN
LTNDANPHFRITVPGDVNEVSLSIDGGVTWVKAMQSSTSGVWNYTWPKTLADDDYTLTVKATDNAGNTVTWTLDFTIDTT
LSTPVIVLDSADDTGVQGDNMTNRTQPTFNLQHIDDDAVRVTVSVEHGGVTTTFDVTKDAGGWTFTPPTSWGAGDYTLSV
SVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPDDNLTNNVRPQFQVKVPTDVNEVRLSIDGGKTWFNATQSATPG
VWDYTWLADVGEGKHTLTVEATDKAGNQTTQKLDFIIDTLLSEPTIALDSTDDSGTKGDNLTSVNKPTFILGNIDADARY
VTVEVQHGGTKEVLTATKGATGIWSVTPTGMWADGSHTLTVRVEDDAGNVKYSAPLTVTVDTHIAIDDIELVNDNGIPGD
NLTNDVRPHFRVTVPGDVNEVRLSIDGGNTWVRATQGTAGIWDYTWPKDVTDGLHTLTVEATDKAGNQTTQTLDFTIDTR
LSTPTIAMDSRDDTGAIGDHITSVKRPGFTIGNIDADAHSVILRITQGGNSQEVTLTQVGGQWRFTPDADWADGSYTLTV
EVQDNAGNIRQSTPLIVTVDTQTSITDITLVNDHGVPDDNLTNSTRPQFEITVPADVNSVQLSIDGGANWVSAAQGIEGV
WGYTWPTDMGDGKHTLTVMVTDRAGNTATQTLEFFIDTRLSTPTIALDSTDDTGTPGDDMTNRTRPTFILQNIDSDVINV
TVSVTHNGTTTSFTATQGAGGWSFTPPAPWGDGDYTLTVTVEDRAGNTRPSTPLTVTVDTQIAIDRIELVNDSGVPGDNV
TKHVRPQFQISVPDDVEKVLLSIDGGTTWVTAIKSSTAGIWDYTWPTDMPEGQHTLTVEVTDGAGNKMTETLNFTIDITL
LTPTIELAPDQDTGQNKNDNLTSVTQPVFVLGSIDKDVRHVELSIEHNGTFKTVVLTESADGWRYRPDSALADGSYTFTV
TVTDVAGNQQTSAPLKVTIDGSLTTPVIELAAGEDSGTVGDRLTKHDRPVFDIRQVDSDVTRVMVKVTYNGKTHEEAAVF
TNGQWRFTPSASWADGSYQLAVVVEDLAGNVKESAPLEVRIDTTTTINNIVLLNDTGVQNDQLTNVAKPSFRIDVPGDVI
QVRVTLDGGANWNVIRKNADGQWIFDTPNTLVDGTYTLRVEATDQAGNIANKDLVFNIDTNIQVPTIALDAGQDTGANTA
DNITNISRPTFTIGNVDPDVIKVVVTIDGHDYNATKVGAGWQFTPGNAIPDGSYNITVTVEDKAGNTATSKPLPVVIDTT
AEIESVTLVTDSGDSDVDNITKVDKPQFSIVTADDITHVRVKIDNAANWIELTKGGDGRWIFNVVSALPDGQHTLLVDVT
DIAGNVAQETLQFTIDTTLREPTIVLDPTHDTGDDTNDNLTRINKPVFIIGNVDNDVSHIVVHIDGRDYTIENTGGNLTF
TPDQPLSDGQHTISVTVTDIAGNTKTSAELKIEIDTQVQIDSVTLTTDSGVNDHDNVTNATRPSFEIATPDDVTSVLVSF
DGVNWTPVSKNAAGQWQFTAGSALSDGHYTLHVQATDRAGNTANSTLGFTVDTQIDGLSVVMLDDAGKDSTDGITNITSP
RFEISAREPLQSVTVILNGKSSTLTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKISKEVSFTIDTVVSDPRIDLLD
ADDTGESAVDNITSVTKPRFVIGNVPADIDTVVIRINGVSYPVTANGNNLWEFQVPVALNDGVYEAVVVFRDIAGNTSET
KLPFTIDTTTSVSVRMEPASDTGSSNSDNLTNKQNPKFEGTAEPNAKLVITIVDDKSGREVLKHTITVGADGNWSVTPNI
LPDGMYTINVVATDVAGNTAQTQERFTIDTVTIDPTIRLSDPSIDDQYEATSLRPEFKGLAEAFSTIMIQWDGKVVGSAN
ANANGEWSWTPPSVLAPGSYVVSIVAKDKAGNESSQVDFPVVIPVIDVTPPTIKLSEESDSGALGDFTTNNKTPTLVGNT
LPNAIVSIYVDGVKVGEATADTAGRYTFQLSEMKDGHYVVQVGIVNPRDNSELRSTAVDVTIDTEVAELVWNISGMHEGG
YINTVTPEIGGTSEPNSKITIFVNGVEKAIAYTTGAGHWGVVLPALGNDGNYELTFKVEDVAGNIREFGPQNVILDTVIS
PLTVVLREADDSGKVGDWITNKSHVTIDGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAELDLREGSNAFVVVSEDKAG
NSQQKDILIEHDTQIEISDISLSRDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEASSSGNISYTMPAN
SADGEYQVQFVATDTAGNRVESAITTVTIDSQIAVFDIDEDSLPALSNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEA
DGTWRAPILLQDDGKFNIHFSITDVAGNTEVSKDYSVDVDSSTDFPTLNLEDASNSGSLDDLITSHNKPVLVGTAEAGAT
IHIYVDEKIVANVLVLEDGTWSYQFDNALKDGEYSIRVVAEDPAGNTAESPRLLVTIDTSTFIDNPVMMAGSDNGIFSND
SITSQTRPAFSIFGEMNQSVQIFIDGVLVDTITVTDRNQVYRPESPLGDGSHSIYYVITDKAGNTATSKTLNFTIDTFNT
TPVAIDSIGGQTLAEMTGSDGKIYITDTTRNLLFSGSAEPNSKIEIIINGLNVGEVWVNDKGHWQMPVNPLYFTEGQLDI
TVKSTDRAGNVNQEKYSIWVDTHIQVFTSELDDNKSSSKTDWWSNSSTITMRGMGEIGATVSLIVAGVTLATAVVAANGQ
WELSTDQLPEGKYDITLSIEDNAGNRKEEVHEIFIDRTPPNAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSNGNTYTLT
VPDNGKWSMAIPYPSEGKFTITSVDAIGNRSDDVPLDIMKEVPVISLSPDSDSGTVGDNITRDKQPTFIIGNLESDVVVV
QVDINGTVYNAEKNADGVWFFTPGTPLADGSYTISVIASDVAGNQKNSLPITVTIDSTLTVPEIALAAGEDNGASDSDNV
TNHNHTQPKFTLQHIDADVTGVTVNVTHNGVTDIYQATQGADGWTFTPPAAWNDGTYTLSVTVVDRAGNSLQSASLEVTV
DSTVTVTADSQHDDASDDATATAVTPPESETVNAESATHLRTVPSAAEESVVKETAYSITLLNADSGDEIDRSISQTPSF
EISVPENIVNVSVMFEGEEFTLPITNQKAIFEVPLSLEDGEYTMDVKFIDKDDDFLIKEKTFSVDHSSADIVNAMNARGK
TEDDINDSPSTSSVGHNNNGAIDVFAVNEVTLPVDNQEEHA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
SC4140 YP_219127.1 inner membrane protein Not tested SPI-4 Protein 0.0 98
siiE CAE11797.1 large repetitive protein Virulence SPI-4 Protein 0.0 98
STM4261 NP_463126.1 inner membrane protein Not tested SPI-4 Protein 0.0 98

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
CFSAN002050_04535 YP_008258863.1 membrane protein VFG0581 Protein 0.0 98