Gene Information

Name : SPA4077 (SPA4077)
Accession : YP_153135.1
Strain : Salmonella enterica ATCC 9150
Genome accession: NC_006511
Putative virulence/resistance : Virulence
Product : inner membrane protein
Function : -
COG functional category : S : Function unknown
COG ID : COG1340
EC number : -
Position : 4237394 - 4251076 bp
Length : 13683 bp
Strand : +
Note : similar to Salmonella typhimurium putative inner membrane protein

DNA sequence :
ATGGGAAATAAAAGCATACAAAAGTTTTTTGCCGATCAAAATTCTGTAATTGATTTATCTTCTTTGGGTAATGCCAAAGG
CGCAAAAGTTTCTCTTTCCGGGCCAGACATGAACATTACCACGCCGCATGGGTCAGTGATCATTGTCAATGGCGCTCTTT
ATTCAAGTATCAAAGGCAATAACCTCGCTGTTAAATTTAAAGATAAGACTATTACCGGCGCTAAAATTCTGGGCAGCGTA
GATTTAAAAGATATTCAACTGGAGAGAATTGACAGCTCATTGGTTGATTCTGCTCAGGTAGAAAAGAAAGGTAATGGCAA
ACGACGAAATAAGAAGGAAGAAGAGGAATTAAAAAAGCAGCTTGACGAGGCTGAAAACGCAAAGAAAGAAGCTGATAAGG
CGAAGGAAGAAGCAGAGAAAGCTAAGGAGGCAGCAGAAAAAGCGCTCAATGAAGCGTTTGAAGTACAGAACTCGTCAAAG
CAAATTGAAGAAATGCTGCAGAACTTTTTGGCTGACAATGTAGCAAAAGACAATCTGGCTCAGCAAAGCGATGCTTCCCA
GCAAAATACACAGGCTAAAGCAACGCAGGCTTCTAAACAGAACGATGCTGAAAAAGTTCTTCCTCAACCTATTAATAAAA
ATACCAGTACTGGCAAAAGTAATAGCAGTAAAAATGAGGAAAATAAGCTCGATGCCGAGTCTGTTAAAGAGCCGCTTAAA
GTCACATTAGCGCTTGCGGCCGAGAGTAACAGCGGTAGCAAAGATGATAGTATAACTAATTTTACCAAACCTCAGTTTGT
AGGTAGCACTGCTCCCAATGCCACGGTTATTATTAAAATTAATGGTATTGCTGTCGGTCAGGCTGTAGCGGATAGTTTGG
GTAACTTCACCTTCACAGCGCCTGAAACATTGACTGATGGAACATACAATCTGGAGGCAGAGGCCAAGACTGCTGATGGA
AGCGGTAGCGCCAAACTTGTCATTACTATCGATTCCGTTACCGATAAGCCAACATTTGAACTTTCGCCTGAAAGTAGTGT
GTCCGGTCATAAGGGCTTAACGCCGACCTTGACGCCTTCAATTGTTGGTACGGCGGAAGAGAATGCTAAGGTTGACATTT
ATGTAGATAATAAACTGGTTGCCAGCGTTGATGTCGATAAAGATGGAAACTGGAGTTATGAATTTAAAGATAATGAATTA
TCTGAGGGCGAAAATAGTATAAAAGTCGTTGCCGTGGATAAAGCAGGTAATAAAAACGAAACGACGGATAGTATCATAAC
CGACACCATTTCTCCGGAAAAGCCGACGATTGAGCTGGATGATAGTAGTGATTCCGGCATTAAAAATGACAACATTACAA
ATAGCACTCTGCCAACATTTATTGGTGTGGCGGAACCTGGTTCTACAGTCTCTATTTATCTTGGGCTTAAACATCTTGGT
GAGGTCATTGTTGCTAAAGATGGGACATGGAGCTATACGCTTACTACGCCGCTCAAGGATGGCGAATACAATATAACAGC
AACCGCTACTGATATTGCCGGGCATACCTCTGCGACGGCAAATCTGCCTTTTACTATTGATACCCGTATCAGCTATTTCA
GCGCTGAGATTGAAACGACTGATGATAGCGGTATTGTTGGAGATAACGTTACTAACAATACTCGCCCAACCTTTACAGGT
AAAACTGAGCCAAATGCTATTATCAGTGTCATAAATAGTGAGACTGGCGAAGAGGTTATTTTTAAAGCGAATGACAAGGG
CGAATGGACGTTCAATTTCACTTCAGACTCAGTGGAAGGGGTTAACAATCTTACGTTCACTGTTGAAGATGTCGCTGGCA
ACAAAAAGGATTTTTCCTTTAGTTACGTTATCGATACTGTTGCCCCTGTACCTCCGACGGTTTCTTTGGAGGATTTTGTT
GTTTTACCGAATGGTATAATTTTATCAGGGAATGATTTACCGGCTTTAGTCGGTACGGCAGAGCCAAAGTTTACCATCTT
ATTGATGCGAGATGGTAAATTATATGACAGCATTGAGGTTGACTCAAACGGGACCTGGAATTATCAGTTTAGTAATAAAT
TTCTTCAGGGCGCCTATGATATTGAAATCATTTCTCAGGATGCCGCCGGTAATAAATCCTCTACTGTTAAATATTCTTTT
ACTATTCAAACTGAAGTTGTACCTCCAAAAGCGGAACTCGATGCCAGTGATGATTCCGGTGCAAAAGGCGACTGGATTAC
CAATAAACATAATGCTCTGACATTACTGGGAACAGCGGATAGGTTTGCTACCGTAAATATCCTTATTGATGGTAAAACGA
TAGGCGTGACGACTGCGGATGCAGACGGTAACTGGAATTTTGATATTTCCCGAAATCTGTCTGACAATGTTTATAAGATT
ACGGTTGAATCCATCGATCCTTTAGGAAGAACGTCATCTGTAGATTATCAGCTTACCATTGATAGCTTTACGCCGATCCC
TACTGTTATGTTGCATGATAGCGCTGACTCTGGCGTTAAAGGCGATATGATTACTAAAATTAATACGCCGTTGTTTACCG
GGATGGCTGAAGCTAATGCTAAGGTTTCCATCTATGTTGACGGTGTGTTAAGTGGTGAGGCTATTGCTGGCGATGATGGT
GTATGGAATTTTCAATTTACCACAGCGTTATCCGATGGCTCGCATGACGTAACGGTAAAAGTAGAAGATATTGCCGGTAA
TACTGCCTCCTCATCAGCGTATAATTTCCAAATCGTAACGCAAACGCAAAAACCAACAATAGAGTTGGTCAACGATACGG
GGGTTGATAATACAGACCATATTATTAATGAAAAGAATCCTGCACTGACAGGGACCGCTGCACCCTATTCAACGGTTAAA
CTCTATGTTGATGGCGCACTGATCGCTGAGGTCAGAACAAATAAAAATGGCAGATGGGAGTATACCCTGAAAGCCGATCA
AGGTTTGGTTGATGGCGATCATAGAATAACCGCTTCAGTTGAAGATATCGCTGGCAACATTGCCCATTCGGATCCTTTCT
TAATTAGCGTCGATACTGCTATTTCAATACCGATAGTTTCATTGAGCCCGGATTCAGATTCGGGAATTGCAGATGATAAT
TTAACGAATATCGTTAAACCTACCTTGCACCTAAAAGATATTGATCCGGACATTATCAGTGTTCAGGTATGGGATGCCAT
GTCTGATACGCAGATCGGTGTTGCCACGCAACAACCTGATGGTTCATGGGCCTATACCTTTACTTCAGATTTAACGGAAG
GCTTGCATCAGGTTTATGTCAAGGTTGAGGACATTGCGGGTAATAAAGCGAACAGCGCGGTATTCGATTTTACTATCGAT
ACCACAGTATCAACGCCGGTGATTTCCCTGCTTTCTAAGGATGATACGGGGGTGACAGGCGATAACCTGACCAATATCAA
TAAGCCAGGTTTTGCTATTTCCGGTGTTGATGCCGATGCGCATCGGGTCGTCGTACAGGTGATGCACAATGGCGTGAGCG
AAGAGATCGAACTTTCCCACCTCAATGGTAGTTGGTTATTTACACCAGGGAATACGTGGGCGGATGGCAGCTACACGTTA
ACGGTGAAAGTAGAAGATAAGGCAGGAAATACCAGCTATTCAGCGCCGCTGACGGTCGTTATCGATACCCAAATCGCCAT
TGATGGGGTGGAACTGGTCAACGATAGCGGCGTGAAAGGCGATAATATGACCAACGACGACCGTCCCCACTTTCGTGTGA
CGGTACCTACGGATGTCAATGAAGTCCGTCTGAGCATTGACGGTGGTAATTCGTGGGTTCAGGCAACCCCGGGCGTGGCA
GGAAGCTGGGAGTATATCTGGCCGACAGACCTGGCAGATGGTCAATACACGCTAACGGTGGAAGCGACTGATAAAGCAGG
CAATACAGTGACGAAGACCATCGATTTCGCGGTGGATACCACGCTGTCAGTGCCGGTCATCGTACTGAATAGCGCGGACG
ATACCGGTGTCCAGGGCGATAACATGACGAATCGCACCCAGCCGACATTTGCCCTGCAGCATATTGATGATGATGCCGTT
CGCGTTACGGTCAGCGTGGAGCATGGCGGCGTCACCACCACATTTGACGCCACGAAAGGCACAGGCGGATGGACCTTTAC
GCCGACAGGGGCGTGGGCGGATGGGGATTATACCCTGAGTGTGTCAGTCGAAGATAAAGCGGGGAACACCAGTCATTCTG
CATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAACATTGAACTGGTCAATGACAGCGGTATTCCCGACGAT
AATCTGACTAATAACGTGCGTCCGCACTTCCAGGTGACGGTACCGACGGATGTCAACGTGGTGCGCCTGAGCATTGACGG
CGGCAAGACGTGGTTCAACGCTACCCAGAGCGCGACGCCGGGCGTCTGGGATTATACCTGGCTGGCTGATGTGGGAGAGG
GGAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAACCAGACGACGCAGCAACTGGACTTCATCATTGATACC
CTACTGTCAGAACCGACTATCGTGCTGGACAACACGGACGACAGCGGAACAAAAGGCGATAACCTGACCAACGTAAATAA
GCCGACGTTTTTACTGGGCAATATTGACGTAGACGCGCGGTATGTCACGGTTGAGGTGCTGCATGGCGGCACGAAAGAAG
TGCTGACGGCCACCAAAGGCGCGACCGGCATCTGGAGCGTGACACCGACCGGCACATGGGCAGATGGCGACTATACGCTG
ACGGTGAGGGTGGAGGATGATGCGGGGAACGTAAAATACTCAGCGCCGCTGACGGTCACGGTTGATACCCAAATCACCAT
CGATGTTATTGAACTGGTTAATGATAACGGTATTCCCGGCGACAACCTGACCAATGACGTTCGTCCACACTTCCGCGTCA
CGGTGCCAGGGGATGTCAACGAGGTACGTCTGAGTATCGACGGCGGTAATACGTGGGTTCGTGCAACACAGGGCACGGCA
GGGATCTGGGATTACACCTGGCCGAAAGATGTGACCGACGGGCTACATACCCTGACGGTAGAAGCGACCGATAAGGCGGG
AAATAAGACGACGCAGACGCTCGATTTTACCATTGATACCCGGCTGTCAACGCCTACCATCGCTATGGACAGCAGGGACG
ATACAGGCGCCATTGGCGATCATATTACGAGCGTCAAAAGACCGGGCTTTACCATTGGCAATATTGACGCCGATGCGCAC
TCGGTCATTTTGCGGATCACACAGGGCGGCAATAGCCAGGAAGTGACACTAACCCAGGTTGGAGGACAGTGGCGCTTTAC
GCCAGATGCTGACTGGGCGGACGGTAGCTATACGCTGACGGTAGAGGTAACGGATAACGCAGGAAACGTTCGTCAGTCCA
CGCCGCTGGTGGTGACGGTGGACACGCAAACCAGCATTACTGATATTACATTGGTCAATGATCATGGCGTACCTGATGAC
AATCTAACTAATAGCACCCGTCCGCAGTTTGAGATCACGGTGCCGGCGGATGTGAATTCTGTGCAACTGAGCATTGATGG
GGGCGCAAACTGGGTGAGCGCGACGCAGGGTATCGAAGGCGTCTGGGGCTATACCTGGCCAACGGATATGGGCGATGGAA
AACACACCCTAACCGTCATGGTCACCGACAGAGCGGGCAATACGGCGACGCAAACGCTTGAATTTTTCATCGACACCCGG
TTGTCGACGCCGACCATTGCGCTGGATAGCACGGATGATACCGGTACGCCTGGCGATGATATGACCAATCGCACCCGGCC
GACTTTTATTCTGCAGAATATCGATTCGGATGTTATCAACGTTACAGTCAGCGTCACGCATAATGGAACGACAACCTCGT
TTACCGCGACACAGGGGGCTGGAGGATGGAGCTTTACACCGCCAGCGCCGTGGGGCGACGGTGATTATACGCTGACGGTG
ACAGTGGAGGATCGGGCGGGAAATACGCGTCCGTCTACGCCGCTGACGGTGACAGTGGATACGCAAATAGCCATTGATCA
TATTGAATTAGTCAACGATAGCGGCGTCCCTGGCGATAATGTGACAAAACATGTGCGTCCGCAGTTCCAGATCTCGGTAC
CGGATGATGTGGAAAAGGTTCTTCTGAGTATTGACGGCGGCACGACCTGGGTTACTGCAATCAAGAGTTCGACGGCTGGC
ATTTGGGATTACACCTGGCCGACGGATATGCCAGAGGGACAGCATACCCTGATCGTGGAAGTGACTGACGGTGCGGGTAA
TAAGATGACGGGGACGCTCGATTTCACTATCGACATCACGTTGTTGACGCCAACCATTGAGCTAGCGCCCGATCAGGATA
CCGGACAGAATAAGAACGATAATCTGACCAGCGTCACTCAGCCGGTATTTGTGTTGGGGAGTATCGATAAAGATGTTCGA
CACGTGGAATTGAGTATTGAGCATAACGGCACGTTTAAAACGGTGGTACTCACCGAATCAGCCGACGGCTGGCGCTATCG
ACCGGATTCTGCTTTGGCGGACGGTAGCTACACATTCACCGTGACGGTAACAGATGTGGCCGGTAATCAGCAAACATCCG
CGCCTTTAAAGGTGACGATAGACGGTACGTTGACTACGCCGGTGATTGAGCTGGCGGCCGGCGAAGATAGCGGTACTGTT
GGCGATCGCCTCACCAATCACGATCGGCCTGTGTTCGACATACGCCAGATTGATTCTGACGTTACGCGCGTGATGGTCAA
AGTAACTTACAACGGTAAAACGCACGAGGAAGCGGCGGTATTCACCAATGGTCAATGGCGCTTTACGCCTTCTGCGAGCT
GGGCTGATGGCTCATATCAGTTAGCCGTTGTGGTGGAAGATCTGGCGGGGAATGTAAAAGAATCTGCGCCGTTAGAGGTA
CGTATTGATACCACGACAACCATTAACAATATCGTATTGCTTAATGATACTGGCGTGCAGAATGATCAATTAACGAATGT
TGCCAAACCGTCATTCAGAATTGACGTTCCCGGTGATGTCGTCCAGGTACGCGTAACCCTGGATGGTGGCGCTAACTGGA
ATGTGATACGCAAAAATGCCGACGGACAGTGGATTTTTGACAGCCCGAATACTCTGGTTGACGGCACATATACCCTTCGC
GTAGAGGCCACGGATGAGGCAGGTAATATTGCGAATAAAGATTTAGTATTTAATATCGATACTAATATACAGGTTCCGAC
TATTGCTTTAGACGCAGGACAAGATACCGGAGCGAATACAGCCGATAATATTACTAATATTTCACGACCCACCTTTACGA
TTGGTAATGTTGACCCCGATGTTATCAAAGTCGTGGTGACGATTGATGGTCATGATTATAACGCGACTAAGGTTGGGGCT
GGTTGGCAATTTACACCAGGCAATGCCATTCCGGATGGTTCTTATAATATTACCGTTACGGTTGAAGATAAGGCCGGAAA
TACCGCGACATCGAAACCATTACCTGTTGTGATAGATACGACGGCTGAAATTGAAAGCGTCACGTTGGTTACAGATAGCG
GTGATAGCGATGTAGATAACATTACCAAAGTCGACAAGCCGCAGTTTAGTATTGTTACCGCTGATGATATTACCCATGTG
CGCGTTAAAATCGATAACGCCGCTAATTGGATTGAACTCACAAAAGGAGGGGATGGTCGCTGGATATTTAATGTCGGTTC
GGCATTACCTGATGGGCAACACACTCTCTTGGTTGATGTGACTGATATCGCCGGCAACGTTGCGCAAGAAACGCTGCAGT
TTACGATTGATACGACTCTGCGAGAGCCGACAATTGTACTCGATCCCACCCATGATACTGGTGATGATACTAATGATAAT
CTTACCAGGATTAACAAACCGGTGTTTATTATCGGTAATGTCGATAATGATGTATCACACATTGTGGTTCATCTTGATGG
TCGGGATTACACCATTGAAAACAAAGGGGGGAATTTAACCTTTACGCCGGATCAACCGCTGTCTGACGGTCAGCATACGA
TCTCTGTTACCGTAACGGATATTGCTGGTAATACCAAAACATCGGCCGAACTGCAGATTGAAATCGACACGCAGGTTCAG
ATTGACAGTGTTACGTTAACAACAGATAGCGGCGTCAACGATCACGATAATGTCACCAATGCTACCCGTCCCTCTTTTGA
AATTGCAACGCCTGATGATGTGACATCGGTGCTGGTTTCTTTCGATGGCGTAAACTGGACGCCCATCAGTAAAAATGCGG
CCGGGCAGTGGCAATTTACTGCAGGTAGCGCATTGTCTGATGGTCATTATACTCTCCATGTCCAGGCGACGGATCGGGCA
GGGAATACGGCAAATTCCACGCTGGGCTTTACCGTGGATACGCAGATTGACGGCCTGAGCGTCGTGATGCTGGACGACGC
CGGAAAGGATTCTACGGATGGTATTACGAATATTACCTCTCCACGTTTTGAAATTTCAGCCAGAGAACAGTTGCAGAGCG
TGACGGTAATTTTAAACGGGAAATCCAGCACCCTGACTCAGGGGGCAGGTAATAAATGGCTGTTTACCCCTGATACACCG
TTAGTGGATGGAACTTACAAAATAGAAATAGTGGCTGAAGATATCGCAGGTAATAAAATTAGCAAAGAGGTATCATTCAC
AATAGACACTATTGTTTCTGATCCCAGTATTGATTTGCTGGATGCGGATGATACTGGCGAAAGCGCTGTTGATAATATTA
CGAGTGTCACTACACCACGTTTCGTTATTGGCAATGTACCCGCCGATATTGATACTGTTGTAATCAGAATTAACGGCGTT
TCTTATCCGGTTACGGCAAATGGCAATAACCTCTGGGAATTTCAGGTTCCCGTTGCGTTAAACGATGGCGTATATGAAGC
CGTTGTTGTCTTCAGAGATATTGCCGGAAATACTTCTGAAACTAAGCTGCCCTTTACCATTGATACCACGACAAGCGTCA
GTGTCAGAATGGAGCCAGCGTCTGATACCGGCAGCTCCAATAGCGATAACCTTACGAATAAGCAAAATCCCAAATTCGAA
GGTACTGCAGAGCCCAATGCGAAACTGGTGATTACCATTGTTGACGATAAGTCAGGTCGGGAGGTTTTAAAACACACGAT
TACGGTTGGCGCCGATGGCAACTGGAGTGTGACGCCGAATATACTGCCGGATGGCATGTATACCATCAACGTCGTCGCAA
CAGATGTCGCGGGAAATACTGCGCAAACGCAGGAAAGATTCACTATCGATACGGTTACGATCGATCCCACCATTCGCCTT
TCGGATCCATCTATTGATGATCAGTATGAGGCAACCAGCCTGCGTCCTGAGTTCAAAGGGCTCGCCGAAGCGTTCTCGAC
GATTATGATTCAGTGGGATGGGAAAGTGGTCGGCTCGGCAAACGCCAATGCGAATGGTGAATGGAGTTGGACGCCGCCAT
CAGTATTAGCGCCAGGCTCCTATGTTGTGAGCATTGTTGCCAAAGATAAAGCGGGTAATGAATCGTCGCAGGTCGACTTT
CCTGTAGTAATACCTGTTATTGATGTCACGCCTCCAACCATAAAGCTCAGCGAGGAGAGCGATAGTGGTGCCTTAGGAGA
CTTTACGACGAATAATAAAACGCCGACCCTGATTGGGAGCACGTTACCTAATACGATTGTGAGTATTTATGTGGATGGCG
TGAAGGTCGGCGAGGCGACAGCGGATACAGCGGGCCGATATACTTTCCAGTTATCGGAAATGAAAGATGGCCATTATGTC
GTCCAGGTGGGTATCGTCAACCCTCGCGATAATAGCGAACTGCGTTCCACCGCCGTTGATGTCACTATCGATACCGAGGT
TGCTGAACTGGTATGGAATATATCTGGAATGCATGAGGGCGGATATATCAACACGGTGACGCCGGAGATTGGCGGCACCA
GTGAGCCAAACAGCAAAATCACTATCTTTGTGAATGGCGTTGAAAAAGCGATTGCTTATACGACAGGCGCAGGACACTGG
GGCGTAGTATTACCCGCTTTGGGTAATGACGGTAATTATGAATTAACGTTTAAAGTTGAAGACGTTGCCGGCAATATCAG
AGAGTTTGGTCCGCAGAATGTGATACTGGATACGGTAATTTCGCCGTTAACCGTGGTATTACGCGAAGCTGATGACAGTG
GCAAAGTTGGCGACTGGATCACCAATAAATCTCATGTCACCATCGATGGTACTGCCGAAGCCGGAAGTACTTTGACCATC
AGGAATCCGCAGGGAGTGGTTATTGCTACCCTGGTGGTAGGCAATGATGGTCGATGGAGCGCAGAATTAGATCTGCGTGA
AGGTAGTAATGCCTTTGTCGTGGTATCGGAAGATAAAGCGGGCAACAGCCAACAAAAAGATATTCTGATAGAACATGATA
CGCAGATTGAAATCAGCGATATTTCATTAAGTCGGGATACTAATAGCGGTGATAAATATGATCTGATTACCAATAATAAG
TCTCCGGTACTGGTTGCCATGACCGATCCCGGCGCGACGGTACAGGTTTATATTAATGGTGTGTTACAAGGCACAGTAGA
GGCGAGTTCGTCAGGTAATATTAGCTATACCATGCCGGCAAATAGCGCCGACGGCGAGTATCAGGTGCAATTTGTTGCTA
CGGATACTGCTGGTAACCGGGTTGAATCTGCGATTACGACCGTGACAATCGATTCTCAAATTGCTGTCTTTGATATTGAT
GAAGATTCATTACCGGCCCTCTCTAATAACCGGGCGTTGTCAGTCTCAGGCGTCGGGGAGGCTGGTTCTCAGGTCAGCAT
CTTTGTCGATGGTAAATTAGTCAACGTTGTTATGGTTGAGGCTGATGGCTCATGGCGCGCGCCGATACTGCTGCAAGATG
ATGGTACGTTTAATATTCATTTCAGCATTACTGACGTTGCTGGCAACACTCAAGTAAGCAAGAATTACAGTGTGGATGTC
GATTCATCAACCGACTTCCCAACGCTCAACCTTGAAGATGCGAGCAACTCTGGTTCACTTGACGATCTGATTACTAATCA
CAACAAGCCTGTGTTAGTTGGCACCGCAGAAGCGGGAGCCACAATCCATATTTATGTGGATGAAAAGATCGTGGCAAATG
TGCTTGTGCTTGAAGATGGAACCTGGTCCTATCAGTTTGATAATGCGTTAAAAGATAGTGAATATTCTATCCGTGTGGTT
GCCGAAGACCCGGCAGGTAATACGGCAGAATCGCCTCGCTTACTCGTCACGATAGATACCAGTACGTTTATCGATAATCC
TGCTATGGTGGCAGGTTCTGATAACGGTATTTTCAGTAATGATAGTATAACGAGTCAGACCCGGCCTACGTTTAGTATTT
TTGGAGAAATGAACCAGAGTGTTCAGATTTTCATTGATGGGGTGTTAGTCGATACGATCACGGTGACGGACAGAAATCAA
GTTTATCGACCTGAGTCACCGTTGGGCGATGGTTCCCATAGCATTTATTATGTTATCACCGATAAAGCAGGCAACACGGC
TACCTCGAAAACGCTAAACTTTACTATCGATACCTTTAATACGACGCCTGTCGCCATTGATTCTATCGGTGGACAAACGT
TAGCAGAGATGACCGGTAGTGATGGCAAAATATATATAACGGACACGACGCGTAACTTATTGTTTAGTGGCAGTGCCGAG
CCCAATAGCAAAATAGAAATCATCATTAATGGCTTAAATGTGGGGGAAGTTTGGGTTAATGAAAAAGGCCACTGGCAGAT
GCCGGTGAACCCGCTTTATTTCACAGAAGGCCAACTGGATATCACTGTTAAATCTACGGACCGTGCTGGTAACGTAAATC
AGGAAAAGTATTCCATTTGGGTCGATACGCATATCCAGGTATTTACCAGCGAGCTTGATGACAATAAATCATCATCGAAA
ACGGACTGGTGGAGTAATAGCTCCACTATTACCATGAGAGGTATGGGGGAAATTGGCGCTACGGTATCATTAATCGTGGC
AGGGGTCACGCTGGCAACCGCTGTCGTTGCGGCTAATGGGCAGTGGGAATTATCGACCGATCAGCTTCCGGAAGGGAAAT
ACGATATCACTTTGAGTATTGAGGATAACGCAGGCAACCGTAAGGAAGAGGTACATGAAATATTTATTGATCGAACGCCG
CCAAACGCTCCGGTCGTAACTTATTCAGACATTGTCAACGATCTAATTATTATGCAGGGAACGGCGGAAGCCAAATCTCA
GCTAATAATAACCGATAGTAATGGGAATACTTATACGTTAACCGTTCCTGATAATGGTAAATGGAGTATGGCGATCCCGT
ATCCATCGGAAGGGAAGTTTACCATTACGAGTGTGGATGCGATTGGTAACCGGAGTGATGATGTCCCTCTCGATATCATG
AAAGAGGTTCCCGTTATTTCATTATCTCCAGACTCAGACAGTGGTACGGTGGGCGATAATATTACGCGCGATAAGCAACC
TACCTTTATTATCGGGAATCTGGAAAGCGATGTTGTGGTCGTTCAGGTCGATATCAATGGGACAGTATATAATGCTGAAA
AAAATGCCGATGGCGTTTGGTTCTTTACGCCAGGTACACCGTTAGCTGATGGTTCCTATACGATATCGGTAATCGCAAGC
GATGCCGCGGGTAATCAGAAAAACTCGTTACCCATTACCGTTACGATCGACAGTACGCTGACGGTGCCGGAGATTGCGTT
GGCAGCAGGTGAAGACAATGGCGTTTCAGACAGCGATAACGTGACGAATCACACCCAGCCTAAGTTCACGCTGCAGCATA
TTGATGCTGATGTGACCGGGGTGACCGTAAACGTGACGCATAACAGCGTGACAGACACCTATCAGGCGACGCAAGGCGCG
GATGGCTGGACCTTCACGCCGCCAGCCGCCTGGAATGATGGTACCTACACGCTGAGCGTGACGGTGGTGGATCGCGCGGG
GAACTCACAGCAATCTGCTTCGCTAGCGGTGACGGTTGACTCAACGGTGACGGTAACAGCGGATAGCCAGCATGACGATG
CGAGCGATGACGCCACGCCAACAGCGGTTACTCCACCGGAGTCTGAAACAGTGAATGCCGAAAGCGATACGCATCTTCGT
ACAGTGCCGTCTGCGGCGGAAGAAAGCGTGGTGAAGGAGACGGCCTATAGTATTACATTGTTAAACGCTAACTCTGGGGA
TGAAATAGATCGTTCAATTAGTCAGACACCTTCTTTTGAAATATCAGTACCTGAGAATATTGTTAATGTCAGTGTTATGT
TTGAAGGAGAAGAGTTTACTCTGCCGATAACTAACCAGAAAGCAATATTCGAAGTTCCGCTATCTTTAGAAGATGGTGAA
TATACTATGGACGTGAAATTCATTGATAAGGACGATGATTTCCTGATTAAGGAAAAAACATTCTCAGTCGATCACTCCTC
GGCGGATATTGTGAACGCAATGAATGCAAGAGGAAAGACCGAGGATGATATTAATGATTCCCCTTCCACGAGTTCTGTAG
GGCACAACAATAACGGCGCTATTGATGTTTTCGCCGTTAATGAAGTTACGCTACCTGTAGATAATCAAGAAGAACACGCA
TAA

Protein sequence :
MGNKSIQKFFADQNSVIDLSSLGNAKGAKVSLSGPDMNITTPHGSVIIVNGALYSSIKGNNLAVKFKDKTITGAKILGSV
DLKDIQLERIDSSLVDSAQVEKKGNGKRRNKKEEEELKKQLDEAENAKKEADKAKEEAEKAKEAAEKALNEAFEVQNSSK
QIEEMLQNFLADNVAKDNLAQQSDASQQNTQAKATQASKQNDAEKVLPQPINKNTSTGKSNSSKNEENKLDAESVKEPLK
VTLALAAESNSGSKDDSITNFTKPQFVGSTAPNATVIIKINGIAVGQAVADSLGNFTFTAPETLTDGTYNLEAEAKTADG
SGSAKLVITIDSVTDKPTFELSPESSVSGHKGLTPTLTPSIVGTAEENAKVDIYVDNKLVASVDVDKDGNWSYEFKDNEL
SEGENSIKVVAVDKAGNKNETTDSIITDTISPEKPTIELDDSSDSGIKNDNITNSTLPTFIGVAEPGSTVSIYLGLKHLG
EVIVAKDGTWSYTLTTPLKDGEYNITATATDIAGHTSATANLPFTIDTRISYFSAEIETTDDSGIVGDNVTNNTRPTFTG
KTEPNAIISVINSETGEEVIFKANDKGEWTFNFTSDSVEGVNNLTFTVEDVAGNKKDFSFSYVIDTVAPVPPTVSLEDFV
VLPNGIILSGNDLPALVGTAEPKFTILLMRDGKLYDSIEVDSNGTWNYQFSNKFLQGAYDIEIISQDAAGNKSSTVKYSF
TIQTEVVPPKAELDASDDSGAKGDWITNKHNALTLLGTADRFATVNILIDGKTIGVTTADADGNWNFDISRNLSDNVYKI
TVESIDPLGRTSSVDYQLTIDSFTPIPTVMLHDSADSGVKGDMITKINTPLFTGMAEANAKVSIYVDGVLSGEAIAGDDG
VWNFQFTTALSDGSHDVTVKVEDIAGNTASSSAYNFQIVTQTQKPTIELVNDTGVDNTDHIINEKNPALTGTAAPYSTVK
LYVDGALIAEVRTNKNGRWEYTLKADQGLVDGDHRITASVEDIAGNIAHSDPFLISVDTAISIPIVSLSPDSDSGIADDN
LTNIVKPTLHLKDIDPDIISVQVWDAMSDTQIGVATQQPDGSWAYTFTSDLTEGLHQVYVKVEDIAGNKANSAVFDFTID
TTVSTPVISLLSKDDTGVTGDNLTNINKPGFAISGVDADAHRVVVQVMHNGVSEEIELSHLNGSWLFTPGNTWADGSYTL
TVKVEDKAGNTSYSAPLTVVIDTQIAIDGVELVNDSGVKGDNMTNDDRPHFRVTVPTDVNEVRLSIDGGNSWVQATPGVA
GSWEYIWPTDLADGQYTLTVEATDKAGNTVTKTIDFAVDTTLSVPVIVLNSADDTGVQGDNMTNRTQPTFALQHIDDDAV
RVTVSVEHGGVTTTFDATKGTGGWTFTPTGAWADGDYTLSVSVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPDD
NLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPGVWDYTWLADVGEGKHTLTVEATDKAGNQTTQQLDFIIDT
LLSEPTIVLDNTDDSGTKGDNLTNVNKPTFLLGNIDVDARYVTVEVLHGGTKEVLTATKGATGIWSVTPTGTWADGDYTL
TVRVEDDAGNVKYSAPLTVTVDTQITIDVIELVNDNGIPGDNLTNDVRPHFRVTVPGDVNEVRLSIDGGNTWVRATQGTA
GIWDYTWPKDVTDGLHTLTVEATDKAGNKTTQTLDFTIDTRLSTPTIAMDSRDDTGAIGDHITSVKRPGFTIGNIDADAH
SVILRITQGGNSQEVTLTQVGGQWRFTPDADWADGSYTLTVEVTDNAGNVRQSTPLVVTVDTQTSITDITLVNDHGVPDD
NLTNSTRPQFEITVPADVNSVQLSIDGGANWVSATQGIEGVWGYTWPTDMGDGKHTLTVMVTDRAGNTATQTLEFFIDTR
LSTPTIALDSTDDTGTPGDDMTNRTRPTFILQNIDSDVINVTVSVTHNGTTTSFTATQGAGGWSFTPPAPWGDGDYTLTV
TVEDRAGNTRPSTPLTVTVDTQIAIDHIELVNDSGVPGDNVTKHVRPQFQISVPDDVEKVLLSIDGGTTWVTAIKSSTAG
IWDYTWPTDMPEGQHTLIVEVTDGAGNKMTGTLDFTIDITLLTPTIELAPDQDTGQNKNDNLTSVTQPVFVLGSIDKDVR
HVELSIEHNGTFKTVVLTESADGWRYRPDSALADGSYTFTVTVTDVAGNQQTSAPLKVTIDGTLTTPVIELAAGEDSGTV
GDRLTNHDRPVFDIRQIDSDVTRVMVKVTYNGKTHEEAAVFTNGQWRFTPSASWADGSYQLAVVVEDLAGNVKESAPLEV
RIDTTTTINNIVLLNDTGVQNDQLTNVAKPSFRIDVPGDVVQVRVTLDGGANWNVIRKNADGQWIFDSPNTLVDGTYTLR
VEATDEAGNIANKDLVFNIDTNIQVPTIALDAGQDTGANTADNITNISRPTFTIGNVDPDVIKVVVTIDGHDYNATKVGA
GWQFTPGNAIPDGSYNITVTVEDKAGNTATSKPLPVVIDTTAEIESVTLVTDSGDSDVDNITKVDKPQFSIVTADDITHV
RVKIDNAANWIELTKGGDGRWIFNVGSALPDGQHTLLVDVTDIAGNVAQETLQFTIDTTLREPTIVLDPTHDTGDDTNDN
LTRINKPVFIIGNVDNDVSHIVVHLDGRDYTIENKGGNLTFTPDQPLSDGQHTISVTVTDIAGNTKTSAELQIEIDTQVQ
IDSVTLTTDSGVNDHDNVTNATRPSFEIATPDDVTSVLVSFDGVNWTPISKNAAGQWQFTAGSALSDGHYTLHVQATDRA
GNTANSTLGFTVDTQIDGLSVVMLDDAGKDSTDGITNITSPRFEISAREQLQSVTVILNGKSSTLTQGAGNKWLFTPDTP
LVDGTYKIEIVAEDIAGNKISKEVSFTIDTIVSDPSIDLLDADDTGESAVDNITSVTTPRFVIGNVPADIDTVVIRINGV
SYPVTANGNNLWEFQVPVALNDGVYEAVVVFRDIAGNTSETKLPFTIDTTTSVSVRMEPASDTGSSNSDNLTNKQNPKFE
GTAEPNAKLVITIVDDKSGREVLKHTITVGADGNWSVTPNILPDGMYTINVVATDVAGNTAQTQERFTIDTVTIDPTIRL
SDPSIDDQYEATSLRPEFKGLAEAFSTIMIQWDGKVVGSANANANGEWSWTPPSVLAPGSYVVSIVAKDKAGNESSQVDF
PVVIPVIDVTPPTIKLSEESDSGALGDFTTNNKTPTLIGSTLPNTIVSIYVDGVKVGEATADTAGRYTFQLSEMKDGHYV
VQVGIVNPRDNSELRSTAVDVTIDTEVAELVWNISGMHEGGYINTVTPEIGGTSEPNSKITIFVNGVEKAIAYTTGAGHW
GVVLPALGNDGNYELTFKVEDVAGNIREFGPQNVILDTVISPLTVVLREADDSGKVGDWITNKSHVTIDGTAEAGSTLTI
RNPQGVVIATLVVGNDGRWSAELDLREGSNAFVVVSEDKAGNSQQKDILIEHDTQIEISDISLSRDTNSGDKYDLITNNK
SPVLVAMTDPGATVQVYINGVLQGTVEASSSGNISYTMPANSADGEYQVQFVATDTAGNRVESAITTVTIDSQIAVFDID
EDSLPALSNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEADGSWRAPILLQDDGTFNIHFSITDVAGNTQVSKNYSVDV
DSSTDFPTLNLEDASNSGSLDDLITNHNKPVLVGTAEAGATIHIYVDEKIVANVLVLEDGTWSYQFDNALKDSEYSIRVV
AEDPAGNTAESPRLLVTIDTSTFIDNPAMVAGSDNGIFSNDSITSQTRPTFSIFGEMNQSVQIFIDGVLVDTITVTDRNQ
VYRPESPLGDGSHSIYYVITDKAGNTATSKTLNFTIDTFNTTPVAIDSIGGQTLAEMTGSDGKIYITDTTRNLLFSGSAE
PNSKIEIIINGLNVGEVWVNEKGHWQMPVNPLYFTEGQLDITVKSTDRAGNVNQEKYSIWVDTHIQVFTSELDDNKSSSK
TDWWSNSSTITMRGMGEIGATVSLIVAGVTLATAVVAANGQWELSTDQLPEGKYDITLSIEDNAGNRKEEVHEIFIDRTP
PNAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSNGNTYTLTVPDNGKWSMAIPYPSEGKFTITSVDAIGNRSDDVPLDIM
KEVPVISLSPDSDSGTVGDNITRDKQPTFIIGNLESDVVVVQVDINGTVYNAEKNADGVWFFTPGTPLADGSYTISVIAS
DAAGNQKNSLPITVTIDSTLTVPEIALAAGEDNGVSDSDNVTNHTQPKFTLQHIDADVTGVTVNVTHNSVTDTYQATQGA
DGWTFTPPAAWNDGTYTLSVTVVDRAGNSQQSASLAVTVDSTVTVTADSQHDDASDDATPTAVTPPESETVNAESDTHLR
TVPSAAEESVVKETAYSITLLNANSGDEIDRSISQTPSFEISVPENIVNVSVMFEGEEFTLPITNQKAIFEVPLSLEDGE
YTMDVKFIDKDDDFLIKEKTFSVDHSSADIVNAMNARGKTEDDINDSPSTSSVGHNNNGAIDVFAVNEVTLPVDNQEEHA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
siiE CAE11797.1 large repetitive protein Virulence SPI-4 Protein 0.0 83
STM4261 NP_463126.1 inner membrane protein Not tested SPI-4 Protein 0.0 83
SC4140 YP_219127.1 inner membrane protein Not tested SPI-4 Protein 0.0 83
STY4458 NP_458558.1 large repetitive protein Not tested SPI-4 Protein 0.0 69

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
SPA4077 YP_153135.1 inner membrane protein VFG0581 Protein 0.0 83