Gene Information

Name : I137_20350 (I137_20350)
Accession : YP_008383365.1
Strain : Salmonella enterica S06004
Genome accession: NC_021984
Putative virulence/resistance : Virulence
Product : hypothetical protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 4344180 - 4359065 bp
Length : 14886 bp
Strand : +
Note : Derived by automated computational analysis using gene prediction method: GeneMarkS+.

DNA sequence :
ATGGGAAATAAAAGCATACAAAAGTTTTTTGCCGATCAAAATTCTGTAATTGATTTATCTTCTTTGGGTAATGCCAAAGG
CGCAAAAGTTTCTCTTTCCGGGCCAGACATGAACATTACCACGCCGCGTGGTTCAGTGATCATTGTCAATGGCGCTCTTT
ATTCAAGTATCAAAGGCAATAACCTCGCTGTTAAATTTAAAGATAAGACTATTACCGGCGCTAAAATTCTGGGCAGCGTA
GATTTAAAAGATATTCAACTGGAGAGAATTGACAGCTCATTGGTTGATTCTGCTCAGGTAGAAAAGAAAGGTAATGGCAA
ACGACGAAATAAGAAGGAAGAAGAGGAATTAAAAAAGCAGCTTGACGATGCTGAAAACGCAAAGAAAGAAGCTGATAAGG
CGAAGGAAGAAGCAGAGAAAGCTAAGGAGGCTGCAGAAAAAGCGCTCAATGAAGCGTTTGAAGTACAGAACTCGTCAAAG
CAAATTGAAGAAATGCTGCAGAACTTTTTGGCTGACAATGTAGCAAAAGACAATCTGGCTCAGCAAAGCGATGCTTCCCA
GCAAAATACACAGGCTAAAGCAACGCAGGCTTCTAAACAGAACGATGCTGAAAAAGTTCTTCCTCAACCTATTAATAAAA
ATACCAGTACTGGCAAAAGTAATAGCAGTAAAAATGAGGAAAATAAGCTCGATGCCGAGTCTGTTAAAGAGCCGCTTAAA
GTCACATTAGCGCTTGCGGCCGAGAGTAACAGCGGTAGCAAAGATGATAGTATAACTAATTTTACCAAACCTCAGTTTGT
AGGTAGCACTGCTCCCAATGCCACGGTTATTATTAAAATTAATGGTATTGCTGTCGGTCAGGCTGTAGCGGATAGTTTGG
GTAACTTCACCTTTACAGCGCCTGAAACATTGACTGATGGAACATATAATCTGGAGGCAGAGGCCAAGACTGCTGATGGG
AGCGGTAGCGCCAAACTTGTCATTACTATCGATTCCGTTACCGATAAACCAACATTTGAACTTTCGCCTGAAAGTAGTGT
GTCCGGTCATAAGGGCTTAACGCCGACCTTGACGCCTTCAATTGTTGGTACGGCGGAAGAGAATGCTAAGGTTGACATTT
ATGTAGATAATAAACTGGTTGCCAGCGTTGATGTCGATAAAGATGGAAACTGGAGTTATGAATTTAAGGATAATGAATTA
TCTGAGGGCGAAAATAGTATAAAAGTCGTTGCTGTAGATAAAGCAGGTAATAAAAACGAAACGACGGATAGTATCATAAC
CGACACCATTCCTCCGGAAAAGCCGACGATTGAGCTGGATGATAGTAGTGATTCCGGCATTAAAAATGACAACATTACAA
ATAGCACCCTGCCAACATTTATTGGTGTGGCGGAACCCGGTTCTACAGTCTCTATTTATCTTGGACTTAAACATCTTGGT
GAGGTCATTGTTGCTAAAGATGGGACATGGAGCTATACGCTTACTACGCCGCTCAAGGATGGCGAATACAATATAACAGC
AACAGCTACTGATATTGCCGGGCATACCTCAGCGACGGCAAATCTGCCTTTTACTATTGATACACGTATCAGCTATTTCA
GCGCTGAGATTGAAACGACGAATGATAGCGGTATTGTCGGAGATAACGTTACTAACAATACTCGCCCAACCTTTACAGGT
AAAACTGAGCCAAATGCTATTATCAGTGTCATAAATAGTGAGACTGGCGAAGAGGTTATTTTTAAAGCGAATGACAAGGG
CGAATGGACGTTCAATTTCACTTCCGACTCAGTGGAAGGGATTAACAATCTTACGTTCACTGTTGAAGATGTCGCTGGCA
ACAAAAAGGATTTTTCCTTTAGTTACGTTATCGATACTATTGCCCCTGTACCTCCGACGGTTTCTTTGGAGGACTTTGTT
GTTTTACCGAATGGTATAATTTTATCAGGGAATGATTTACCGGCTTTAGTCGGTACGGCAGAGCCAAAGTCTACCATCTT
ATTGATACGAGATGGTAAATTATATGACAGCATTGAGGTTGACTCAAACGGGACCTGGAATTATCAGTTTAGTAATAAAT
TTCTTCAGGGCGCCTATGATATTGAAATCATCTCTCAGGATGCCGCCGGTAATAAATCCTCTACTGTTAAATATTCTTTT
ACTATTCAAACTGAAGTTGTACCTCCAAAAGCGGAACTCGATGCCAGTGATGATTCCGGTGCAAAAGGCGACTGGATTAC
CAATAAACATAATGCTCTGACATTACTGGGAACAGCTGATAGGTTTGCTACCGTAAATATCCTTATCGATGGTAAAACGA
TAGGCGTGACGACTGCGGATGCAGACGGTAACTGGAATTTTGATATTTCCCGAAATCTGTCTGACAATGTTTATAAGATT
ACGGTTGAATCCATCGATCCTTTAGGAAGAACGTCATCTGTAGATTATCAGCTTACCATTGATAGCTTTACGCCGATCCC
TACTGTTATGTTGCATGATAGCGCTGATTCTGGCGTTAAAGGCGATATGATTACTAAAATTAATACGCCGTTGTTTACCG
GGATGGCTGAAGCTAATGCTAAGGTTTCCATCTATGTTGACGGTGTGTTAAGTGGTGAGGCTATTGCTGGCGATGATGGT
GTATGGAATTTTCAATTTACCACAGCGTTATCCGATGGCTCGCATGACGTAACGGTAAAAGTAGAAGATATTGCCGGTAA
TACTGCCTCCTCATCAGCGTATAATTTCCAAATCGTAACGCAAACGCAAAAACCAACAATAGAGTTGGTCAACGATACGG
GGGTTGATAATACAGACCATATTATTAATGAAAAGAATCCTGCACTGACAGGAACCGCTGCACCCTATTCAACGGTTAAA
CTCTATATTGATGGCGCACTGATCGCTGAGGTCAGAACAAATAAAGATGGCAGATGGGAGTATACCCTGAAAGCCGATCA
AGGTTTGGTTGATGGCGATCATAGAATAACCGCTTCAGTTGAAGATATCGCTGGCAACATTGCCCATTCGGATCCTTTCT
TAATTAGCGTCGATACTGCTATTTCAATACCGATAGTTTCATTGAGCCCGGATTCAGATTCGGGAATTGCAGATGATAAT
TTAACGAATATCGTTAAACCTACCTTGCACCTAAAAGATATTGATCCGGACATTATCAGTGTTCAGGTATGGGATGCCAT
GTCTGATACGCAGATCGGTGTTGCCACGCAACAACCTGATGGTTCATGGGCCTATACCTTTACTTCAGATTTAACGGAAG
GCTTGCATCAGGTTTATGTCAAGGTTGAGGACATTGCGGGTAATAAAGCGAACAGTGCGGTATTCGATTTTACTATCGAT
ACCACAGTATCAACGCCGGTGATTTCCCTGCTTTCTAAGGATGATACGGGGGTTACAGGCGATAACCTGACCAATATCAA
TAAGCCAGGTTTTGCTATTTCCGGTGTTGATGCCGATGCGCATCGGGTCGTCGTACAGGTGATGCATAATGGCGTGAGCG
AAGAGATCGAACTTTCCCACCTCAATGGTAGTTGGTTATTTACACCAGGGAATACGTGGGCGGATGGCAGCTACACGTTA
ACGGTGAAAGTAGAAGATAAGGCAGGAAATACCAGCTATTCAGCGCCGCTGACGGTCGTTATCGATACCCAAATCGCCAT
TGATGGGGTGGAACTGGTCAACGATAGCGGTGTGAAAGGCGACAATATGACCAACGACGACCGTCCCCACTTTCGTGTGA
CGGTACCTACGGATGTCAATGAAGTCCGTCTGAGCATTGACGGTGGTAATTCGTGGGTTCAGGCAACCCCGGGCGTGGCA
GGCAGCTGGGAGTATATCTGGCCGACAGACCTGGCAGATGGTCAATACACGCTAACGGTGGAGGCGACTGATAAAGCAGG
CAATACCGTGACGAAGACCATCGATTTCGCGGTGGATACCACGCTGTCAGTGCCGGTCATCGTACTGAATAGCGCGGACG
ATACCGGTGTCCAGGGCGATAACATGACGAATCGCACCCAGCCGACATTTGCCCTGCAGCATATTGATGATGATGCCGTT
CGCGTTACGGTCAGCGTGGAGCATGGCGGCGTCACCACCACATTTGACGCCACGAAAGGCACAGGCGGATGGACCTTTAC
GCCGCCGACATCATGGGCGGATGGTGATTATACCCTGAGTGTGTCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCTG
CATCGTTGACGGTGACGGTGGACACGCAAATCGCCATTAATAACATTGAACTGGTCAATGACAGCGGTATTCCCGACGAT
AATCTGACTAATAACGTGCGTCCGCACTTCCAGGTGAAGGTACCGACGGATGTTAACGAGGTACGCCTGAGCATTGACGG
CGGCAAGACGTGGTTCAACGCTACCCAGAGCGCGACGCCGGGCGTCTGGGATTATACCTGGCTGGCTGATGTGGGAGAGG
GTAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAACAAAACGACGCAGCAACTGGACTTCATCATCGATACC
CTACTGTCAGAACCGACTATCGTGCTGGACAGCACGGACGACAGCGGAACAAAAGGCGATAACCTGACCAACGTAAATAA
GCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTATGTCACGGTTGAGGTACAGCATGGCGGCACGAAAGAGG
TGCTGACGGCCACCAAAGACGCGACCGGCAACTGGAGCGTAACACCGACCGGCACATGGGCAGATGGCGACTATACGCTG
ACAGTGAGGGTGGAAGATGAGGCGGGGAACGAAAAACACTCAGCGTCGCTAACGGTCACTGTTGATACCCAAATCACCAT
TGATGTTATTGAACTGGTTAATGATAACGGTATTCCCGGCGACAATATGACTAACGACGCCCATCCGCAGTTCCGCGTGA
CGGTACCGGGGGACGTTAACGAAGTTAGTCTGAGCATTGACGGTGGCGTGACCTGGGTTAAGGCGACACAGAGCGCGACG
CCGGGCGTCTGGAATTATACCTGGCCGGGCACCGTGCCGGATGGCGACTATACGCTGAATGTGAAAGCGACTGACAATGC
GGGTAATACGGTGACGGAGACACTCCACTTCACTATTGATACCACGCTGTCAGTGCCGGTCATCGTACTGAATAGCGCGG
ACGATACCGGTGTCCAGGGCGATAACATGACGAATCGCACCCAGCCGACATTTGCCCTGCAGCATATTGATGATGATGCC
GTTCGCGTTACGGTCAGCGTGGAGCATGGCGGCGTCACCACCACATTTGACGCCACGAAAGGCACAGGCGGATGGACCTT
TACGCCGCCGACATCATGGGCGGATGGTGATTATACCCTGAGTGTGTCAGTCGAAGATAAAGCGGGGAACACCAGCCATT
CTGCATCGTTGACGGTGACGGTGGACACGCAAATCGCCATTAATAACATTGAACTGGTCAATGACAGCGGTATTCCCGAC
GATAATCTGACTAATAACGTGCGTCCGCACTTCCAGGTGAAGGTACCGACGGATGTTAACGAGGTACGCCTGAGCATTGA
CGGCGGCAAGACGTGGTTCAACGCTACCCAGAGCGCGACGCCGGGCGTCTGGGATTATACCTGGCTGGCTGATGTGGGAG
AGGGGAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAACCAGACGACGCAGAAACTGGACTTCATCATCGAT
ACCATGCTGTCAGAACCGACTATCGTGCTGGACAGCACGGACGACAGCGGAACAAAAGGCGATAACCTGACCAACGCGAA
TAAGCCGACGTTTATACTGGGCAATATTGACGCAGACGCGCGGTATGTCACGGTTGAGGTGCAGTATGGCGGCACGAAAG
AAGTGCTGACGGCCACCAAAGGCGCGACCGGCATCTGGAGCGTGACACCGACCGGCACATGGGCAGATGGCGACTATACG
CTGACGGTGAGGGTGGAGGATGATGCGGGGAACGTAAAATACTCAGCGCCGCTGACGGTCACGGTTGATACCCAAATCAC
CATTGATGTTATTGAACTGGTTAATGATAACGGTATTCCCGGCGACAACCTGACCAATGACGTTCGTCCACACTTCCGCG
TCACGGTGCCAGGGGATGTCAACGAGGTACGTCTGAGTATCGACGGCGGTAATACGTGGGTTCGTGCAACACAGGGCACG
GCAGGGATCTGGGATTACACCTGGCCGAAAGATGTGACCGACGGGCTACATACCCTGACGGTAGAAGCGACCGATAAGGC
GGGAAATAAGACGACGCAGACGCTCGATTTTACCATTGATACCCGGCTGTCAACGCCTACCATCACTATGGATAGCAGGG
ACGATACAGGTGCCATTGGCGATCATATTACGAGCGTCAAAAGACCGGGCTTTACCATTGGCAATATTGACTCCGATGCG
CAATCGGTCATTTTGCGGATCACACAGGGCGGCAATAGCCAGGAAGTGACACTAACCCAGGTTGGAGGACAGTGGCGCTT
TACGCCAGATGCTGACTGGGCGGACGGTAGCTATACACTGACGGTAGAGGTAACGGATAACGCAGGAAACGTTCGTCAGT
CCACGCCGCTGATAGTGACGGTAGATACGCAAACCAGCATTACTGATATTACATTGGTCAATGATCATGGCATGCCTGAT
GACAATCTAACTAACAGCACCCGTCCGCAGTTTGAGATCACGGTGCCGGCGGATGTGAATTCTGTGCAACTGAGCATTGA
TGGGGGCGCAAACTGGGTGAGCGCGGCGCAGGGTATTGAAGGCGTCTGGGGCTATACCTGGCCAACGGATATGGGCGATG
GAAAACACACCCTAACCGTCATGGTCACCGACAGAGCGGGCAATACGGCGACGCAAACGCTTGAATTTTTCATCGACACC
CGGTTGTCGACGCCGACTATTGCGCTGGATAGCACGGATGATACCGGTACGCCTGGCGATGATATGACCAATCGCACCCG
ACCGACCTTTATTCTGCAGAATATCGATTCGGATGTTATCAACGTTACAGTCAGCGTCACGCATAATGGAACGACAACCT
CGTTTACCGCGACACAGGGGGCTGGAGGCTGGAGCTTTACACCGCCAGCGCCGTGGGGCGACGGTGATTATACGCTGACG
GTGACAGTGGAGGATCGGGCGGGAAATACGCGTCCGTCTACGCCGCTGACGGTGACAGTGGATACGCAAATAGCCATTGA
TCATATTGAATTAGTCAACGATAGCGGCGTCCCTGGCGATAATGTGACAAAACATGTGCGTCCGCAGTTCCAGATCTCGG
TACCGGATGATGTGGAAAAGGTTCTTCTGAGTATTGACGGCGGCACGACCTGGGTTACCGCAATCAAGAGTTCGACGGCT
GGCATTTGGGATTACACCTGGCCGACGGATATGCCAGAGGGACAGCATACCCTGACCGTGGAAGTGACTGACGGTGCGGG
TAATAAGATGACGGAGACGCTCAATTTCACTATCGACATCACGTTGATGACGCCAACCATTGAGCTGGCGCCCGATCAGG
ATACCGGACAGAATAAGAACGATAATCTGACCAGCGTCACTCAGCCAGTATTTGTGTTGGGGAGTATCGATAAAGATGTT
CGACACGTGGAATTGAGTATTGAGCATAACGGCACGTTTAAAACGGTGGTACTCACCGAATCAGCCGACGGCTGGCGCTA
TCGACCGGATTCTGCTTTGGCGGACGGTAGCTACACATTCACCGTGACGGTAACAGATGTGGCAGGCAACCAGCAAACAT
CCGCGCCTTTAAAGGTGACGATAGACGGTACGTTGACTACGCCGGTGATTGAACTGGCAGCTGGCGAAGATAGCGGTACT
GTTGGCGATCGCCTCACCAATCACGATCGGCCTGTGTTCGACATACGCCAGGTTGATTCTGACGTTACGCGCGTGATGGT
CAAAGTAACTTACAACGGTAAAACGCACGAGGAAGCGGCGGTATTCACCAATGGTCAATGGCGCTTTACGCCTTCTGCGA
GCTGGGCTGATGGCTCATATCAGTTAGCCGTTGTGGTGGAAGATCTGGCGGGGAATGTAAAAGAGTCTGCGCCGTTTGAG
GTGCGTATTGACACCACGACAACCATTAACAATATCGTATTGCTTAATGATACTGGCGTGCAGAATGATCAATTAACGAA
TGTTGCCAAACCGTCATTCAGAATTGACGTTCCCGGTGATGTCGTCCAGGTACGCGTAACCCTGGATGGTGGCGCTAACT
GGAATGTGATACGCAAAAATGCCGACGGACAGTGGATTTTTGACAGCCCGAATACTCTGGTTGACGGCACATATACCCTT
CGCGTAGAGGCCACGGATGAGGCAGGTAATATTGCGAATAAAGATTTAGTATTTAATATCGATACTAATATACAGGTTCC
GACTATTGCTTTAGACGCAGGACAAGATACCGGAGCGAATACAGCCGATAATATCACTAATATTTCACGACCCACCTTTA
CGATTGGTAATGTTGACCCCGATGTTATCAAAGTCGTGGTGACGATTGATGGTCATGATTATAACGCGACTAAGGTTGGG
GCTGGTTGGCAATTTACGCCAGGCAATGCCATTCCGGATGGTTCTTATAATATTACCGTTACGGTTGAAGATAAGGCCGG
AAATACCGCGACATCGAAACCATTACCTGTTGTGATAGATACGACGGCTGAAATTGAAAGCGTCACGTTGGTTACAGATA
GCGGTGATAGTGATGTAGATAACATTACCAAAGTCGACAAGCCGCAGTTTAGTATTGTTACCGCTGATGATATTACTCAT
GTGCGCGTTAAAATCGATAACGCCGCTAATTGGATTGAACTCACAAAAGGAGGGGATGGCCGCTGGATATTTAATGTCGG
TTCGGCATTACCTGATGGGCAACACACTCTCTTGGTTGATGTGACTGATATCGCCGGCAACGTTGCGCAGGAAACGCTGC
AGTTTACGATTGATACGACTCTGCGAGAGCCGACAATTGTACTCGATCCCACCCATGATACTGGTGATGATACTAATGAT
AATCTTACCAGGATTAACAAACCGGTGTTTATTATCGGTAATGTCGATAATGATGTATCACACATTGTGGTTCATATTGA
TGGTCGGGATTACACCATTGAAAACACAGGGGGGAATTTAACCTTTACGCCGGATCAACCGCTGTCTGACGGTCAGCATA
CGATCTCTGTTACCGTAACGGATATTGCTGGTAATACCAAAACATCGGCCGAACTGAAGATTGAAATCGACACGCAGGTT
CAGATTGACAGTGTTACGTTAACAACAGATAGCGGCGTCAACGATCACGATAATGTCACCAATGCTACCCGTCCCTCTTT
TGAAATTGCAACGCCTGATGATGTGACATCGGTGCTGGTTTCTTTCGATGGCGTAAACTGGACGCCCATCAGTAAAAATG
CGGCCGGGCAGTGGGAATTTACTGCAGGTAGCGCATTGCCTGATGGTCATTATACTCTCCATGTCCAGGCGACGGATCGG
GCAGGGAATACGGCAAATTCCACGCTGGGCTTCACCGTGGATACGCAGATTGACGGCCTGAGCGTCGTGATGCTGGACGA
CGCCGGAAAGGATTCTACGGATGGTATTACGAATATTACCTCTCCACGTTTTGAGATTTCAGCCAGAGAACCGCTGCAGA
GCGTGACGGTAATTTTAAACGGGAAATCCAGCACACTGACTCAGGGGGCAGGTAATAAATGGCTGTTTACCCCTGATACA
CCGTTAGTGGATGGAACTTACAAAATAGAAATAGTGGCTGAAGATATCGCAGGTAATAAAATTAGCAAAGAGGTATCATT
CACAATAGACACTATTGTTTCTGATCCCAGTATTGATTTGCTGGATGCGGATGATACTGGCGAAAGCGCTGTTGATAATA
TTACGAGTGTCACTAAACCACGTTTCGTTATTGGCAATGTACCCGCCGATATTGATACTGTTGTAATCAGAATTAACGGC
GTTTCTTATCCGGTTACGGCAAATGGCAATAACCTCTGGGAATTCCAGGTTCCCGTTGCGTTAAACGATGGCGTATATGA
AGCCGTTGTTGTCTTCAGAGATATTGCCGGAAATACTTCTGAAACTAAGCTGCCCTTTACCATTGATACCACGACAAGCG
TCAGTGTCAGAATGGAGCCAGCGTCTGATACCGGAAATTCCAATAGCGATAACCTTACGAATAAGCAAAATCCCAAATTC
GAAGGTACTGCAGAGCCCAATGCGAAACTGGTGATTACCATTGTTGACGATAAGTCAGGTCGGGAGGTTTTAAAACAAAC
GATTACGGTTGGCGCTGATGGCAACTGGAGTGTGACGCCGAATATACTGCCGGATGGCATGTATACCATCAACGTCGTCG
CAACAGATGTCGCGGGAAATACTGCGCAAACGCAGGAAAGATTCACTATCGATACGGTTACGATCGATCCCACCATTCGC
CTTTCGGATCCATCTATTGATGATCAGCATGAAGCAACCAGCCTGCGTCCTGAGTTCAAAGGGTTTGCCGAAGCGTTCTC
GACGATTATGATTCAGTGGGATGGGAAAGTGGTCGGCTCGGCAAACGCCAATGCGAATGGCGAATGGAGTTGGACGCCGC
CATCAGTATTAGCGCCAGGCTCCTATGTTGTGAGCATTGTTGCCAAAGATAAAGCGGGTAATGAATCGTCGCAGGTCGAC
TTTCCTGTCGTAATACCTGTTATTGATGTCACGCCTCCAACCATAAAGCTCAGCGAGGAGAGCGATAGTGGTGCCTTAGG
AGACTTTACCACGAATAATAAAACGCCGACCCTGGTTGGGAACACGTTACCTAATGCGATTGTGAGTATTTATGTGGATG
GCGTGAAGGTCGGCGAGGCGACAGCGGATACAGCGGGTCGATATACTTTCCAGTTATCGGAAATGAAAGATGGCCATTAT
GTCGTCCAGGTGGGTATAGTCAACCCTCGCGATAATAGCGAACTGCGTTCCACCGCCGTTGATGTCACTATCGATACCGA
GGTTGCTGAACTGGTATGGAATATATCTGGAATGCATGAGGGCGGATATATCAATACGGTGACGCCGGAGATTGGCGGCA
CCAGTGAGCCAAACAGCAAAATCACTATCTTTGTGAATGGCGTTGAAAAAGCGATTGCTTATACGACAGGCGCAGGACAC
TGGGGCGTAGTATTACCTGCTTTGGGTAATGACGGTAATTATGTATTAACGTTTAAAGTTGAAGATGTTGCCGGCAATAT
CAGAGAGTTTGGTCCGCAGAATGTGATACTGGATACGGTAATTTCGCCGTTAACCGTGGTATTACGCGAAGCTGATGACA
GTGGCAAAGTTGGCGACTGGATCACCAATAAATCTCATGTCACCATCGATGGTACTGCCGAAGCCGGAAGTACTTTAACC
ATCAGGAGTCCGCAGGGGGTGGTTATTGCTACCCTGGTGGTAGGCAATGATGGTCGATGGAGCGCAGAATTAGATCTGCG
TGAAGGTAGTAATGCCTTTGTCGTGGTATCGGAAGATAAAGCGGGCAACAGCCAACAAAAAGATATCCTGATAGAACATG
ATACGCAGATTGAAATCAGCGATATTTCATTAAGTCGGGATACTAATAGCGGTGATAAATATGATCTGATTACCAATAAT
AAGTCTCCGGTACTGGTTGCCATGACCGATCCCGGCGCGACGGTACAGGTTTATATTAATGGTGTGTTACAAGGCACAGT
AGAGGCGAGTTCGTCAGGTAATATTAGCTATACCATGCCGGCAAATAGCGCCGACGGCGAGTATCAGGTGCAATTTGTTG
CTACGGATACTGCTGGTAACCGGGTTGAGTCTGCGATTACAACCGTGACAATCGATTCTCAAATTGCTGTCTTTGACATT
GATGAAGATTCATTACCGGCCCTCTCTAATAACCGGGCGTTGTCAGTCTCAGGTGTCGGGGAGGCTGGTTCTCAGGTCAG
CATCTTTGTCGATGGTAAATTAGTCAACGTTGTTATGGTTGAGGCTGATGGCACATGGCGCGCGCCGATACTGCTGCAAG
ATGATGGTACGTTTAATATTCATTTCAGCATTACTGACGTTGCTGGCAACACTGAAGTGAGCAAGGATTATAGCGTGGAT
GTCGATTCATCAACCGACTTCCCAACGCTCAACCTTGAAGATGCAAGCAACTCTGGTTCATTTGACGATCTGATTACTAA
TCGCAACAAGCCTGTGTTAGTTGGCACCGCAGAAGCGGGAGCCACAATCCATATTTATGTGGATGAAAAGATCGTGGCAA
ATGTGCTTGTGCTTGAAGATGGAACCTGGTCCTACCAGTTTGATAATGCGTTAAAAGATGGTGAATATTCTATCCGTGTG
GTTGCCGAAGACCCGGCAGGTAATACGGCAGAATCGCCTCGCTTACTCGTCACGATAGATACCAGTACGTTTATCGATAA
TCCTGCTATGGTGGCAGGTTCTGATAACGGTATTTTCAGTAATGATAGTATAACGAGTCAGACCCGGCCTACGTTTAGTA
TTTCTGGAGAAATGAACCAGAGTGTTCAGATTTTCATTGATGGGGTGTTAGTCGATACGATCACGGTGACGGACAGAAAT
CAAGTTTATCGACCTGAGTCACCGTTGGGCGATGGTTCCCATAGCATTTATTATGTTATCACCGATAAAGCAGGCAACAC
GGCTACCTCGAAAACGCTAAACTTTACTATCGATACCTTTAATACGACGCCTGTCGCCATTGATTCTATCGGTGGACAAA
CGTTAGCAGAGATGACCGGTAGTGATGGCAAAATATATATAACGGACACGACGCGTAACTTATTGTTTAGTGGCAGTGCC
GAGCCCAATAGCAAAATAGAAATCATCATTAATGGCTTAAATGTGGGGGAAGTTTGGGTTAATGAAAAAGGCCACTGGCA
GATGCCGGTGAACCCGCTTTATTTCACAGAAGGCCAACTGGATATCACTGTTAAATCTACGGACCGTGCTGGTAACGTAA
ATCAGGAAAAGTATTCCATTTGGGTCGATACGCATATCCAGGTATTTACCAGCGAGCTTGATGACAATAAATCATCATCG
AAAACGGACTGGTGGAGTAATAGCTCCACTATTACCATGAGAGGTATGGGGGAAATTGGCGCTACGGTATCATTAATCGT
GGCAGGGGTCACGTTGGCAACCGCTGTCGTTGCGGCTAATGGGCAGTGGGAATTATCGACCGATCAGCTTCCGGAAGGTA
AATACGATATCACGTTGAGTATTGAGGATAACGCAGGCAACCGTAAGGAAGAGGTACATGAAATATTTATTGATCGAACG
CCGCCAAACGCTCCGGTCGTAACTTATTCAGATATTGTCAACGATCTAATTATTATGCAGGGGACGGCGGAAGCCAAATC
TCAGCTAATAATAACCGATAGTAATGGGAATACTTATACGTTAACCGCTCCTGATAATGGTAAATGGAGTATGGCTATCC
CGTATCCATCGGAAGGGAAGTTTACCATTACGAGTGTGGATGCGATTGGTAACCGGAGTGATGATGTCTCTCTCGATATC
ATGAAAGAGGTTCCCGTTATTTCATTATCTCCAGACTCAGACAGTGGTACGGTGGGCGATAATATTACGCGAGATAAGCA
ACCTACCTTTATTATCGGGAATCTGGAAAGCGATGTTGTGGTCGTTCAGGTTGATATCAATGGGACCGTATATAATGCTG
AAAAAAATGCCGATGGCGTTTGGTTCTTTACGCCAGGTACACCGTTAGCTGATGGTTCCTATACGATATCGGTAATCGCA
AGCGATGCCGCGGGTAATCAGAAAAACTCGTTACCCATTACCGTTACGATCGACAGTACGCTGACGGTGCCGGAGATTGC
GTTGGCAGCAGGTGAAGACAATGGCGTTTCAGACAGCGATAACGTGACGAATCACACCCAGCCTAAGTTCACGCTGCAGC
ATATTGATGCTGATGTGACCGGGATGACCGTAAACGTGACGCATAACGGCGTGACAGACACCTATCAGGCGACGCAAGGC
GCGGATGGCTGGACCTTCACGCCGCCAGCCGCCTGGAATGATGGTACCTACACGCTGAGCGTGACGGTGGTGGATCGCGC
GGGGAACTCACAGCAATCTGCTTCGCTAGCGGTGACGGTTGACTCAACGGTGACGGTAACAGCGGATAGCCAGCATGACG
ATGCGAGCGATGACGCCACGGCAACAGCGGTTACTCCACCGGAGTCTGAAACAGTGAATGCCGAAAGCGCTACGCATCTT
CGTACAGTGCCGTCTGCGGCGGAAGAAAGCGTGGTGAAGGAGACAGCCTATAGTATTACATTGTTAAACGCTGACTCTGG
GGATGAAATAGATCGTTCAATTAGTCAGACACCTTCTTTTGAAATATCAGTACCTGAGAATATTGTTAATGTCAGTATTA
TGTTTGAAGGAGAAGAGTTTACTCTGCCGATAACTAACCAGAAAGCAATATTCGAAGTTCCGCTATCTTTGGAAGATGGT
GAATATACTATGGACGTGAAATTCATTGATAAAGACAATGATTTCCTGATTAAGGAGAAAACATTCTCAGTCGATCACTC
CTCGGCGGATATTGTGAACGCAATGAATGCAAGAGGAAAGACCGAGGATGATATTAATGATTCCCCTTCCACGAGTTCTG
TAGGGCACAACAATAACGGCGCTATTGATGTTTTCGCCGTTAATGAAGTTACGCTACCTGTAGATAATCAAGAAGAACAC
GCATAA

Protein sequence :
MGNKSIQKFFADQNSVIDLSSLGNAKGAKVSLSGPDMNITTPRGSVIIVNGALYSSIKGNNLAVKFKDKTITGAKILGSV
DLKDIQLERIDSSLVDSAQVEKKGNGKRRNKKEEEELKKQLDDAENAKKEADKAKEEAEKAKEAAEKALNEAFEVQNSSK
QIEEMLQNFLADNVAKDNLAQQSDASQQNTQAKATQASKQNDAEKVLPQPINKNTSTGKSNSSKNEENKLDAESVKEPLK
VTLALAAESNSGSKDDSITNFTKPQFVGSTAPNATVIIKINGIAVGQAVADSLGNFTFTAPETLTDGTYNLEAEAKTADG
SGSAKLVITIDSVTDKPTFELSPESSVSGHKGLTPTLTPSIVGTAEENAKVDIYVDNKLVASVDVDKDGNWSYEFKDNEL
SEGENSIKVVAVDKAGNKNETTDSIITDTIPPEKPTIELDDSSDSGIKNDNITNSTLPTFIGVAEPGSTVSIYLGLKHLG
EVIVAKDGTWSYTLTTPLKDGEYNITATATDIAGHTSATANLPFTIDTRISYFSAEIETTNDSGIVGDNVTNNTRPTFTG
KTEPNAIISVINSETGEEVIFKANDKGEWTFNFTSDSVEGINNLTFTVEDVAGNKKDFSFSYVIDTIAPVPPTVSLEDFV
VLPNGIILSGNDLPALVGTAEPKSTILLIRDGKLYDSIEVDSNGTWNYQFSNKFLQGAYDIEIISQDAAGNKSSTVKYSF
TIQTEVVPPKAELDASDDSGAKGDWITNKHNALTLLGTADRFATVNILIDGKTIGVTTADADGNWNFDISRNLSDNVYKI
TVESIDPLGRTSSVDYQLTIDSFTPIPTVMLHDSADSGVKGDMITKINTPLFTGMAEANAKVSIYVDGVLSGEAIAGDDG
VWNFQFTTALSDGSHDVTVKVEDIAGNTASSSAYNFQIVTQTQKPTIELVNDTGVDNTDHIINEKNPALTGTAAPYSTVK
LYIDGALIAEVRTNKDGRWEYTLKADQGLVDGDHRITASVEDIAGNIAHSDPFLISVDTAISIPIVSLSPDSDSGIADDN
LTNIVKPTLHLKDIDPDIISVQVWDAMSDTQIGVATQQPDGSWAYTFTSDLTEGLHQVYVKVEDIAGNKANSAVFDFTID
TTVSTPVISLLSKDDTGVTGDNLTNINKPGFAISGVDADAHRVVVQVMHNGVSEEIELSHLNGSWLFTPGNTWADGSYTL
TVKVEDKAGNTSYSAPLTVVIDTQIAIDGVELVNDSGVKGDNMTNDDRPHFRVTVPTDVNEVRLSIDGGNSWVQATPGVA
GSWEYIWPTDLADGQYTLTVEATDKAGNTVTKTIDFAVDTTLSVPVIVLNSADDTGVQGDNMTNRTQPTFALQHIDDDAV
RVTVSVEHGGVTTTFDATKGTGGWTFTPPTSWADGDYTLSVSVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPDD
NLTNNVRPHFQVKVPTDVNEVRLSIDGGKTWFNATQSATPGVWDYTWLADVGEGKHTLTVEATDKAGNKTTQQLDFIIDT
LLSEPTIVLDSTDDSGTKGDNLTNVNKPTFLLGNIDADARYVTVEVQHGGTKEVLTATKDATGNWSVTPTGTWADGDYTL
TVRVEDEAGNEKHSASLTVTVDTQITIDVIELVNDNGIPGDNMTNDAHPQFRVTVPGDVNEVSLSIDGGVTWVKATQSAT
PGVWNYTWPGTVPDGDYTLNVKATDNAGNTVTETLHFTIDTTLSVPVIVLNSADDTGVQGDNMTNRTQPTFALQHIDDDA
VRVTVSVEHGGVTTTFDATKGTGGWTFTPPTSWADGDYTLSVSVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPD
DNLTNNVRPHFQVKVPTDVNEVRLSIDGGKTWFNATQSATPGVWDYTWLADVGEGKHTLTVEATDKAGNQTTQKLDFIID
TMLSEPTIVLDSTDDSGTKGDNLTNANKPTFILGNIDADARYVTVEVQYGGTKEVLTATKGATGIWSVTPTGTWADGDYT
LTVRVEDDAGNVKYSAPLTVTVDTQITIDVIELVNDNGIPGDNLTNDVRPHFRVTVPGDVNEVRLSIDGGNTWVRATQGT
AGIWDYTWPKDVTDGLHTLTVEATDKAGNKTTQTLDFTIDTRLSTPTITMDSRDDTGAIGDHITSVKRPGFTIGNIDSDA
QSVILRITQGGNSQEVTLTQVGGQWRFTPDADWADGSYTLTVEVTDNAGNVRQSTPLIVTVDTQTSITDITLVNDHGMPD
DNLTNSTRPQFEITVPADVNSVQLSIDGGANWVSAAQGIEGVWGYTWPTDMGDGKHTLTVMVTDRAGNTATQTLEFFIDT
RLSTPTIALDSTDDTGTPGDDMTNRTRPTFILQNIDSDVINVTVSVTHNGTTTSFTATQGAGGWSFTPPAPWGDGDYTLT
VTVEDRAGNTRPSTPLTVTVDTQIAIDHIELVNDSGVPGDNVTKHVRPQFQISVPDDVEKVLLSIDGGTTWVTAIKSSTA
GIWDYTWPTDMPEGQHTLTVEVTDGAGNKMTETLNFTIDITLMTPTIELAPDQDTGQNKNDNLTSVTQPVFVLGSIDKDV
RHVELSIEHNGTFKTVVLTESADGWRYRPDSALADGSYTFTVTVTDVAGNQQTSAPLKVTIDGTLTTPVIELAAGEDSGT
VGDRLTNHDRPVFDIRQVDSDVTRVMVKVTYNGKTHEEAAVFTNGQWRFTPSASWADGSYQLAVVVEDLAGNVKESAPFE
VRIDTTTTINNIVLLNDTGVQNDQLTNVAKPSFRIDVPGDVVQVRVTLDGGANWNVIRKNADGQWIFDSPNTLVDGTYTL
RVEATDEAGNIANKDLVFNIDTNIQVPTIALDAGQDTGANTADNITNISRPTFTIGNVDPDVIKVVVTIDGHDYNATKVG
AGWQFTPGNAIPDGSYNITVTVEDKAGNTATSKPLPVVIDTTAEIESVTLVTDSGDSDVDNITKVDKPQFSIVTADDITH
VRVKIDNAANWIELTKGGDGRWIFNVGSALPDGQHTLLVDVTDIAGNVAQETLQFTIDTTLREPTIVLDPTHDTGDDTND
NLTRINKPVFIIGNVDNDVSHIVVHIDGRDYTIENTGGNLTFTPDQPLSDGQHTISVTVTDIAGNTKTSAELKIEIDTQV
QIDSVTLTTDSGVNDHDNVTNATRPSFEIATPDDVTSVLVSFDGVNWTPISKNAAGQWEFTAGSALPDGHYTLHVQATDR
AGNTANSTLGFTVDTQIDGLSVVMLDDAGKDSTDGITNITSPRFEISAREPLQSVTVILNGKSSTLTQGAGNKWLFTPDT
PLVDGTYKIEIVAEDIAGNKISKEVSFTIDTIVSDPSIDLLDADDTGESAVDNITSVTKPRFVIGNVPADIDTVVIRING
VSYPVTANGNNLWEFQVPVALNDGVYEAVVVFRDIAGNTSETKLPFTIDTTTSVSVRMEPASDTGNSNSDNLTNKQNPKF
EGTAEPNAKLVITIVDDKSGREVLKQTITVGADGNWSVTPNILPDGMYTINVVATDVAGNTAQTQERFTIDTVTIDPTIR
LSDPSIDDQHEATSLRPEFKGFAEAFSTIMIQWDGKVVGSANANANGEWSWTPPSVLAPGSYVVSIVAKDKAGNESSQVD
FPVVIPVIDVTPPTIKLSEESDSGALGDFTTNNKTPTLVGNTLPNAIVSIYVDGVKVGEATADTAGRYTFQLSEMKDGHY
VVQVGIVNPRDNSELRSTAVDVTIDTEVAELVWNISGMHEGGYINTVTPEIGGTSEPNSKITIFVNGVEKAIAYTTGAGH
WGVVLPALGNDGNYVLTFKVEDVAGNIREFGPQNVILDTVISPLTVVLREADDSGKVGDWITNKSHVTIDGTAEAGSTLT
IRSPQGVVIATLVVGNDGRWSAELDLREGSNAFVVVSEDKAGNSQQKDILIEHDTQIEISDISLSRDTNSGDKYDLITNN
KSPVLVAMTDPGATVQVYINGVLQGTVEASSSGNISYTMPANSADGEYQVQFVATDTAGNRVESAITTVTIDSQIAVFDI
DEDSLPALSNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEADGTWRAPILLQDDGTFNIHFSITDVAGNTEVSKDYSVD
VDSSTDFPTLNLEDASNSGSFDDLITNRNKPVLVGTAEAGATIHIYVDEKIVANVLVLEDGTWSYQFDNALKDGEYSIRV
VAEDPAGNTAESPRLLVTIDTSTFIDNPAMVAGSDNGIFSNDSITSQTRPTFSISGEMNQSVQIFIDGVLVDTITVTDRN
QVYRPESPLGDGSHSIYYVITDKAGNTATSKTLNFTIDTFNTTPVAIDSIGGQTLAEMTGSDGKIYITDTTRNLLFSGSA
EPNSKIEIIINGLNVGEVWVNEKGHWQMPVNPLYFTEGQLDITVKSTDRAGNVNQEKYSIWVDTHIQVFTSELDDNKSSS
KTDWWSNSSTITMRGMGEIGATVSLIVAGVTLATAVVAANGQWELSTDQLPEGKYDITLSIEDNAGNRKEEVHEIFIDRT
PPNAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSNGNTYTLTAPDNGKWSMAIPYPSEGKFTITSVDAIGNRSDDVSLDI
MKEVPVISLSPDSDSGTVGDNITRDKQPTFIIGNLESDVVVVQVDINGTVYNAEKNADGVWFFTPGTPLADGSYTISVIA
SDAAGNQKNSLPITVTIDSTLTVPEIALAAGEDNGVSDSDNVTNHTQPKFTLQHIDADVTGMTVNVTHNGVTDTYQATQG
ADGWTFTPPAAWNDGTYTLSVTVVDRAGNSQQSASLAVTVDSTVTVTADSQHDDASDDATATAVTPPESETVNAESATHL
RTVPSAAEESVVKETAYSITLLNADSGDEIDRSISQTPSFEISVPENIVNVSIMFEGEEFTLPITNQKAIFEVPLSLEDG
EYTMDVKFIDKDNDFLIKEKTFSVDHSSADIVNAMNARGKTEDDINDSPSTSSVGHNNNGAIDVFAVNEVTLPVDNQEEH
A

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
SC4140 YP_219127.1 inner membrane protein Not tested SPI-4 Protein 0.0 83
siiE CAE11797.1 large repetitive protein Virulence SPI-4 Protein 0.0 83
STM4261 NP_463126.1 inner membrane protein Not tested SPI-4 Protein 0.0 83

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
I137_20350 YP_008383365.1 hypothetical protein VFG0581 Protein 0.0 83