Gene Information

Name : SC4140 (SC4140)
Accession : YP_219127.1
Strain : Salmonella enterica SC-B67
Genome accession: NC_006905
Putative virulence/resistance : Virulence
Product : inner membrane protein
Function : -
COG functional category : S : Function unknown
COG ID : COG1340
EC number : -
Position : 4417091 - 4433770 bp
Length : 16680 bp
Strand : +
Note : IPR000150: Cof protein; IPR000566: Lipocalin-related protein and Bos/Can/Equ allergen; IPR001220: Legume lectin, beta domain;IPR002126: Cadherin

DNA sequence :
ATGGGAAATAAAAGCATACAAAAGTTTTTTGCCGATCAAAATTCTGTAATTGATTTATCTTCTTTGGGTAATGCCAAAGG
CGCAAAAGTTTCTCTTTCCGGGCCAGACATGAACATTACCACGCCGCGTGGTTCAGTGATCATTGTCAATGGCGCTCTTT
ATTCAAGTATCAAAGGCAATAACCTCGCTGTTAAATTTAAAGATAAGACTATTACCGGCGCTAAAATTCTGGGCAGCGTA
GATTTAAAAGATATTCAACTGGAGAGAATTGACAGCTCATTGGTTGATTCTGCTCAGGTAGAAAAGAAAGGTAATGGCAA
ACGACGAAATAAGAAGGAAGAAGAGGAATTAAAAAAGCAGCTTGACGATGCTGAAAACGCAAAGAAAGAAGCTGATAAGG
CGAAGGAAGAAGCAGAGAAAGCTAAGGAGGCTGCAGAAAAAGCGCTCAATGAAGCGTTTGAAGTACAGAACTCGTCAAAG
CAAATTGAAGAAATGCTGCAGAACTTTTTGGCTGACAATGTAGCAAAAGACAATCTGGCTCAGCAAAGCGATGCTTCCCA
GCAAAATACACAGGCTAAAGCAACGCAGGCTTCTAAACAGAACGATGCTGAAAAAGTTCTTCCTCAACCTATTAATAAAA
ATACCAGTACTGGCAAAAGTAATAGCAGTAAAAATGAGGAAAATAAGCTCGATGCCGAGTCTGTTAAAGAGCCGCTTAAA
GTCACATTAGCGCTTGCGGCCGAGAGTAACAGCGGTAGCAAAGATGATAGTATAACTAATTTTACTAAACCTCAGTTTGT
AGGTAGCACTGCTCCCAATGCCACGGTTATTATTAAAATTAATGGTATTGCTGTCGGTCAGGCTGTAGCGGATAGTTTGG
GTAACTTCACCTTTACAGCGCCTGAAACATTGACTGATGGAACATATAATCTGGAGGCAGAGGCCAAGACTGCTGATGGG
AGCGGTAGCGCCAAACTTGTCATTACTATCGATTCCGTTACCGATAAACCAACATTTGAGCTTTCGCCTGAAAGTAGTGT
GTCCGGTCATAAGGGCTTAACGCCGACCTTGACGCCTTCAATTGTTGGTACGGCGGAAGAGAATGCTAAGGTTGACATTT
ATGTAGATAATAAACTGGTTGCCAGCGTTGATGTCGATAAAGATGGAAACTGGAGTTATGAATTTAAGGATAATGAATTA
TCTGAGGGCGAAAATAGTATAAAAGTCGTTGCTGTAGATAAAGCAGGTAATAAAAACGAAACGACGGATAGTATCATAAC
CGACACCATTCCTCCGGAAAAGCCGACGATTGAGCTGGATGATAGTAGTGATTCCGGCATTAAAAATGACAACATTACAA
ATAGCACCCTGCCAACATTTATTGGTGTGGCGGAACCCGGTTCTACAGTCTCTATTTATCTTGGACTTAAACATCTTGGT
GAGGTCATTGTTGCTAAAGATGGGACATGGAGCTATACGCTTACTACGCCGCTCAAGGATGGCGAATACAATATAACAGC
AACAGCTACTGATATTGCCGGGCATACATCAGCGACGGCAAATCTGCCTTTTACTATTGATACACGTATCAGCTATTTCA
GCGCTGAGATTGAAACGACGAATGATAGCGGTATTGTCGGAGATAACGTTACTAACAATACTCGCCCAACCTTTACAGGT
AAAACTGAGCCAAATGCTATTATCAGTGTCATAAATAGTGAGACTGGCGAAGAGGTTATTTTTAAAGCGAATGACAAGGG
CGAATGGACGTTCAATTTCACTTCCGACTCAGTGGAAGGGATTAACAATCTTACGTTCACTGTTGAAGATGTCGCTGGCA
ACAAAAAGGATTTTTCCTTTAGTTACGTTATCGATACTATTGCCCCTGTACCTCCGACGGTTTCTTTGGAGGACTTTGTT
GTTTTACCGAATGGTATAATTTTATCAGGGAATGATTTACCGGCTTTAGTCGGTACGGCAGAGCCAAAGTCTACCATCTT
ATTGATGCGAGATGGTAAATTATATGACAGCATTGAGGTTGACTCAAACGGGACCTGGAATTATCAGTTTAGTAATAAAT
TTCTTCAGGGCGCCTATGATATTGAAATCATTTCTCAGGATGCCGCCGGCAATAAATCCTCTACTGTTAAATATTCTTTT
ACTATTCAAACTGAAGTTGTACCTCCAAAAGCGGAACTCGATGCCAGCGATGATTCCGGTGCAAAAGGCGACTGGATTAC
CAATAAACATAATGCTCTGACATTACTGGGAACAGCGGATAGGTTTGCTACCGTAAATATCCTTATTGATGGTAAAACGA
TAGGCGTGACGACTGCGGATGCAGACGGTAACTGGAATTTTGATATTTCCCGAAATCTGTCTGACAATGTTTATAAGATT
ACGGTTGAATCCATCGATCCTTTAGGAAGAACGTCATCTGTAGATTATCAGCTTACCATTGATAGCTTTACGCCGATCCC
TACTGTTATGTTGCATGATAGCGCTGATTCTGGCGTTAAAGGCGATATGATTACTAAAATTAATACGCCGTTGTTTACCG
GGATGGCTGAAGCTAATGCTAAGGTTTCCATCTATGTTGACGGTGTGTTAAGTGGTGAGGCTATTGCTGGCGATGATGGT
GTATGGAATTTTCAATTTACCACAGCGTTATCCGATGGCTCGCATGACGTAACGGTAAAAGTAGAAGATATTGCCGGTAA
TACTGCCTCCTCATCAGCGTATAATTTCCAAATCGTAACGCAAACGCAAAAACCAACAATAGAGTTGGTCAACGATACGG
GGGTTGATAATACAGACCATATTATTAATGAAAAGAATCCTGCACTGACAGGAACCGCTGCACCCTATTCAACGGTTAAA
CTCTATATTGATGGCGCACTGATCGCTGAGGTCAGAACAAATAAAGATGGCAGATGGGAGTATACCCTGAAAGCCGATCA
AGGTTTGGTTGATGGCGATCATAGAATAACCGCTTCAGTTGAAGATATCGCTGGCAACATTGCCCATTCGGATCCTTTCT
TAATTAGCGTCGATACTGCTATTTCAATACCGATAGTTTCATTGAGCCCGGATTCAGATTCGGGAATTGCAGATGATAAT
TTAACGAATATCGTTAAACCTACCTTGCACCTAAAAGATATTGATCCGGACATTATCAGTGTTCAGGTATGGGATGCCAT
GTCTGATACGCAGATCGGTGTTGCCACGCAACAACCTGATGGTTCATGGGCCTATACCTTTACTTCAGATTTAACGGAAG
GCTTGCATCAGGTTTATGTCAAGGTTGAGGACATTGCGGGTAATAAAGCGAACAGTGCGGTATTCGATTTTACTATCGAT
ACCACAGTATCAACGCCGGTGATTTCCCTGCTTTCTAAGGATGATACGGGGGTTACAGGCGATAACCTGACCAATATCAA
TAAGCCAGGTTTTGCTATTTCCGGTGTTGATGCTGATGCGCATCGGGTCGTCGTACAGGTGATGCACAATGGCGTGAGCG
AAGAGATCGAACTTTCCCACCTCAATGGTAGTTGGTTATTTATACCAGGGAATACGTGGGCGGATGGCAGCTACACGTTA
ACGGTGAAAGTAGAAGATAAGGCAGGAAATACCAACTACTCAGCGCCGCTGACGGTCGTTATCGATACCCAAATCGCCAT
TGATGGGGTGGAACTGGTCAACGATAGCGGCGTGAAAGGCGATAATATGACCAACGACGACCGTCCCCACTTTCGTGTGA
CGGTACCTACGGATGTCAATGAAGTCCGTCTGAGCATTGACGGTGGTAATTCGTGGGTTCAGGCAACTCCGGGCGTGGCA
GGAAGCTGGGAGTATATCTGGCCGACAGACCTGGCAGATGGTCAATACACGCTAACGGTGGAAGCGACTGATAAAGCAGG
CAATACAGTGACGAAGACCATCGATTTCGCGGTGGATACCACGCTGTCAGTGCCGGTCATCGTACTGGATAGCGCGGACG
ACACCGGCATCCAGGGCGATAACATGACGAATAGCACCCAGCCGACATTTGCCCTGCAGCATATTGATGATGATGCCGTT
CGCGTTACGGTCAGCGTGGAGCATGGCGGCGTCACCACCACATTTGACGCCACGAAAGGCACAGGCGGATGGAGCTTTAC
GCCGACAGGGGCGTGGGCGGATGGTGATTATACCCTGAGTGTGTCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCTG
CATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAACATTGAACTGGTCAATGACAGCGGTATTCCCAACGAT
AATCTGACTAATAATGTGCGTCCGCACTTCCAGGTGACGGTACCGACGGATGTCAACGTGGTGCGCCTGAGCATTGACGG
CGGCAAGACGTGGTTCAACGCTACCCAGAGCGCGACGACGGGCGTCTGGGATTATATCTGGCCGGATGATGTGGCCGACG
GGGGCTATACCCTGACGGTAGAAGCGACCGATGAGGCGGGAAATAAGGCAACACAGACGCTCGATTTCACCATCGATACC
ACTCTGTCTGTGCCGACCCTCTCGCTGGACAGCGCAGATGACAGCGGCATCGCGGGCGATAATATCACCAGTGTTAAAAC
GCCGGGCTTTACCCTCAACAATATTGATACCGATGTCAGCCGGGTGATAGCGGAGGTAATGCACAATGGCATTAAACAGG
AGGTACCACTGGTTCAGACCGGCGGACAGTGGCGCTTTGCGCCGACCAGCGACTGGGCGGACGGCGACTATATCCTGACG
GTGAAGGTAGAAGATAGGGCCGGAAATGTGAAGCAGTCCGCGCCGTTGACGGTGACAGTGGACACGCACATCGCCATTGA
CCGTATTGAACTGGTTAACGACAGCGGTATCCCCGACGATAATCTGACCAATGAAGCGCGCCCGCACTTTCAGGTGACAG
TACCGGCGGATGTTAACGGAGTAAGACTGAGCATTGATGGCGGCAAAACGTGGTTTGACGCCACGCAGAGCGCGACGTCG
GGCGTCTGGGATTATACCTGGCTGACGAATGTGGCTAACGGCCCTCACACCCTGATGGTGGAAGCAACCGACAAGGCGGG
AAACAAAACGACGCAGAAACTGGACTTCATCATCGATACCCTGCTGTCAGAACCGACTATTACCCTGGACAGTGCGGATG
ACAGCGCCGCTGGCGATAACATCACCAACGTTAAGATGCCAGGCTTTACCCTCGGTAATATCGACGCCGATGTGACCAAA
GTGGTGGTGACGGTGGCGCATGATGGTAAGAACCAACAGATAGAGTTGATTAAGAACGGCGGTGTGTGGCGCTTTACGCC
GGGCGCAGCCTGGACCGATGGCGACTATACGCTGACGGTAAAGGTAGAAGATAAGGCGGGTAATACAAATTATTCTGCGC
CGCTGACGGTGACTATCGATACGCAAACGTCTATTGATCGCATTGAACTTCTTAATGACACGGGTATTGTCGGGGATAAC
CTGACCAATGAAGCACGTCCACAGTTTCATATTACGGTACCGACGGACGTGAACTCTGTGCAACTGAGTCTTGATGGCGG
CATCAACTGGGTTAACGCAACGCTGACGTCTGACGGCGTTTGGGAGTATATATGGCCGACAGATCTGGTCGAAAATACGT
ATACCCTGACAGTGAAAGCAACCGATGTTGCAGGCAACACGGCGACGGAAACGCTCAATTTTATCATTGATACCACATTG
TCGACACCGACCATCACGCTGGATAGCGCAGATGATAGCGGCACCGCCAACGATAATAAGACTAACGTTAAAACGCCGGG
TTTTATTATCGGCGGTATTGATTCTGACGTGACTCAGGTCGTCGTGCAGGTGATGCGCGATGGTCACAGCGAGGAGGTGG
AGCTGACGCAGACTAACGGGCAGTGGCGTTTTGTACCCGGCAGCGCGTGGACTGATGGCGACTATACGCTGACGGTAACG
GTGAAAGATGAGGCGGGTAATATTCGCCACTCAGCGCTGTTGACGGTCACCATCGATACGCAAATCGCCATTGACCATAT
TGAACTGGTCAATGACAGCGGTATTCCCGACGATAATCTGACTAATAACGTGCGTCCGCACTTCCAGGTGACGGTACCGA
CTGATGTCAACGTGGTGCGCCTGAGCATTGACGGCGGTAAGACGTGGTTCAACGCTACCCAGAGCGCGACGCCGGGCGTC
TGGGATTATACCTGGCTGGCTGATGTGGGAGAGGGTAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAACAA
AACGACGCAGCAACTGGACTTCATCATCGATACCCTACTGTCAGAACCGACTATCGTGCTGGACAGCACGGACGACAGCG
GAACAAAAGGCGATCACCTGACCAACGTAAATAAGCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTATGTC
ACGGTTGAGGTACAGCATGGCGGCACGAAAGAGGTGCTGACGGCCACCAAAGACGCGACCGGCAACTGGAGCGTGACACC
GACCGGCACATGGGCAGATGGCGACTATACGCTGACAGTGAGGGTGGAAGATGAGGCGGGGAACGAAAAACACTCAGCGT
CGCTGACGGTCACTGTTGATACCCAAATCACCATTGATGTTATTGAACTGGTTAATGATAACGGTATTCCCGGCGACAAT
ATGACTAACGACGCCCATCCGCAGTTCCGCGTGACGGTACCGGGGGACGTTAACGAAGTCAGTCTGAGCATTGACGGTGG
CGTGACCTGGGTTAAGGCGACACAGAGCGCGACGCCGGGCGTCTGGAATTATACCTGGCCGGGCACCGTGCCGGATGGCG
ACTATACGCTGAATGTGAAAGCGACTGACAATGCGGGTAATACGGTGACGGAGACACTCCACTTCACTATTGATACCACG
CTGTCGACGCCGGTCATCGTACTGGATAGCGCGGACGACACCGGCATCCAGGGCGATAACATGACCAATCGCACCCAGCC
GACATTTAACCTGCAACATATTGATGATGATGCCGTTCGCGTTACGGTCAGCGTAGAGCATGGCGGCGTCACCACCACAT
TTGACGCCACGAAAGACGCAGGCGGATGGACCTTTACGCCGACAGGGGCGTGGGCGGATGGTGATTATACCCTGAGTGTG
TCAGTCGAAGATAAAGCGGGGAACACCAGCCATTCTGCATCGCTGACGGTGACGGTGGACACGCAAATCGCCATTAATAA
CATTGAACTGGTCAATGACAGCGGTATTCCCGACGATAATCTGACTAATAATGTGCGTCCGCACTTCCAGGTGACGGTAC
CGACGGATGTCAACGTGGTGCGCCTGAGCATTGACGGCGGCAAGACGTGGTTCAACGCTACCCAGAGCGCGACGCCGGGC
GTCTGGGATTATACCTGGCTGGCTGATGTAGGAGAGGGGAAGCATACCCTGACAGTGGAGGCGACCGACAAGGCGGGAAA
CCAGACGACGCAGCAACTGGACTTCATCATCGATACCATGCTGTCAGAACCGACTATCGTGCTGGACAACACGGACGACA
GCGGAACAAAAGGCGATAACCTGACCAACGTAAATAAGCCGACGTTTTTACTGGGTAATATTGACGCAGACGCGCGGTAT
GTCACGGTTGAGGTGCAGCATGGCGGCACGAAAGAAGTGCTGACGGCCACCAAAGGCGCGACCGGCATCTGGAGCGTGAC
ACCGACCGGCACATGGGCAGATGGCGACTATACGCTGACGGTGAGGGTGGAGGATGATGCGGGGAACGTAAAATACTCAG
CGCCGCTGACGGTCACGGTTGATACCCAAATCACCATCGATGTTATTGAACTGGTTAATGATAACGGTATTCCCGGCGAC
AACCTGACCAATGACGTTCGTCCACACTTCCGTGTCACGGTGCCAGGGGATGTCAACGAGGTACGTCTGAGTATCGACGG
CGGTAATACGTGGGTTCGTGCAACACAGGGCACGGCAGGGATCTGGGATTACACCTGGCCGAAAGATGTGACCGACGGGC
TACATACCCTGACGGTAGAAGCGACCGATAAGGCGGGAAATAAGACGACGCAGACGCTCGATTTTACCATTGATACCCGG
CTGTCAACGCCTACCATCGCTATGGATAGCAGGGACGATACAGGTGCCATTGGCGATCATATTACGAGCGTCAAAAGACC
GGGCTTTACCATTGGCAATATTGACGCCGATGCGCACTCGGTCATTTTGCGGATCACACAGGGCGGCAATAGCCAGGAAG
TGACACTAACCCAGGTTGGAGGACAGTGGCGCTTTACGCCAGATGCTGACTGGGCGGACGGTAGCTATACGCTAACGGTA
GAAGTCCAGGATAACGCGGGGAATGTTCGCCAGTCCACACCGCTGGTGGTGACGGTGGACACGCAAACCAGCATTACTGA
TATTACATTGGTCAATGATCATGGCGTGCCTGATGACAATCTAACTAACAGCACCCGTCCGCAGTTTGAGATCACGGTGC
CGGCGGATGTGAATTCTGTGCAACTGAGCATTGATGGGGGCGCAAACTGGGTGAGCGCGACGCAGGGTATCGAAGGCGTC
TGGGGCTATACCTGGCCAACGGATATGGGCGATGGAAAACACACCCTAACTGTCATGGTCACCGACAGAGCGGGCAATAC
GGCGACGCAAACGCTTGAATTTTTCATCGACACCCGGTTGTCGACGCCGACCATTGAGCTGGATAGCACGGGTGATACCG
GTACGCCTGGCGATGATATGACCAATCGCACCCGGCCAACTTTTATTCTGCAGAATATCGATTCGGATGTTATCAACGTT
ACAGTCAGCGTCACGCATAATGGAACGACAACCTCGTTTACTGCGACACAGGGGGCTGGAGGATGGAGCTTTACACCGCC
AGCGCCGTGGGGCGACGGTGATTATACGCTGACGGTGACAGTGGAGGATCGGGCGGGAAATACGCGTCCGTCTACGCCGC
TGACGGTGACAGTGGATACGCAAATAGCCATTGATCGTATTGAATTAGTCAACGATAGCGGCGTCCCTGGCGATAATGTG
ACAAAACATGTGCGTCCGCAGTTCCAGATCTCGGTACCGGATGATGTGGAAAAGGTTCTTCTGAGTATTGACGGCGGCAC
GACCTGGGTTACTGCAATCAAGAGTTCGACGGCTGGCATTTGGGATTACACCTGGCCGACGGATATGCCAGAGGGACAGC
ATACCCTGACCGTGGAAGTGACTGACGGTGCGGGTAATAAGATGACGGAGACGCTCAATTTCACTATCGATATCACGTTG
TTAACGCCAACCATTGAGCTAGCGCCCGATCAGGATACCGGACAGAATAAGAACGATAATCTGACCAGCGTCACTCAGCC
GGTATTTGTGTTGGGGAGTATCGATAAAGATGTTCGACACGTGGAATTGAGTATTGAGCATAACGGCACGTTTAAAACGG
TGGTACTCACCGAATCAGCCGACGGCTGGCGCTATCGACCGGATTCTGCTTTGGCGGACGGTAGCTACACATTCACCGTG
ACGGTAACGGATGTGGCAGGCAACCAGCAAACATCCGCGCCTTTAAAGGTGACGATAGACGGTACGTTGACTACGCCGGT
GATTGAACTGGCAGCTGGCGAAGATAGCGGTACTGTTGGCGATCGCCTCACCAATCACGATCGGCCTGTGTTCGACATAC
ATCAGGTTGATTCTGACGTTACGCGCGTGATGGTCAAAGTAACTTACAACGGTAAAACGCACGAGGAAGCGGCGGTATTC
ACCAATGGTCAATGGCGCTTTACGCCTTCTGCGAGCTGGGCTGATGGCTCATATCAGTTAGCCGTTGTGGTGGAAGATCT
GGCGGGGAATGTAAAAGAGTCTGCGCCGTTTGAGGTGCGTATTGATACCACGACAACCATTAACAATATCGTATTGCTTA
ATGATACCGGCGTGCAGAATGATCAATTAACGAATGTTACCAAACCGTCATTCAGAATTGACGTTCCCGGTGATGTCGTC
CAGGTACGCGTAACCCTGGATGGTGGCGCTAACTGGAATGTGATACGCAAAAATGCCGACGGACAGTGGATTTTTGACAG
CCCGAATACTCTGGTTGACGGCACATATACCCTTCGCGTAGAGGCCACGGATGAGGCAGGTAATATTGCGAATAAAGATT
TAGTATTTAATATCGATACTAATATACAGGTTCCTACTATTGCTTTAGACGCAGGACAAGATACCGGAGCGAATACCGCC
GATAATATTACTAATATTTCACGACCCACCTTTACGATTGGTAATGTTGACCCCGATGTTATCAAAGTCGTGGTGACGAT
TGATGGTCATGATTATAACGCGACTAAGGTTGGGGCTGGTTGGCAATTTACACCAGGCAATGCCATTCCGGATGGTTCTT
ATAATATTACCGTTACGGTTGAAGATAAGGCCGGAAATACCGCGACATCGAAACCATTACCTGTTGTGATAGATACGACG
GCTGAAATTGAAAGCGTCACGTTGGTTACAGATAGCGGTGATAGCGATGTAGATAACATTACCAAAGTCGACAAGCCGCA
GTTTAGTATTGTTACCGCTGATGATATTACCCATGTGCGCGTTAAAATCGATAACGCCGCTAATTGGATTGAACTCACAA
AAGGAGGGGATGGCCGCTGGATATTTAATGTCGGTTCGGCATTACCTGATGGGCAACACACTCTCTTGGTTGATGTGACT
GATATCGCCGGCAACGTTGCGCAAGAAACGCTGCAGTTTACGATTGATACGACTCTGCGAGAGCCGACAATTGTACTCGA
TCCCACCCATGATACTGGTGATGATACTAATGATAATCTTACCAGGATTAACAAACCGGTGTTTATTATCGGTAATGTCG
ATAATGATGTATCACACATTGTGGTTCATATTGATGGTCGGGATTACACCATTGAAAACACAGGGGGGAATTTAACCTTT
ACGCCGGATCAACCGCTGTCTGACGGTCAGCATACGATCTCTGTTACCGTAACGGATATTGCTGGTAATACCAAAACATC
GGCCGAACTGCGGATTGAAATCGACACGCAGGTTCAGATTGACAGTGTTACGTTAACAACAGATAGCGGCGTCAACGATC
ACGATAATGTCACCAATGCTACCCGTCCCTCTTTTGAAATTGCAACGCCTGATGATGTGACATCGGTGCTGGTTTCTTTC
GATGGCGTAAACTGGACGCCCATCAGTAAAAATGCGGCCGGGCAGTGGGAATTTACTGCAGGTAGCGCATTGCCTGATGG
TCATTATACTCTCCATGTCCAGGCGACGGATCGGGCAGGGAATACGGCAAATTCCACGCTGGGCTTCACCGTGGATACGC
AGATTGACGGCCTGAGCGTCGTGATGCTGGACGACGCCGGAAAGGATTCTACGGATGGTATTACGAATATTACCTCTCCA
CGTTTTGAAATTTCAGCCAGAGAACCGCTGCAGAGCGTGACGGTAATTTTAAACGGGAAATCCAGCACACTGACTCAGGG
GGCAGGTAATAAATGGCTGTTTACCCCTGATACACCGTTAGTGGATGGAACTTACAAAATAGAAATAGTGGCTGAAGATA
TCGCAGGTAATAAAATTAGCAAAGAGGTATCATTCACAATAGACACTATTGTTTCTGATCCCAGTATTGATTTGCTGGAT
GCGGATGATACTGGCGAAAGCGCTGTTGATAATATTACGAGTGTCACTACACCACGTTTCGTTATTGGCAATGTACCCGC
CGATATTGATACTGTTGTAATCAGAATTAACGGCGTTTCTTATCCGGTTACGGCAAATGGCAATAACCTCTGGGAATTTC
AGGTTCCCGTTGCGTTAAACGATGGCGTATATGAAGCCGTTGTTGTCTTCAGAGATATTGCTGGAAATACTTCTGAAACT
AAGCTGCCCTTTACCATTGATACCACGACAAGCGTCAGTGTCAGAATGGAGCCAGCGTCTGATACCGGAAATTCCAATAG
CGATAACCTTACGAATAAGCAAAATCCCAAATTCGAAGGTACTGCAGAGCCCAATGCGAAACTGGTGATTACCATTGTTG
ACGATAAGTCAGGTCGGGAGGTTTTAAAACAAACGATTACGGTTGGCGCTGATGGCAACTGGAGTGTGACGCCGAATATA
CTGCCGGATGGCATGTATACCATCAACGTCGTCGCAACAGATGTCGCGGGAAATACTGCGCAAACGCAGGAAAGATTCAC
TATCGATACGGTTACGATCGATCCCACCATTCGCCTTTCGGATCCATCTATTGATGATCAGCATGAAGCAACCAGCCTGC
GTCCTGAGTTCAAAGGGTTTGCCGAAGCGTTCTCGACGATTATGATTCAGTGGGATGGGAAAGTGGTCGGCTCGGCAAAC
GCCAATGCGAATGGCGAATGGAGTTGGACGCCGCCATCAGTATTAGCGCCAGGCTCCTATGTTGTGAGCATTGTTGCCAA
AGATAAAGCGGGTAATGAATCGTCGCAGGTCGACTTTCCTGTCGTAATACCTGTTATTGATGTCACGCCTCCAACCATAA
AGCTTAGCGAGGAGAGCGATAGTGGTGCCTTAGGAGACTTTACGACGAATAATAAAACGCCGACCCTGATTGGGAGCACG
TTACCTAATACGATTGTGAGTATTTATGTGGATGGCGTGAAGGTCGGCGAGGCGACAGCGGATACAGCGGGTCGATATAC
TTTCCAGTTATCGGAAATGAAAGATGGCCATTATGTCGTCCAGGTGGGTATCGTCAACCCTCGCGATAATAGCGAACTGC
GTTCTACCGCCGTTGATGTCACTATCGATACCGAGGTTGCTGAACTGGTATGGAATATATCTGGAATGCATGAGGGCGGA
TATATCAATACGGTGACGCCGGAGATTGGCGGCACCAGTGAGCCAAACAGCAAAATCACTATCTTTGTGAATGGCGTTGA
AAAAGCGATTGCTTATACGACAGGCGCAGGACACTGGGGCGTAGTATTACCCGCTTTGGGTAATGACGGTAATTATGAAT
TAACGTTTAAAGTTGAAGACGTTGCCGGCAATATCAGAGAGTTTGGTCCGCAGAATGTAATACTGGATACAGTAATTTCG
CCGTTAACCGTGGTATTACGCGAAGCTGATGACAGTGGCAAAGTTGGCGACTGGATCACCAATAAATCTCATGTCACCAT
CGATGGTACTGCCGAAGCCGGAAGTACTTTAACCATCAGGAATCCGCAGGGGGTGGTTATTGCTACCCTGGTGGTAGGCA
ATGATGGTCGATGGAGCGCAGAATTAGATCTGCGTGAAGGTAGTAATGCCTTTGTCGTGGTATCGGAAGATAAAGCGGGC
AACAGCCAACAAAAAGAGATTCTGATAGAACATGATACGCAGATTGAAATCAGCGATATTTCATTAAGTCGGGATACTAA
TAGCGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTACTGGTTGCCATGACCGATCCCGGCGCGACGGTAC
AGGTTTATATTAATGGTGTGTTACAAGGCACAGTAGAGGCGAGTTCGTCAGGTAATATTAGCTATACCATGCCGGCAAAT
AGCGCCGACGGCGAGTATCAGGTGCAATTTGTTGCTACGGATACTGCTGGTAACCGGGTTGAGTCTGCGATTACAACCGT
GACAATCGATTCTCAAATTGCTGTCTTTGATATTGATGAAGATTCATTACCGGCCCTCTCTAATAACCGAGCGTTGTCAG
TCTCAGGTGTCGGGGAGGCTGGTTCTCAGGTCAGCATCTTTGTCGATGGTAAATTAGTCAACGTTGTTATGGTTGAGGCT
GATGGCACATGGCGCGCGCCGATACTGCTGCAAGATGATGGTACGTTTAATATTCATTTCAGCATTACTGACGTTGCTGG
CAACACTGAAGTGAGCAAGGATTATAGCGTGGATGTCGATTCATCAACCGACTTCCCAACGCTCAACCTTGAAGATGCAA
GCAACTCTGGTTCACTTGACGATCTGATTACTAATCACAACAAGCCTGTATTAGTTGGCACCGCAGAAGCGGGAGCCACA
ATCCATATTTATGTGGATGAAAAGATCGTGGCAAATGTGCTTGTGCTTGAAGATGGAACCTGGTCCTATCAGTTTGATAA
TGCGTTAAAAGATGGTGAATATTCTATCCGTGTGGTTGCCGAAGACCCGGCAGGTAATACGGCAGAATCGCCTCGCTTAC
TCGTCACGATAGATACCAGTACGTTTATCGATAATCCTGCTATGGTGGCAGGTTCTGATAATGGTATTTTCAGTAATGAT
AGTATAACGAGTCAGACCCGGCCTACGTTTAGTATTTTTGGAGAAATGAACCAGAGTGTTCAGATTTTCATTGATGGAGT
GCTAGTCGATACGATCACGGTGACCGACAGAAATCAAGTTTATCGACCTGAGTCACCGTTGGGCGATGGTTCCCATAGCA
TTTATTATGTTATCACCGATAAAGCAGGCAACACGGCTACCTCGAAAACGCTAAACTTTACTATCGATACCTTTAATACG
ACGCCTGTCGCCATTGATTCTATCGGTGGACAAACGTTAGCAGAGATGACCGGTAGTGATGGCAAAATATATATAACGGA
CACGACACGTAACTTATTGTTTAGTGGCAGTGCCGAGCCCAATAGCAAAATAGAAATCATTATTAATGGCTTAAATGTGG
GGGAAGTTTGGGTTAATGACAAAGGCCACTGGCAGATGCCGGTGAACCCGCTTTATTTCACAGAAGGCCAGCTGGATATC
ACTGTTAAATCTACGGACCGTGCTGGTAACGTAAATCAGGAAAAGTATTCCATTTGGGTCGATACGCATATCCAGGTATT
TACCAGCGAGCTTGATGACAATAAATCATCATCGAAAACGGACTGGTGGAGTAATAGCTCCACTATTACCATGAGAGGTA
TGGGGGAAATTGGCGCTACGGTATCATTAATCGTGGCGGGGGTCACGCTGGCAACCGCTGTCGTTGCGGCTAATGGGCAG
TGGGAGTTATCGACCGATCAGCTTCCGGAAGGGAAATACGATATCACTTTGAGTATTGAGGATAACGCAGGCAACCGTAA
GGAAGAGGTACATGAAATATTTATTGATCGAACGCCGCCAAACGCTCCGGTCGTAACTTATTCAGATATTGTCAACGATC
TAATTATTATGCAGGGGACGGCGGAAGCCAAATCTCAGCTAATAATAACCGATAGTAATGGGAATACTTATACGTTAACC
GTTCCTGATAATGGTAAATGGAGTATGGCGATCCCGTATCCATCGGAAGGGAAGTTTACCATTACGAGTGTGGATGCGAT
TGGTAACCGGAGTGATGATGTCCCTCTCGATATCATGAAAGAGGTTCCCGTTATTTCATTATCTCCAGACTCAGACAGTG
GTACGGTGGGCGATAATATTACGCGAGATAAGCAACCTACCTTTATTATCGGGAATCTGGAAAGCGATGTTGTGGTCGTT
CAGGTCGATATCAATGGGACCGTATATAATGCTGAAAAAAATGCCGATGGCGTTTGGTTCTTTACGCCAGGTACACCGTT
AGCTGATGGTTCCTATACGATATCGGTAATCGCAAGCGATGCCGCGGGTAATCAGAAAAACTCGTTACCCATTACCGTTA
CGATCGACAGTACGCTGACCGTGCCGGAGATTGCGCTGGCAGCAGGTGAAGACAATGGCGCTTCAGACAGCGATAACGTG
ACGAATCACACCCAGCCTAAGTTCACGCTGCAGCATATTGATGCTGATGTGACCGGGGTGACCGTAAACGTGACGCATAA
TGGCGTGACAGACATCTATCAGGCGACGCAAGGCGCGGATGGCTGGACCTTCACGCCGCCAGCCGCCTGGAATGACGGTA
CCTACACGCTGAGCGTGACGGTGGTGGATCGCGCGGGGAACTCACAGCAATCTGCTTCACTAGCGGTGACGGTTGACTCA
ACGGTGACGGTAACAGCGGATAGCCAGCATAACGATGCGAGCGATGACGCCACGGCAACAGCGGTTACTCCACCGGAGTC
TGAAACAGTGAATGCCGAAAGCGCTACGCATCTTCGTACAGTGCCGTCTGTGGCGGAAGAAAGCGTGGTGAAGGAGACAG
CCTATAGTATTACATTGTTAAACGCTGACTCTGGGGATGAAATAGATCGTTCAATTAGTCAGACACCTTCTTTTGAAATA
TCAGTACCTGAGAATATTGTTAATGTCAGTGTTATGTTTGAAGGAGAAGAGTTTACTCTGCCGATAACTAACCAGAAAGC
AATATTCGAAGTTCCGCTATCTTTGGAAGATGGTGAATATACTATGGACGTGAAATTCATTGATAAGGACGATGATTTCC
TGATTAAGGAGAAAACATTCTCAGTCGATCACTCCTCGGCGGATATTGTGAACGCAATGAATGCAAGAGGAAAGACCGAG
GATGATATTAATGATTCCCCTTCAACGAGTTCTGTAGGGCACAACAATAACGGCGCTATTGATGTTTTCGCCGTTAATGA
AGTTACGTTACCTGTAGATAATCAAGAAGAACACGCATAA

Protein sequence :
MGNKSIQKFFADQNSVIDLSSLGNAKGAKVSLSGPDMNITTPRGSVIIVNGALYSSIKGNNLAVKFKDKTITGAKILGSV
DLKDIQLERIDSSLVDSAQVEKKGNGKRRNKKEEEELKKQLDDAENAKKEADKAKEEAEKAKEAAEKALNEAFEVQNSSK
QIEEMLQNFLADNVAKDNLAQQSDASQQNTQAKATQASKQNDAEKVLPQPINKNTSTGKSNSSKNEENKLDAESVKEPLK
VTLALAAESNSGSKDDSITNFTKPQFVGSTAPNATVIIKINGIAVGQAVADSLGNFTFTAPETLTDGTYNLEAEAKTADG
SGSAKLVITIDSVTDKPTFELSPESSVSGHKGLTPTLTPSIVGTAEENAKVDIYVDNKLVASVDVDKDGNWSYEFKDNEL
SEGENSIKVVAVDKAGNKNETTDSIITDTIPPEKPTIELDDSSDSGIKNDNITNSTLPTFIGVAEPGSTVSIYLGLKHLG
EVIVAKDGTWSYTLTTPLKDGEYNITATATDIAGHTSATANLPFTIDTRISYFSAEIETTNDSGIVGDNVTNNTRPTFTG
KTEPNAIISVINSETGEEVIFKANDKGEWTFNFTSDSVEGINNLTFTVEDVAGNKKDFSFSYVIDTIAPVPPTVSLEDFV
VLPNGIILSGNDLPALVGTAEPKSTILLMRDGKLYDSIEVDSNGTWNYQFSNKFLQGAYDIEIISQDAAGNKSSTVKYSF
TIQTEVVPPKAELDASDDSGAKGDWITNKHNALTLLGTADRFATVNILIDGKTIGVTTADADGNWNFDISRNLSDNVYKI
TVESIDPLGRTSSVDYQLTIDSFTPIPTVMLHDSADSGVKGDMITKINTPLFTGMAEANAKVSIYVDGVLSGEAIAGDDG
VWNFQFTTALSDGSHDVTVKVEDIAGNTASSSAYNFQIVTQTQKPTIELVNDTGVDNTDHIINEKNPALTGTAAPYSTVK
LYIDGALIAEVRTNKDGRWEYTLKADQGLVDGDHRITASVEDIAGNIAHSDPFLISVDTAISIPIVSLSPDSDSGIADDN
LTNIVKPTLHLKDIDPDIISVQVWDAMSDTQIGVATQQPDGSWAYTFTSDLTEGLHQVYVKVEDIAGNKANSAVFDFTID
TTVSTPVISLLSKDDTGVTGDNLTNINKPGFAISGVDADAHRVVVQVMHNGVSEEIELSHLNGSWLFIPGNTWADGSYTL
TVKVEDKAGNTNYSAPLTVVIDTQIAIDGVELVNDSGVKGDNMTNDDRPHFRVTVPTDVNEVRLSIDGGNSWVQATPGVA
GSWEYIWPTDLADGQYTLTVEATDKAGNTVTKTIDFAVDTTLSVPVIVLDSADDTGIQGDNMTNSTQPTFALQHIDDDAV
RVTVSVEHGGVTTTFDATKGTGGWSFTPTGAWADGDYTLSVSVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPND
NLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATTGVWDYIWPDDVADGGYTLTVEATDEAGNKATQTLDFTIDT
TLSVPTLSLDSADDSGIAGDNITSVKTPGFTLNNIDTDVSRVIAEVMHNGIKQEVPLVQTGGQWRFAPTSDWADGDYILT
VKVEDRAGNVKQSAPLTVTVDTHIAIDRIELVNDSGIPDDNLTNEARPHFQVTVPADVNGVRLSIDGGKTWFDATQSATS
GVWDYTWLTNVANGPHTLMVEATDKAGNKTTQKLDFIIDTLLSEPTITLDSADDSAAGDNITNVKMPGFTLGNIDADVTK
VVVTVAHDGKNQQIELIKNGGVWRFTPGAAWTDGDYTLTVKVEDKAGNTNYSAPLTVTIDTQTSIDRIELLNDTGIVGDN
LTNEARPQFHITVPTDVNSVQLSLDGGINWVNATLTSDGVWEYIWPTDLVENTYTLTVKATDVAGNTATETLNFIIDTTL
STPTITLDSADDSGTANDNKTNVKTPGFIIGGIDSDVTQVVVQVMRDGHSEEVELTQTNGQWRFVPGSAWTDGDYTLTVT
VKDEAGNIRHSALLTVTIDTQIAIDHIELVNDSGIPDDNLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPGV
WDYTWLADVGEGKHTLTVEATDKAGNKTTQQLDFIIDTLLSEPTIVLDSTDDSGTKGDHLTNVNKPTFLLGNIDADARYV
TVEVQHGGTKEVLTATKDATGNWSVTPTGTWADGDYTLTVRVEDEAGNEKHSASLTVTVDTQITIDVIELVNDNGIPGDN
MTNDAHPQFRVTVPGDVNEVSLSIDGGVTWVKATQSATPGVWNYTWPGTVPDGDYTLNVKATDNAGNTVTETLHFTIDTT
LSTPVIVLDSADDTGIQGDNMTNRTQPTFNLQHIDDDAVRVTVSVEHGGVTTTFDATKDAGGWTFTPTGAWADGDYTLSV
SVEDKAGNTSHSASLTVTVDTQIAINNIELVNDSGIPDDNLTNNVRPHFQVTVPTDVNVVRLSIDGGKTWFNATQSATPG
VWDYTWLADVGEGKHTLTVEATDKAGNQTTQQLDFIIDTMLSEPTIVLDNTDDSGTKGDNLTNVNKPTFLLGNIDADARY
VTVEVQHGGTKEVLTATKGATGIWSVTPTGTWADGDYTLTVRVEDDAGNVKYSAPLTVTVDTQITIDVIELVNDNGIPGD
NLTNDVRPHFRVTVPGDVNEVRLSIDGGNTWVRATQGTAGIWDYTWPKDVTDGLHTLTVEATDKAGNKTTQTLDFTIDTR
LSTPTIAMDSRDDTGAIGDHITSVKRPGFTIGNIDADAHSVILRITQGGNSQEVTLTQVGGQWRFTPDADWADGSYTLTV
EVQDNAGNVRQSTPLVVTVDTQTSITDITLVNDHGVPDDNLTNSTRPQFEITVPADVNSVQLSIDGGANWVSATQGIEGV
WGYTWPTDMGDGKHTLTVMVTDRAGNTATQTLEFFIDTRLSTPTIELDSTGDTGTPGDDMTNRTRPTFILQNIDSDVINV
TVSVTHNGTTTSFTATQGAGGWSFTPPAPWGDGDYTLTVTVEDRAGNTRPSTPLTVTVDTQIAIDRIELVNDSGVPGDNV
TKHVRPQFQISVPDDVEKVLLSIDGGTTWVTAIKSSTAGIWDYTWPTDMPEGQHTLTVEVTDGAGNKMTETLNFTIDITL
LTPTIELAPDQDTGQNKNDNLTSVTQPVFVLGSIDKDVRHVELSIEHNGTFKTVVLTESADGWRYRPDSALADGSYTFTV
TVTDVAGNQQTSAPLKVTIDGTLTTPVIELAAGEDSGTVGDRLTNHDRPVFDIHQVDSDVTRVMVKVTYNGKTHEEAAVF
TNGQWRFTPSASWADGSYQLAVVVEDLAGNVKESAPFEVRIDTTTTINNIVLLNDTGVQNDQLTNVTKPSFRIDVPGDVV
QVRVTLDGGANWNVIRKNADGQWIFDSPNTLVDGTYTLRVEATDEAGNIANKDLVFNIDTNIQVPTIALDAGQDTGANTA
DNITNISRPTFTIGNVDPDVIKVVVTIDGHDYNATKVGAGWQFTPGNAIPDGSYNITVTVEDKAGNTATSKPLPVVIDTT
AEIESVTLVTDSGDSDVDNITKVDKPQFSIVTADDITHVRVKIDNAANWIELTKGGDGRWIFNVGSALPDGQHTLLVDVT
DIAGNVAQETLQFTIDTTLREPTIVLDPTHDTGDDTNDNLTRINKPVFIIGNVDNDVSHIVVHIDGRDYTIENTGGNLTF
TPDQPLSDGQHTISVTVTDIAGNTKTSAELRIEIDTQVQIDSVTLTTDSGVNDHDNVTNATRPSFEIATPDDVTSVLVSF
DGVNWTPISKNAAGQWEFTAGSALPDGHYTLHVQATDRAGNTANSTLGFTVDTQIDGLSVVMLDDAGKDSTDGITNITSP
RFEISAREPLQSVTVILNGKSSTLTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKISKEVSFTIDTIVSDPSIDLLD
ADDTGESAVDNITSVTTPRFVIGNVPADIDTVVIRINGVSYPVTANGNNLWEFQVPVALNDGVYEAVVVFRDIAGNTSET
KLPFTIDTTTSVSVRMEPASDTGNSNSDNLTNKQNPKFEGTAEPNAKLVITIVDDKSGREVLKQTITVGADGNWSVTPNI
LPDGMYTINVVATDVAGNTAQTQERFTIDTVTIDPTIRLSDPSIDDQHEATSLRPEFKGFAEAFSTIMIQWDGKVVGSAN
ANANGEWSWTPPSVLAPGSYVVSIVAKDKAGNESSQVDFPVVIPVIDVTPPTIKLSEESDSGALGDFTTNNKTPTLIGST
LPNTIVSIYVDGVKVGEATADTAGRYTFQLSEMKDGHYVVQVGIVNPRDNSELRSTAVDVTIDTEVAELVWNISGMHEGG
YINTVTPEIGGTSEPNSKITIFVNGVEKAIAYTTGAGHWGVVLPALGNDGNYELTFKVEDVAGNIREFGPQNVILDTVIS
PLTVVLREADDSGKVGDWITNKSHVTIDGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAELDLREGSNAFVVVSEDKAG
NSQQKEILIEHDTQIEISDISLSRDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEASSSGNISYTMPAN
SADGEYQVQFVATDTAGNRVESAITTVTIDSQIAVFDIDEDSLPALSNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEA
DGTWRAPILLQDDGTFNIHFSITDVAGNTEVSKDYSVDVDSSTDFPTLNLEDASNSGSLDDLITNHNKPVLVGTAEAGAT
IHIYVDEKIVANVLVLEDGTWSYQFDNALKDGEYSIRVVAEDPAGNTAESPRLLVTIDTSTFIDNPAMVAGSDNGIFSND
SITSQTRPTFSIFGEMNQSVQIFIDGVLVDTITVTDRNQVYRPESPLGDGSHSIYYVITDKAGNTATSKTLNFTIDTFNT
TPVAIDSIGGQTLAEMTGSDGKIYITDTTRNLLFSGSAEPNSKIEIIINGLNVGEVWVNDKGHWQMPVNPLYFTEGQLDI
TVKSTDRAGNVNQEKYSIWVDTHIQVFTSELDDNKSSSKTDWWSNSSTITMRGMGEIGATVSLIVAGVTLATAVVAANGQ
WELSTDQLPEGKYDITLSIEDNAGNRKEEVHEIFIDRTPPNAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSNGNTYTLT
VPDNGKWSMAIPYPSEGKFTITSVDAIGNRSDDVPLDIMKEVPVISLSPDSDSGTVGDNITRDKQPTFIIGNLESDVVVV
QVDINGTVYNAEKNADGVWFFTPGTPLADGSYTISVIASDAAGNQKNSLPITVTIDSTLTVPEIALAAGEDNGASDSDNV
TNHTQPKFTLQHIDADVTGVTVNVTHNGVTDIYQATQGADGWTFTPPAAWNDGTYTLSVTVVDRAGNSQQSASLAVTVDS
TVTVTADSQHNDASDDATATAVTPPESETVNAESATHLRTVPSVAEESVVKETAYSITLLNADSGDEIDRSISQTPSFEI
SVPENIVNVSVMFEGEEFTLPITNQKAIFEVPLSLEDGEYTMDVKFIDKDDDFLIKEKTFSVDHSSADIVNAMNARGKTE
DDINDSPSTSSVGHNNNGAIDVFAVNEVTLPVDNQEEHA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
SC4140 YP_219127.1 inner membrane protein Not tested SPI-4 Protein 0.0 100
STM4261 NP_463126.1 inner membrane protein Not tested SPI-4 Protein 0.0 99
siiE CAE11797.1 large repetitive protein Virulence SPI-4 Protein 0.0 99

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
SC4140 YP_219127.1 inner membrane protein VFG0581 Protein 0.0 99