Gene Information

Name : SARI_03417 (SARI_03417)
Accession : YP_001572388.1
Strain : Salmonella enterica RSK2980
Genome accession: NC_010067
Putative virulence/resistance : Virulence
Product : hypothetical protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3323857 - 3345921 bp
Length : 22065 bp
Strand : -
Note : 'KEGG: mmr:Mmar10_2493 2.1e-21 serralysin K01406; COG: NOG39362 non supervised orthologous group; Psort location: cytoplasmic, score: 23'

DNA sequence :
ATGAAAAACATGAATATAAAAAAAGTTTTTGCTGATCAGAATTCTGTGATTGACCTTTCCTCTTTGGGAGATGCCAAAGG
AGCTAAGGTTTCTTTGGCTGGGCCGGACATGAATATTACCACGTCGCATGGTTCAGTCATCATTGTCAACGGAGCTCTTT
ACTCAAGCATTAAAGGCAACAATCTTATCATTAAGTTTAAAGATAAGAGTATCCCTGGTTCCAAAGTTATCGGGAGTGTG
GATTTAAAAGATATTCAGCTTGAGCGAATTGATAGTTCTTTAGTTGATGCAGGTCTGGTGGAGAAGAAAGGTAACGGTAA
AAATAGAAATGCCAGGAAAGATGAAGAACTACAAAAGCAATTAGATGATGCTGAGGGCGCAAAAAAAGAGGCCGATAAAG
CAAAGGAAGAAGCAGAAAAGGCTAAAGAAGCAGCAGAAAAAGCGATCAGTGAAGCTTTCGAAATCCAAAATTCTTCAAAA
CAAATAGAAGAAATGCTGCAGAATTTTTTGTCAGATAATGTAGCAAAAGACAATTTGGCTCAACAAGATAATGCCATACA
GCAAAACACTTTAAGCAAAGCAGCTCAAAATATTAAGCAGGATGAAGCCGAAAAAATAATACCTCAACCTCTTAATAAAA
ATACAGGCAGTGGAAGAAGTAATAGTAGTAAGAATGAAGAAAATCAATTTGAAGCTGAACCTGTTAAAGAGAAACTAAAA
ATATCCTTTAAGCTTGCAGCAGAAAGCAATAGTGGAAGCAAAGATGATAGTATAACTAATTTTACTAAACCACAGTTTAT
TGGTAGCACATCACCAAATGCAACAGTGGTTATTAAAATAAACGGAATTTCTGTCGGTCAGGTTGTTGCCGATAAGTTAG
GTAATTTTACCTTTACTGCTCCTGAGAAATTGGCCGATGGAACATACAATCTGGAAGCGGAAGCCACAACTGGTAACGCA
ATGGGTAGCACTAAGCTTGCCATTACTATAGACTCCGTTATTGATAAACCAAGTTTTGAACTTTCGCCAGAAAGCAGTAT
TCCTGGTCATCAAGGCTTAACCGCTACGTTGACACCATCAATTATTGGTACCGCAGAAGAAAATGCAAAGGTTAATATTT
ACGTTAACGATAAACTTATTACTAGCGTAGATGTTGATAAAAATGGTAAGTGGAGTTATGGATTTAAAGGTAAAGAATTA
ATTGAAGGAGATAATAATATTAAGGTTGTTGCAGTAGATAAGGCTGGCAACCAAAGTGAAATTTCAAATATAATTACAAT
AGATACCATTCCTCCGGAAAAGCCGACAATTGAGCTGGATATTAATAGTGATTCTGGTGTTAAAGATGACAATATAACTA
ACAGTACATTACCTACATTTATAGGTGTGGCTGAGCCTGGGGCAACGGTTTCCATCTATATTGGAATTAAGCACCTGGGG
GATGTTGTTGCTGCTAAAGATGGTTCGTGGAGTTATACGCTTACTGAGCCCCTGAAAGATGGCGAATACCATTTAACAGC
GACAGCTACAGATATCGCCGGACATACCTCTGAAACATCAGAACTTACATTTACCATTGATACTCGTATCAGTTATTTTA
GTGCAGAGCTTGATCCTGCCGATGATAGTGGTATTGTTGGCGATAATGTTACTAATAATAGCCGCCCTACTTTTATCGGA
AAAAGTGAACCAAATACCACGATAAATGTTAAAAACTCTGAAACTGGTGAATTAGTTGTTCTTAAAGCCAATGCTGAAGG
TGAGTGGCAATTTGCTTTTACTTCGGATTCCGCTGAAGGGGTTAACAACCTGGTTTTCACTGTTGAGGATGTGGCGGGTA
ACCAGAAAGATTTTTATTTTAGTTATGTTATTGATACAGTAGCGCCGACAGCCCCGACAGTTTCCCTGGATGATTTTGTA
ACATTACCAAACGGCATTATTTTATCAGGGGATGATACACCTGCATTGGTCGGTACGGCAGAGCCTAAATCTACAATATC
AATTCTGCGAGAAGGTAAATTTTATGCCAGCATTGACGTCGACTCAAATGGCTCATGGAGTTATCAATTTAATGAAAAAC
TCCCGCAAGGGGTATATGACATTGAGATTGTTTCTCAGGACATAGCTGGTAATAAATCCTCGGCAATTAAATACTCTTTT
ACTATCCAGACTGAAGTTGTAATCCCAAAAGCCGAACTTGACGCGGTTGATGACTCTGGCGAGAAAGGGGACTGGATTAC
CAATAAGCATAACGCTCTGACTTTACTCGGGACTGCTGGTAAATTTGCTACCGTAAATATTATTATTGATGGCAAAGCTA
TTGGAGTGACAACAGCAGATGAACACGGGAACTGGACTTTTGATATTTCCCGTAATTTGTCTGACGATGTTTATACAGTG
ACGGTTGAGGCAGTAGACCCATTAGGTAATACTGCATCGGCTGATTATCAACTTACCATTGATAGTTTTACACCAATCCC
TACTGTTATGTTGCATGATAGTGCTGACTCTGGGGTTAAAGGAGACCTGATTACAAGAGTTAATACGCCTTTATTTACCG
GAAGCGCAGAGCCTAATGCTAAAGTCTCAATCTATGTTGATGGTATCTTAAGCGGTGAGGCCATTGCTGGCGATGATGGT
GTATGGAACTTCCAATTTTCAAATATATTGCCTGATGGCATGCATGAAGTGATGGTAAAAGCGGAAGATATTGCTGGCAA
TAAAGCATCATCATCAATTTATAACTTCCAAATCCTTACGCATACACAAAAGCCAACCATTGAGTTAGTCGATGACACAG
GGTTGGATAATACAGATCATATCATTAATGAAAAACGACCTGCCCTGACAGGGACTGCTGCACCTTATTCAATCGTAAAA
TTATATATAGATAATGCTTTGGTGACTGAAGTCAGGACGAATAAAGACGGTGTATGGGATTATACTCTGAAACCAGATCA
AAGTCTGGCTGATGGTGATCATAAAATAACCGCCACAGTAGAGGATATTGCTGGAAATATTGCACATTCTGACGCCTTTT
TACTTAGTGTGGATACTACCATATCTATACCGGTAGTTTCACTAAGCCCTGATTCTGAGTCCGGAGTTTTAGATGATAAT
TTAACGAATATACCTAAACCAACTCTTATTCTTAGAAATATTGATTCAGATGTTAGAAATGTTCAGGTATGGGATGCTAT
CTCTAATACACAGATAGGTATTGCTACCCAACAATCTAATGGAACATGGACATATACTTTTACTTCAGATCTGATTGATG
GCCTGCATCAGGTATATGTTAAAGCTGAAGATATCGCTGGTAATAAGGTTACTGGTCCTACATTTGATTTTACTATAGAT
ACGACACTTTCCATTCCGGTTATTTCTTTGATTGCAAAAGATGATACTGGCGTGGCGGATGATAATATTACCAATATTAA
TAAGCCTGACTTTATTATTAGTGGTATTGATTCTGATGCACACCGGGTAGTTGTACAGGTGACACATAATGGCGTGAATG
AACAGATTGTACTGACTCAAGATGGCGGTAACTGGGTATTTACACCTGCCAGCACGTGGGATGATGGCAGCTATACACTG
CAAGTGACGGTGGAAGATGAGGCGGGAAATATTCGCCAGTCCACACCATTAACAGTGAAAGTGGATACGCAAATCGCGAT
TAATAGCATCGAACTGATCAATGACACTGGTATTGCTGACGACAATATAACTAACGATATGCGTCCACACTTCCGTGTTG
AAGTGCCAAATGACGTAAATATGGTACGTCTGAGTATTGACGGGGGCAAGACATGGGGGAGTGCGACGAAAAATACGGCA
GGCATTTGGGATTACAGTTGGCCGACGAATGTAACTGAAGGGTCACATATCCTGACGGTAGAAGCGACCGATATTGCTGG
TAATAAGTTAACGCAGACACTCGATTTTACTATCGACACTTTGTTGACTGTGCCGACCATCGCTCTGGATAGCGCCGATG
ATAGTGGTGTTACCGGGGATAATATTACTAACAGCAAAACGCCGGGCTTTACCCTCGGCAATATTGACGGCGATGTGATT
CGGGTGGCGCTACAAATCACGCATAATGGCAAGAACGAGGTAGTGGCGCTGACGCAGAGTGGTGGTAATTGGGTATTTAC
GCCAGACCACGACTGGGCAGATGGCAGCTATACGCTACAAGTGACGGTGGAAGATGAGGCGGGAAATATCCGTCAGTCCA
CACCGTTAACAGTGAAAGTGGATACGCAAATCGCGATCGACAATATCGAATTGATTAATGACACCGGTATGGTCGGCGAC
AATCTGACTAACGACATTCATCCGCAGTTCCGTGTGACGGTACCAGATGATGTGGATAGGGTACGCCTGAGTATCGACGG
CGGTAAAACGTGGGTTAACGCCACACCAGGCTTAGTAAAAGGGAGTTGGGATTATACATGGCTGGGGAAAGTTCCCGAGG
GTAAACACACGCTGATCGTGGAAGCCACCGATATTGCAGGAAACACGGCGACACGGACGCTGGATTTTACCGTTGACACC
ACCCTGTCTGTACCGACCATCATGCTGGATACCGCGAATGATAGCGGTGTGACTGACGATAATATCACCAACGAAAGAGC
GCCAGGCTTTACCCTCGGCAATATTGATGCGGATGCTAGCCAGGTGGTGGTGCAGGTCGTGCACAATGGCAAGAGTGAAG
AAGTGGAGCTGACCCAGACCAGCGGCAAGTGGGTATTCACACCGACCAGCGAGTGGGTTGATGGTAATTACACCCTGACG
GTAAAAGTGACCGACGAGGCAGGGAATACTCGCCAGTCAGTACCATTGTCGGTGAAAGTGGATACGCAGATCACGATTGA
CGGCATCCTGTTGGTTAATGACAGTGGTATCACCGGTGATAATATAACCAACGAGGTGCATCCGCATTTCCGGGTGACGG
TGCCGGAAGATGTCAACGTAGTACGCCTGAGCATCAACAGTGGCACAACATGGATTAACGCCACACAGTCTTCTACCGGT
ATCTGGGATTACACCTGGCCGGACGCGCTGCCTGAGGGGAAACATACCCTTGTCGTGGAGGCTATCGACATAGCTGGGAA
CACGGTGACGCGGACGCTGGACTTTACCGTTGATACCACCCTGTTGGACCCGACCATCACGCTGGATACCGCGAATGACA
GTGGTGTGCCTGGCGACAATATCACCAACGAAAAAACGCCTGGTTTTACTATTAACGGCATTGATGCGGATGCGATCAGG
GTGGCTGTACAGGTTACGCATAATGGCACGAGCAAGGAGGTGGAACTGACCCAGAGCGGGGGGCAGTGGCACTTTACGCC
GACCAGTGACTGGGCGGATGGCAAGTATACCCTGACGGTGAAAGTCGAGGACAGAGCGGGGAACATAAACCAGTCCGTGC
CACTGGCAGTGACCATCGATACGCAGACGGAGATTAACAACATTGTACTGGTCAATGATACCGGCGTGCCGGATGACAAC
CTGACCAACGATGTGCGTCCGGAGTTCCGGATAGAGGTGCCGGAAGATGTGAACGTTGTACGTCTGAGCATTGACGGCGG
CAAGACGTGGGTGGATGCGAATAAAACGTCGGCAGGTGTCTGGGATTACAACTGGACAACAGACCTCACTGAAGGGGTAC
ACATGCTGACGGTGGAAGCGACCGATATCGCAGGGAACACGGCGACGCGGACGCTGGACTTTACCGTTGACACCACCCTG
TCGGTACCGACCATCACGCTGGATACCGCGAATGACAGTGGTGTGCCTGGCGACAATATCACCAACGAAAAAACGCCTGG
TTTTACTATTAACGGCATTGATGCGGATGCGATCAGGGTGGCTGTACAGGTTACGCATAATGGCACGAGCAAGGAGGTGG
AACTGACCCAGAGCGGGGGGCAGTGGCACTTTACGCCGACCAGTGACTGGGCGGATGGCAAGTACACCCTGACGGTGAAA
GTCGAGGACAGAGCGGGGAACATAAACCAGTCCGTGCCACTGGCAGTGACCATCGATACGCAGACGGAGATTAACAGCAT
TGTACTGGTCAATGATACCGGCGTGCCGGATGACAATCTGACCAACGATGTGCGTCCGGAGTTCCGGGTGACGGTGCCGG
AAGATGTGAACGCGGTACGCCTGAGCATTGACGGCGGCACGACGTGGGTTAATGCGACGAAAACGTCGGCTGGTATCTGG
AATTATAGCTGGACAACAGACCTCACTGAAGGGGCACACATGCTGACGGTGGAGGCGACGGATGCGGCGGGCAATACGGC
GACGCGGACGCTGGACTTTACCATTGACACAACTCTGTCAATGCCAACCATCACGCTGGACAACGCGGATGATACTGGTG
TACAGGGGGATGACCTGACCAACCGCCCCCAGCCGAATTTTATCCTGCAGCATATTGATGCCGACGTCGCTAGCGTTGTG
GTAAGCGTGACGCATGACGGTACGACAAGTGTATTTGATGCGAGTCAGGAAGCTGGGGGGTGGCGTTTTACGCCGGATAG
CGACTGGGCGGACGGCAGTTACACTCTGAGTGTGATGGTGACGGATAAAGCCGGGAACGTAAGTCAGTCCACCCCTCTGA
CGGTAACAGTGGATACACATATCTCAATTGATAAGGTTGAGCTGGTTAATGACAGCAGCGTCGTTGGCGATAATATGACT
AATGACAGTCATCCACAGTTCCGGGTGACGGTGCCGGAAGATGTGAACGCGGTACGCCTGAGCATTGATGGCGGCACTAC
ATGGGTTAACGCAACGAAGGGCGCGGCAGGGATCTGGGATTATACCTGGCCAGATGAGGTGAAGGATGGGAAATACACCC
TGCAGGTGGAGGCGACTGACAAGGCGGGCAACACCACCACACAGATGCTGGCATTTACCATTGATACCACGCTGACAAAG
CCGACCATTGCACTGGACCATAAGGATGATAGCGGGATTACTGACGATAATATCACCAACGCGAAAAAGCCAGGCTTTAC
CCTCGATAATATTGATGCCGATGCGATCCGGGTGGTGGTGCAAGTAACGCATGATGGCAAGAGTAAAGAGGTAGCGCTGA
CCAAAAGCGAGGGACAGTGGAGCTTTACGCCGACAGTGCCGTGGAATGACGGCGCCTATACGCTGACGGTGATGGTGGAG
GATAAAGCCGGGAACGTCAGCCATTCCGCCCCGCTGACGGTGACGGTGGACACGCAGACAGCCATTAACAGTATTGAGCT
GGTTAACGACACCGGTATTCCGGGCGACAGCCTGACCAATGCGGTGCGTCCGCACTTCCGGGTGGCGGTGCCGGATGATG
TGAAGACGGTACGCCTGAGTATTGACGGCGGCAAGACGTGGGGGGATGCGAAGAAAACCTCCGCAGGCGTCTGGGACTAC
AGTTGGCTGACAGATGTGACTGAAGGGGCGCACACGCTGACGGTGGAGGCCACGGATGTAGCGGGCAACACGGTAAAAGA
GACGATGAGTTTCACCATCGACACCACGCTGTCGGTACCGCTCATTGCGCTGGACAGCGCGGATGACAGCGGCGCCAAAG
GTGATGAACTGACCCGGGTGAACAGGCCGACGTTCTTACTGGACAACATTGATAACGATGCGCGTTATGTCACGGTGGAG
GTTCAGCATGGCAGCGTCAGGGAGGTACTGAAGGCAACGCAGAGCGCGAGCGGACGCTGGAGCTTCACACCGGTGGGTGA
CTGGGCGGACGGTCAGTACACGCTGACGGTAAAAGTGGAAGACGAGGCGGGGAACATTCGCCAGTCTGCGCCGCTGACGG
TAACGGTGGACACGCAGACGGCCATTGATGGTATCGAGCTGGTGAACGACCACGGAATTTCCGGCGATAACCTGACCAGC
GCCCTGCGCCCGGAGTTCCGGGTGACGACACCGGGGGATGTGAATGCGGTTCGTCTGAGTCTGGACGGCGATACGAACTG
GGTGAACGCGACGAAGAATGCCGCCGGGGTCTGGGAATACAGCTGGCCGGGCGACGTGGGCGAGGGTAAACACACGCTGA
CGGTGGAGGCGACGGATGCGGCGGGCAACACGGCGACGCGGACGCTGGAGTTTACCATTGACACCACCCTGTCGGAGCCG
GTCATCACGCTGGACAGCGCGGATGACAGCGGCAACAAGGGTGATAACGTCACCAGCGACAGATCGCCGGGCTTTACCAT
CGAAAATATCGATCCTGATGTGCGCCGGGTGACGGTACAGATCGCGCATGACGGCAGCAGCCGGGAGGTGGAGCTGACCC
AGACCGGAGGCCGGTGGCACTTTACGCCGGATAGCGCGTGGACGGACGGGAGCTACACGCTGACGGTGAAGGTGGAGGAC
AATGCGGGAAATATCCGTTATTCCACGCCGCTGGACGTGAAGGTGGACACGCATACGGCGATTGCTCGTATTGAGCTGGT
CAATGACAATGGCGTCCCGGATGACAACCTGACCAACGAGATGCGCCCGCAGTTCCGGGTGACGGTGCCGGAGGATGTGA
CCGTGGTACGCCTGAGTCTGGACGGCAGTGGCAGCTGGGTGAATGCGACGGCGGGAGCAACGAAAGGGGAATGGAACTAC
AGCTGGCCGTCAGATGTGGGCGAGGGTAAGCACACGCTGACGGTGGAAGTGACCGATGCGGCGGGCAACACGGCAACGAA
GACCCTGGACTTCAGCATTGACACGAAGCTGTCGGAGCCGGTCATCACGCTGAACAGCGCGGATGACACGGGCGTGCCGG
GAGACGGTCTGACCAGCCGCGCGCAGCCGTCGTTCACGCTGCAGGATATCGATGCCGATGTGGTGAGAGTGACAGTGAGC
GTGGAGCACGGAGGAAGGACCGAGACGTTTGACGTGTTACAGGGTGCGGGCGGATGGAGCTTCACACCGACGGCGGCATG
GGCGGATGGCAGTTACACGCTGAAGGTGACGGTGGAGGACGAGGCGGGCAATATCCGCCATTCAGCGCCGCTGGACGTGA
AGGTGGACACACAGACGGTGATTGACCGTATTGAGCTGGTGAATGACAGCGGCGAGCCGGCAGATAACCTGACCAACGAT
GTGCGACCGGAGTTCCGGGTGACGGTGCCGGAGGATGTGAACAGGGTGCGGGTGAGCCTGGACGGGGGTAAGACGTGGAT
GGATGCGACGAAGGCATCGGCAGGCGTCTGGAGTTATACCTGGTCGTCCGATGTGACCGAAGGCGCGCACGTGCTGACGG
TGGAGGCGACCGATATTGCGGGCAATACGGCGACGCGGACGCTGGACTTTACCATTGACACCACGCTGTCAACGCCAACC
ATTGAACTGGATGGCCCGGATGATACCGGCGTACAGAGTGATAACCTGACTAATCGCCCTCAGCCGACGTTTATCCTGAA
ACATGTCGACGCGGATGCCGCCTCAGTAGTGGTAAGTGTGAAACATGGTGGGACGACAACCACATTTGCAGCGACCAACG
GGGCAGGCGGATGGCGTTTTACACCGGCCAGTGACTGGGCGGATGGCGCTTATACGTTGAGTGTGACGGTGACAGATAAG
GCCGGAAACGTTAGCCATTCCGTGCCGCTGACGGTGAATGTAGATACGCACGTCACTATCGACAGCATCGTTTTGGTCAA
TGATAGCAGTGTTATTGGCGATAATCTGACTAATGAGGTACGCCCGCATTTTCGTGTGACGGTGCCGGGGGACGTTAATG
TTGTTCGTCTGAGCCTGAATGACGGTAAAACTTGGGTCAACGCAACCCAGAGCGCCGCCGGGGACTGGGAATATATCTGG
CCAGACGATGTAACCGAAGGAAAGCATACGCTGACGGTGGAAGCCACCGATATCGCAGGAAACAAAGCGACGCAGATGCT
TGAATTTACCATCGACACCACGCTATCGACACCGACTATCAGGCTGGATACTGTGGATGACAGCGGTGTGCCTGGCGACA
ATATCACCAACGAAAAAACGCCTGGTTTTACGATTAATGGCATCGACGCGGATGCAAGTCAGGTAATGGTGGTGGTTACA
CACAACGGTAAGAGTGAGGAGTTGACGCTGACACAGGTTAGCGGCCGGTGGCACTTTACACCAGACAGTGACTGGACGGA
TGGCAACTACACTCTGACGGTAAAAGTTGAGGATAAGGCAGGAAATATGAGCCAATCCTCGCCGCTGACGGTGACGGTGG
ATACTCAGACTGTTATTAACAGCATTGTACTGGTCAATGACACCGGTATCGTTGGTGACAACATGACTAACAATGTTCAT
CCGCATTTCCGGGTGACGGTGCCGGAAGATGTCAACGTTGTACGCCTGAGCATTGATGGCGGCACGACATGGGGTAACGC
TACTCAGAGTGCAGTAAAAGGGATCTGGAATTACAACTGGCCCACGGATGTGGGGGACGGTAAATATACCCTGATGGTGG
AAGCGATCGACGCTGCTGGCAATAAGGCGACGCAGACACTTGAATTTATTGTTGACGCCACCCTGTTGGACCCGACCATC
ACGCTGGATACCGCGAATGACAGTGGTGTGCCTGGCGACAATATCACCAACGAAAAAACGCCTGGTTTTACTATTAACGG
CATTGATGCGGATGCGATCAGGGTGGCTGTACAGGTTACGCATAATGGCACGAGCAAGGAGGTGGAACTGACCCAGAGCG
GGGGGCAGTGGCACTTTACGCCGACCAGTGACTGGGCGGATGGCAAGTACACCCTGACGGTGAAAGTCGAGGACAGAGCG
GGGAACATAAACCAGTCCGTGCCACTGGCAGTGACCATCGATACGCAGACGGAGATTAACAACATTGTACTGGTCAATGA
TACCGGCGTGCCGGATGACAACCTGACCAACGCTCTGCGTCCGGAGTTCCGGATAGAGGTGCCGGAAGATGTGAACGTTG
TACGTCTGAGCATTGACGGCGGCAAGACGTGGGTGGATGCGAATAAAACGTCGGCAGGTGTCTGGGATTACAACTGGACA
ACAGACATCACTGACGGCGTACACACGCTGACTGTGAAAGTCACCGACGTGGCGGGCAACACGGCGACGCGGACGCTGGA
CTTTACCGTTGACACCACCCTGTCGGTACCGACCATCACGCTGGATACCGCGAATGACAGTGGTGTGCCTGGCGACAATA
TCACCAACGAAAAAACGCCTGGTTTTACTATCAACGGCATTGATACGGATGCGAGCCGGGTGGTGGTGACGGTTACGCAT
AATGGCACGAACCAGGAGGTGGAACTGACCCAGAGCGGGGGACAGTGGACATTCATGCCGGCCAGCGACTGGGTGGATGG
CAACTACACCCTGACGGTGAAAGTCGAGGACAGAGCCGGGAACGTCAGCCAGTCCGCGCCACTGGCAGTGACCATCGACA
CGCAGACGGAGATTAACAACATTGTACTGGTCAATGATACCGGCGTGCCGGATGACAACCTGACCAACGCTCTGCGTCCG
GAGTTCCGGATAGAGGTGCCGGAAGATGTGAACGTTGTACGTCTGAGCATTGACGGCGGCAAGACGTGGGTGGATGCGAA
TAAAACGTCGGCAGGTGTCTGGGATTACAACTGGACAACAGACATCACTGACGGCGTACACACGCTGACTGTGAAAGTCA
CCGACGTGGCGGGCAACACGGCGACGCGGACGCTGGACTTTACCGTTGACACCACCCTGTTGGTCCCGACCATCACGCTG
GACAACGCGGATGACAGCGGAACCAAAGGCGATGATCTGACCAACGTTAATAAACCGACATTTTTACTGGGCAATATTGA
CTCAGATGCGCGCTTCGTCACGGTAGAAATCCAGCATGGCAGCATCAAGGAGGTATTGACGGCAACCCGAGGCACGGATG
GCCGCTGGCATTTCACGCCGGACAACGTCTGGGGTGATGGTCGCTATACACTGACAGTGAAAGTGGAAGATGAGGCGGGT
AATATTCGCTATTCTGCGCCACTGTCGGTCACAGTCGATACCGACATCACGATCAATAAGATCGAACTGGTTAATGACAG
TGGCGTCGTTGGCGATAATATGACCAATGACATCCACCCGCAGTTCCGTGTAACGGTGCCGGAAGATGTGAATTCGGTAC
GCCTGAGCATCGACGGTGGCACGACATGGGTTAAGGCAACGCAGGGCGCGGCAGGGACCTGGGGTTATACCTGGCCAGAT
GACGTGAAGGATGGGAAATACACCCTGCAGGTGGAGGCGACCGACAAGGCGGGCAACACCATCACGCAGATGCTGGAATT
TACTATCGATACTACCTTGTCGATACCGACTATTGAGTTAGATAGTAAGGATGATACCGGCACTCAGGGTGATGAGCTGA
CCCACCGTACCCAACCTAAGTTTATTCTACAACATATTGATGTAGATGCTGTCTCCGTGATGGTGAGCGTGGAACATGGA
GGGGTGACAAGCACATTTGACGCGATTAAGGGCGCAAGCGGATGGAGCTTTACGCCGACAGCGCCGTGGGGTGACGGCGC
CTATACGCTGACGGTGATGGTGGAGGATAAAGCCGGGAACGTCAGCCATTCCGCCCCGCTGACGGTGACGGTGGACACGC
AGACAGCCATTAACAGTATTGAGCTGGTTAACGACACCGGTATTCCGGGCGACAGCCTGACCAATGCGGTGCGTCCGCAC
TTCCGGGTGGCGGTGCCGGATGATGTGAAGACGGTACGCCTGAGTATTGACGGCGGCAAGACGTGGGGGGATGCGAAGAA
AACCTCCGCAGGCGTCTGGGACTACAGTTGGCTGACAGATGTGACTGAAGGGGCGCACACGCTGACGGTGGAGGCCACGG
ATGTAGCGGGCAACACGGTAAAAGAGACGATGAGTTTCACCATCGACACCACGCTGTCGGTACCGCTCATTGCGCTGGAC
AGCGCGGATGACAGCGGCGCCAAAGGTGATGAACTGACCCGGGTGAACAGGCCGACGTTCTTACTGGACAACATTGATAA
CGATGCGCGTTATGTCACGGTGGAGGTTCAGCATGGCAGCGTCAGGGAGGTACTGAAGGCAACGCAGAGCGCGAGCGGAC
GCTGGAGCTTCACACCGGTGGGTGACTGGGCGGACGGTCAGTACACGCTGACGGTAAAAGTGGAAGACGAGGCGGGGAAC
ATTCGCCAGTCTGCGCCGCTGACGGTAACGGTGGACACGCAGACGGCCATTGATGGTATCGAGCTGGTGAACGACCACGG
AATTTCCGGCGATAACCTGACCAGCGCCCTGCGCCCGGAGTTCCGGGTGACGACACCGGGGGATGTGAATGCGGTTCGTC
TGAGTCTGGACGGCGATACGAACTGGGTGAACGCGACGAAGAATGCCGCCGGGGTCTGGGAATACAGCTGGCCGGGCGAC
GTGGGCGAGGGTAAACACACGCTGACGGTGGAGGCGACGGATGCGGCGGGCAACACGGCGACGCGGACGCTGGATTTTAC
CGTTGACACCACCCTGTCGGAGCCGGTCATCACGCTGGACAGCGCGGATGACAGCGGCAACAGGGGTGATAACGTCACCA
GCGTCAGGTCGCCGGGCTTTACCATCGAAAATATCGATCCTGATGCGAACCGGGTGACGGTACAGATCGCGCATGACGGC
AGCAGCCGGGAGGTGGAGCTGACCCAGACCGGTGGCCGGTGGCACTTTACGCCGGACAGTGAGTGGACGGACGGGAGCTA
CACGCTGACGGTGAAAGTGGAGGACAATGCGGGAAATATCCGTTATTCCACGCCGCTGGACGTGAAGGTGGACACGCATA
CGGCGATTGCTCGTATTGAGCTGGTAAATGACAACGGTGTACCGGATGACAACCTGACCAACGAGATGCGCCCGCAGTTC
CGGGTGACGGTGCCGGAGGATGTGACCGTGGTACGCCTGAGTCTGGACGGCAGTGGCAGCTGGGTGAATGCGACGGCGGG
AGCAACGAAAGGGGAATGGAACTACAGCTGGCCGTCAGATGTGGGCGAGGGTAAGCACACGCTGACGGTGGAAGTGACCG
ATGCGGCGGGCAACACGGCGACGAAGACCCTGGACTTCAGCATTGACACGAAGCTGTCGGAGCCGGTCATCACGCTGAAC
AGCGCGGATGACACGGGCGTGCCGGGAGACGGTCTGACCAGCCGCGCGCAGCCGTCGTTCACGCTGCAGGATATCGATGC
CGATGTGGTGAGAGTGACAGTGAGCGTGGAGCACGGAGGAAGGACCGAGACGTTTGACGTGTTACAGGGTGCGGGCGGAT
GGAGCTTCACACCGACGGCGGCATGGGCGGATGGCAGTTACACGCTGAAGGTGACGGTGGAGGACGAGGCGGGCAATATC
CGCCATTCAGCGCCGCTGGACGTGAAGGTGGACACACAGACGGTGATTGACCGTATTGAGCTGGTGAATGACAGCGGCGA
GCCGGCAGATAACCTGACCAACGATGTGCGACCGGAGTTCCGGGTGACGGTGCCGGAGGATGTGAACAGGGTGCGGGTGA
GCCTGGACGGGGGTAAGACGTGGATGGATGCGACGAAGGCATCGGCAGGCGTCTGGAGTTATACCTGGTCGTCCGATGTG
ACCGAAGGCGCGCACGTGCTGACGGTGGAGGCGACCGATATTGCGGGCAATACGGCGACGCGGACGCTGGATTTCACCAT
TGACACCACGCTGTCAACGCCAACCATTGAATTAGCGCCAGATCAGGATACCGGGCAAAGTAAGAATGATAATCTGACCA
GTTTAACTCAGCCGGTTTTTGTTTTGGGCCATATCGATAATGATGTCCAAAGAGTTGAATTACAGATTGAGCATAACGGT
ACATTTAAAAACATTATTTTAACCGAATCGGCTGATGGATGGCGTTATCGACCTGACGCGGCATTAAACGATGGTAGTTA
TAAATTGACCGTGACGGTAACTGATACGGCGGGTAACAAAACGACATCCGCTCCTTTAACGGTAACGATAGATAGTACGT
TGAGTACCCCGGTAATTGCGTTGGCTAATGGCGAAGACAGCGGCGTGGTTGGCGATCAGCTTACTAACCACGATCATCCG
GTATTTGACTTGAGTCATATTGATTCTGATGCCTTGCACGTTATGGTCAGGGTTACTCATAACGGTAGCTCTCATGAGGA
AGCGGCGGTATTTAACAATGGTAAATGGCGTTTCAGTCCTTCTGTGAGTTGGGCGGATGGCTTATATCAATTAGCTGTTG
TTGTAGAAGATCGGGCGGGGAATGTAAAAGAATCTGCGCCATTAGATGTCCGTATTGATACTACGACCACTATCAACAAT
ATCGTGTTGCTTAATGACACTGGCGTTCTCGGTGATCAATTAACGAATAACGCTAAACCATCATTCAGAGTTGAGGTTCC
TGCGGATGTTGCCCAGATGCGCGCTACTCTTGATGGCGGCACAACCTGGATTCCGATACGGCGAAATGCGGATGGACAGT
GGATTTTTGCAAGCACAAATAATCTGACTGATGGGCAACATACGCTTCGTATCGAGGCTACAGATACAGCAGGTAACGTT
GCGAGCAAAGATTTAGTCTTTAATATCGATACTCACTTACAGATTCCGACAATTGCTTTGGGGGCCGGACAGGATACTGG
AGCGAATACTTCCGACCATATTACGAATATTTCACGGCCCACTTTTGTTATTGGCAATGTTGATGCCGATGTTATTAAGG
TAATGGTAACTATTGGTACCAATACTTATAACGCTACTAAAGTGGGGGGGGCATGGGAGTTCAGACCGGATAATGCGATT
CCTGATGGTTCTTATAATGTGAGCGTTACTATTGAGGATAAAGCAGGGAATATAGCGACATCTCAACCGTTATCTATAAT
GGTAGATACGAGAGCCGAAATTAATAGCGTAACGCTATTAACAGATAGCGGTGATAGCTCTTCAGATAATATAACCAACG
TAAACAAGCCGCAGTTTGAAATTGTGGCTGCTAATGATACTGTACAGGTACGCGTTAAAATCGATAATACGGGTAATTGG
ATTGATTTAACGCAGAGTGTTGAAGGACACTGGGAATTTAATGTAGGAACTGCATTACCTGACGGTCAACATTCACTATT
AGTGGAAGTTGTCGATGTTGCCGGTAACGTTGCACAACAAACGCTTAATTTTACGGTTGATACCACGCTGCGTGAGCCAA
ATATTGTGCTTGACCCTACGCAGGATACTGGCGATGACAGTAATGACAATATTACTAATATTAATAAGCCGACATTTATT
ATTGGCAATGTGGATAATGATGTGTCACATATCGTTATTCATCTTGATGGTCGGGATTATATCATCGAAAATAATGGTGC
TAAATTAACATTTACACCAGATAAGCCGCTGACAGATGGTCATCATACGCTTACTGTTACAGTGACAGATATTGCGGGTA
ATACAAAAACATCATCTGAACTGCAGGTTGAAATAGATACCCAGGTACAAATTGACAGGGTTTCATTAACAACCGATAGT
GGTGTTAATGATAGCGATAGAATCACTAATGTTGCTCGTCCATCGTTTAATATTGTAACACCTGATGATGTGACCAAAGT
ATTGGTTTCTTTCGACGGTGTTATCTGGAGCCCGGCAAGTAAGAATGCAGCCGGACAGTGGGACTTTACGGCGGGTAGCG
CTCTATTAGAAGGTCATTATGTACTCCATGTGCAGGCAACGGATCGGGCAGGAAATACGGCTAATTCCAGTCTTGCATTT
ACGGTGGATACACATGTTGATGGCCTTAACATTACCATGCTGGATGATACAGGGAATGACGCGGCAGACCGTATAACCAA
TATTACATCGCCGCGTTTTGAAATCTCAGCCAGAGAATCGCTACAGGTTGTAACGGTGACGTTAAATGGGAACGTCACCA
CTCTCAACAAAGGGATGGGTAATAAGTGGATATACACTCCCGAAATACCATTACTTGATGGACATTATAAACTAGAGGTC
ACTGCTGAAGATATTGCTGGCAATACTATTAACCAGGAGATATCGTTCACTATAGATACGACTGTACCTGTGCCTGATGT
TGATTTGTTGGATGCCGATGACTCCGGTGAAAGCGCTGTAGATAATATTACCAATGTCACTAAACCACGTTTCATTATTA
GTGATATTCCTACCGATATTGACACTGTTACGATAAAAATTAACGGTGTCTCTTATCCTATTACTCTGGATGGCAGTAAC
ACCGGGACATTCCAGGTTCCTGTGGCGCTAAAAGATGGTGTCTACGAAGCGGTTGTCGTCTTCAGAGATCTTGCAGGTAA
TATATCCGAGACGAAACTACCATTTACCATTGATACGGCAACAAGTGTTAGTGTTCGAATGGATCCCACATCAGATACGG
GAAGTTCTAATAGTGATAATCTCACTAACAGAAAAAGTCCTAAATTCGGCGGTACTGCGGAACCGGATGCAAAACTTGTT
ATTACCATTATCGATGATACATCAGGTCATGAGGTGTTGAAAAAACTGGTCACGGTTGGTGTTGATGGTAACTGGAGTAT
GACGCCAGATGCCCTGGCAGATGGTATCTACACAATTAAAGTTGTCTCAACAGACGTTGCAGGAAATACAGCGGAGGCGC
AAGATAGATTTACTATCGATACGGTAACGCCCGATCCAACAATTCAGCTTACGGATTCATCAATTGATGATATGCATGAA
GCTACCAGCCTGCGACCTGAGTTCAAGGGGATCGCTGAAGCATTCTCAACGATTATGATCCAGTGGGATGGCAAAGTTAT
CGGCTCAGCCAATGCGAATTCGAATGGCGAATGGAGTTGGACTCCCCCATCAATATTAACACCAGGTTCTTATGTCATTA
GTATCGTTGCCAAAGATAAAGCGGGTAATGAATCGTCACAAGTTGACTTTCCAGTCGTAATACCTGTTATTGATGTAACC
CCTCCTACGATTAAGCTAAGTGATGATAGTGATAGCGGGGCATTGGGGGACTTTATTACTAACGATAAAACGCCGACTCT
TATTGGGAGCACATTACCCAATACTATTGTCAGCATTTATATCGACGGTAAGAAAGTTGGCGAGGCAACATCGGATACCG
CAGGTCGATATGCCTTCCAGATGCAGGAACAGCCTGACGGGACGTACGTTGTGGAAGTTGGTATATTAAATCCACGCGTC
AATGAAGAAATTCGCTCAGCAGCCGTTAGCCTCGTTATTGATACTCAGGTCGCTGACCTTGAATGGCATATATCTGGGAT
ACATGAAGACAAATATATTAATACTGTAACGCCGGAGATTAGTGGCATAAGCGAACCAAACAGTAAAATTACGGTTTTTG
TTAATGGGGTTGAAAAGGCTGCTGCTTATACTACTGCAGGCGGGCATTGGGGCGTTATATTACCTACTTTAGGGAATGAT
GGTAATTACGTATTAACGTTCAAAGTTGAAGACATTGCAGGAAATGTTAAAGAATTTGGTCCTCAGGAAATAACATTGGA
TACGGTAATTGAACCGTTAACAGTGACACTGCGAGAAGTTGATGATTCGGGTAAACTGGGAGACTGGATCACCAATAAAT
CACATGTAAATATAGATGGTACTGCGGAGGCAGGAAGTACCTTAACTATTAAAACTCAGGGAGGAGTCGTTGTTACTACT
TTTGAAGTAGGAAGTGATGGACATTGGAGTGCAGAGTTAGATCTGAGTAACGGTAATAATATCTTTGTTGTTGAGTCAGT
AGATAAAGCGGGCAATAGTCAACAAAAAGAACTTTTAGTAGAATATGACACGCAGATCGAAATCAGTGCTATTTCTTTAA
GCCGAGATAGTAATAGTGGTGATAAATATGATCTCATTACCAACGATAAATCGCCAGAGCTAGTCGCAATGACCGAACCT
GGAGCAACAGTACAGGTTTATATTAATGATGTATTGCAAGCTACGGTAGAAGCTAATTCTGCAGGTAATGTTAGTTATAC
CATGCCAGCGAATAGCGCCGATGGTAACTATCATGTGCAATTTGTTGCTACCGATATAGCCGGCAACCGAACTGAATCTG
CTGTTGCGACAGTGACGATCGATTCTGAAATTGCTGTGTTTACTATTGATGAAGGTTCATTACCGACTATATCAAATAGT
CGGGCATTATCAGTCGCTGGGCAAGGTGAGGCAGGCGCTCAGGTAAGCATCTTTGTCGATAATAAGCTGGTCAATGTGGT
CATGGTTGAGGCTGATGGTTCCTGGCGTGCTCCGATATTGCTGCAAGATGATGGTACGTTTAAGATTCATTTCAGCATTA
CTGACATTGCTGGAAACACCCAGGCGAGCAAAAATTTCAGTGTCGATGTCGATTCATCAACCGAATTTCCAACAATAACC
CTTGAAGATTCGAGTAACTCAGGTCTGGTTGACGATCTGATTACTAATCATAATACGCCATCCTTTGTTGGTACTGCGGA
AGCGGGTGCTACAATCCATTTTTATGTTGATGAAAAAATTGTGGCAAATATCCTCGTTCAAGATGATGGAAGATGGTCAT
ATCAATTTGATAATTCTCTGAAAGATGGTGAATACTCCATTCGTGTTGTTGCGGAAGATACCGCTGGTAACAGGGCGGAA
TCACCTCGCTTAATCGTTACGATAGATACCAGTACATACATTGAACCTCCTACGCTGACAGCGGGATCTGATAATGGTAT
GTATATTAACGACGGCGTAACAAGTCAAACCAGACCTCAGTTTAGTATCAACGGTGAGTTTAACCAGAGTGTCCAAATTT
ACATTGATGGCAAGCTAGTCGATACGGTCACTGTGACAGACAGAAACCAGGTTTATCAACCTGTGGCTCCATTGGGTGAC
GGTTCTCATAATATTTATTATGTCATTACCGATAAGGCAGGTAACACTGCAACATCTAAAACACTAGATTTTTCAATAGA
TACATCGAATAAAACCCCTGTGGTGATAGAGTCCATTGATGGTCATACACTAGCGGAGATGACCGGCAGCGATGGTAAAA
TATATATAACAGATACTACTCATAATATAATTTTTCGCGGAAGTGCGGAGCCTGATAGTTTAATGGATTTAACTATCAAT
GGGCTAAACGTAGGCCAAGTTTTGGTTAGTAAGACAGGAGAATGGCAGATGCCAGTCAACCCTGTTTATCTCTCTCAAGG
TCTTCTGGAGATAAAAATAAAATCTACGGACCGTGGAGGTAATGTAAACGAGAAAAGTTTCTCTATCTGGGTGGACACGA
TGATTGAGGACTTTACCAGTGAACTTGATGACAATAAATCATCGTCGCAAAATGACTGGTGGAGTAATAATACCCTTATC
ACTATGAGAGGTCTGGGGGAGGCTGGCGCGACGGTATCACTAGTGCTGGCAGGTGTCACATTGGCAACGACAGTCGTTGC
GGCTAATGGTCAATGGGCATTATTGACCGATCAGCTTCCGGAAGGAAAATACGATATCACTTTGAGTATTGAGGACAACG
CCGGAAACAGGAAGGAAGAGATCCGTGAAATATTCATCGATCGCGCTGCACCGGTAGCACCTGCTATAACATATTCGGAC
ATTGTCGATGATCTCGTCATTATGAAAGGGACGGGCGAAGCAAAATCAAAATTAACGATAACTGATAGCGAGGGTAATAT
ATATACATTAACCGTTCCTGATAACGGGAACTGGAGTATGGCTATTCCCTATCCATCAGAAGGGAAATTTACTATATCGA
GTACAGATCGAATTGGTAACACCAGTGATGTTGTCTCTGTCGATTTAATAAGAGAGATACCGACTATTTCGTTAGCGGTA
GATTCGAATAGTGGTTCTAAAAATGACAATATTACGCAAGATAAACAACCTACCTTTATTATCGGAAATTTAGAAAGCGA
TATCGTTAACGTTCAAATAGATATTAACGGGATAGCATATAATGCTGAAAAAAGAGCGGATGGCGTCTGGTTCTTTACGC
CAGATATAGCTTTAGCTGATGGTACCTATACGATATCGGTAACTGCGAATGACGCGGCGGGTAATCAGAAAAACTCGTTA
CCGATTACTATCACGATCGACAGTACGCTGAAGGTGCCGGAGATTGCGCTGGCGGCAGGTGAGGATACCGGCGCGCCAGA
CAGCGATAACGTGACGAATCACACCCAGCCGAAGTTTACCCTGCAGCATATTGACGCGGATGTGACCGGAGTGACCGTCA
GCGTGGCGCATAACGGAACCACCGACACCTATCCGGTCACGAAGGGGGATGATGGCTGGAGCTTCAGTCCGTCAGCAGCC
TGGAGTGATGGTAACTACACGCTGAGTGTGACGGTGGTGGACGGTGCGGGGAACACGCAGCAGTCATCATCGCTGACGGT
GACGGTTGATTCTACTATAACAGCGACAGCGCCTGTTGAGGCAGGCGATGTTAGTGAGTTCGCCATGGCAACCGATGTAG
CTCAACCGGAATCTGAAATGGTCAGCATTGAAAGTGAAAAAAATCATAGCCCAGCTATGTTTTCAATGATGTCTGCGGTT
GGAGAAGTGGCTGCGCAGGAGGATGCCTATAACATCGTATTATTAAATACCGAGTCTGGTGATGTAACTGAACGTTCTAT
TAGTCAGACACCATCTTTTGCAATATCAGTACCTGATAATATTGTGAATGTTAGTGTTATGTTCGAAGGAGAAGAGATTG
ATTTGCCGATTAATAATCAGAAGGCAATATTTGAGGTGCCAGTACCTTTGAATGATGGTGAGTATACTATAGATGTGAAA
TTCATCGATAAAGATGCTGATTATCTGATTAAGGAAAAAACATTCTCAGTTGATCATTCTTCGGCAGATATAGTTAATTC
CATGGGTGAAAGAGGCAACACCGAGGATGAAGTTAACGTCTCAGCCCCAGAAAGTGCTGTAACACACCATAATAATGGTG
CTGTTGAGATATTCACTATTAGTGAAGTAAGTCTCCCTGTAGATAATCAAGAAGAACACGCATAA

Protein sequence :
MKNMNIKKVFADQNSVIDLSSLGDAKGAKVSLAGPDMNITTSHGSVIIVNGALYSSIKGNNLIIKFKDKSIPGSKVIGSV
DLKDIQLERIDSSLVDAGLVEKKGNGKNRNARKDEELQKQLDDAEGAKKEADKAKEEAEKAKEAAEKAISEAFEIQNSSK
QIEEMLQNFLSDNVAKDNLAQQDNAIQQNTLSKAAQNIKQDEAEKIIPQPLNKNTGSGRSNSSKNEENQFEAEPVKEKLK
ISFKLAAESNSGSKDDSITNFTKPQFIGSTSPNATVVIKINGISVGQVVADKLGNFTFTAPEKLADGTYNLEAEATTGNA
MGSTKLAITIDSVIDKPSFELSPESSIPGHQGLTATLTPSIIGTAEENAKVNIYVNDKLITSVDVDKNGKWSYGFKGKEL
IEGDNNIKVVAVDKAGNQSEISNIITIDTIPPEKPTIELDINSDSGVKDDNITNSTLPTFIGVAEPGATVSIYIGIKHLG
DVVAAKDGSWSYTLTEPLKDGEYHLTATATDIAGHTSETSELTFTIDTRISYFSAELDPADDSGIVGDNVTNNSRPTFIG
KSEPNTTINVKNSETGELVVLKANAEGEWQFAFTSDSAEGVNNLVFTVEDVAGNQKDFYFSYVIDTVAPTAPTVSLDDFV
TLPNGIILSGDDTPALVGTAEPKSTISILREGKFYASIDVDSNGSWSYQFNEKLPQGVYDIEIVSQDIAGNKSSAIKYSF
TIQTEVVIPKAELDAVDDSGEKGDWITNKHNALTLLGTAGKFATVNIIIDGKAIGVTTADEHGNWTFDISRNLSDDVYTV
TVEAVDPLGNTASADYQLTIDSFTPIPTVMLHDSADSGVKGDLITRVNTPLFTGSAEPNAKVSIYVDGILSGEAIAGDDG
VWNFQFSNILPDGMHEVMVKAEDIAGNKASSSIYNFQILTHTQKPTIELVDDTGLDNTDHIINEKRPALTGTAAPYSIVK
LYIDNALVTEVRTNKDGVWDYTLKPDQSLADGDHKITATVEDIAGNIAHSDAFLLSVDTTISIPVVSLSPDSESGVLDDN
LTNIPKPTLILRNIDSDVRNVQVWDAISNTQIGIATQQSNGTWTYTFTSDLIDGLHQVYVKAEDIAGNKVTGPTFDFTID
TTLSIPVISLIAKDDTGVADDNITNINKPDFIISGIDSDAHRVVVQVTHNGVNEQIVLTQDGGNWVFTPASTWDDGSYTL
QVTVEDEAGNIRQSTPLTVKVDTQIAINSIELINDTGIADDNITNDMRPHFRVEVPNDVNMVRLSIDGGKTWGSATKNTA
GIWDYSWPTNVTEGSHILTVEATDIAGNKLTQTLDFTIDTLLTVPTIALDSADDSGVTGDNITNSKTPGFTLGNIDGDVI
RVALQITHNGKNEVVALTQSGGNWVFTPDHDWADGSYTLQVTVEDEAGNIRQSTPLTVKVDTQIAIDNIELINDTGMVGD
NLTNDIHPQFRVTVPDDVDRVRLSIDGGKTWVNATPGLVKGSWDYTWLGKVPEGKHTLIVEATDIAGNTATRTLDFTVDT
TLSVPTIMLDTANDSGVTDDNITNERAPGFTLGNIDADASQVVVQVVHNGKSEEVELTQTSGKWVFTPTSEWVDGNYTLT
VKVTDEAGNTRQSVPLSVKVDTQITIDGILLVNDSGITGDNITNEVHPHFRVTVPEDVNVVRLSINSGTTWINATQSSTG
IWDYTWPDALPEGKHTLVVEAIDIAGNTVTRTLDFTVDTTLLDPTITLDTANDSGVPGDNITNEKTPGFTINGIDADAIR
VAVQVTHNGTSKEVELTQSGGQWHFTPTSDWADGKYTLTVKVEDRAGNINQSVPLAVTIDTQTEINNIVLVNDTGVPDDN
LTNDVRPEFRIEVPEDVNVVRLSIDGGKTWVDANKTSAGVWDYNWTTDLTEGVHMLTVEATDIAGNTATRTLDFTVDTTL
SVPTITLDTANDSGVPGDNITNEKTPGFTINGIDADAIRVAVQVTHNGTSKEVELTQSGGQWHFTPTSDWADGKYTLTVK
VEDRAGNINQSVPLAVTIDTQTEINSIVLVNDTGVPDDNLTNDVRPEFRVTVPEDVNAVRLSIDGGTTWVNATKTSAGIW
NYSWTTDLTEGAHMLTVEATDAAGNTATRTLDFTIDTTLSMPTITLDNADDTGVQGDDLTNRPQPNFILQHIDADVASVV
VSVTHDGTTSVFDASQEAGGWRFTPDSDWADGSYTLSVMVTDKAGNVSQSTPLTVTVDTHISIDKVELVNDSSVVGDNMT
NDSHPQFRVTVPEDVNAVRLSIDGGTTWVNATKGAAGIWDYTWPDEVKDGKYTLQVEATDKAGNTTTQMLAFTIDTTLTK
PTIALDHKDDSGITDDNITNAKKPGFTLDNIDADAIRVVVQVTHDGKSKEVALTKSEGQWSFTPTVPWNDGAYTLTVMVE
DKAGNVSHSAPLTVTVDTQTAINSIELVNDTGIPGDSLTNAVRPHFRVAVPDDVKTVRLSIDGGKTWGDAKKTSAGVWDY
SWLTDVTEGAHTLTVEATDVAGNTVKETMSFTIDTTLSVPLIALDSADDSGAKGDELTRVNRPTFLLDNIDNDARYVTVE
VQHGSVREVLKATQSASGRWSFTPVGDWADGQYTLTVKVEDEAGNIRQSAPLTVTVDTQTAIDGIELVNDHGISGDNLTS
ALRPEFRVTTPGDVNAVRLSLDGDTNWVNATKNAAGVWEYSWPGDVGEGKHTLTVEATDAAGNTATRTLEFTIDTTLSEP
VITLDSADDSGNKGDNVTSDRSPGFTIENIDPDVRRVTVQIAHDGSSREVELTQTGGRWHFTPDSAWTDGSYTLTVKVED
NAGNIRYSTPLDVKVDTHTAIARIELVNDNGVPDDNLTNEMRPQFRVTVPEDVTVVRLSLDGSGSWVNATAGATKGEWNY
SWPSDVGEGKHTLTVEVTDAAGNTATKTLDFSIDTKLSEPVITLNSADDTGVPGDGLTSRAQPSFTLQDIDADVVRVTVS
VEHGGRTETFDVLQGAGGWSFTPTAAWADGSYTLKVTVEDEAGNIRHSAPLDVKVDTQTVIDRIELVNDSGEPADNLTND
VRPEFRVTVPEDVNRVRVSLDGGKTWMDATKASAGVWSYTWSSDVTEGAHVLTVEATDIAGNTATRTLDFTIDTTLSTPT
IELDGPDDTGVQSDNLTNRPQPTFILKHVDADAASVVVSVKHGGTTTTFAATNGAGGWRFTPASDWADGAYTLSVTVTDK
AGNVSHSVPLTVNVDTHVTIDSIVLVNDSSVIGDNLTNEVRPHFRVTVPGDVNVVRLSLNDGKTWVNATQSAAGDWEYIW
PDDVTEGKHTLTVEATDIAGNKATQMLEFTIDTTLSTPTIRLDTVDDSGVPGDNITNEKTPGFTINGIDADASQVMVVVT
HNGKSEELTLTQVSGRWHFTPDSDWTDGNYTLTVKVEDKAGNMSQSSPLTVTVDTQTVINSIVLVNDTGIVGDNMTNNVH
PHFRVTVPEDVNVVRLSIDGGTTWGNATQSAVKGIWNYNWPTDVGDGKYTLMVEAIDAAGNKATQTLEFIVDATLLDPTI
TLDTANDSGVPGDNITNEKTPGFTINGIDADAIRVAVQVTHNGTSKEVELTQSGGQWHFTPTSDWADGKYTLTVKVEDRA
GNINQSVPLAVTIDTQTEINNIVLVNDTGVPDDNLTNALRPEFRIEVPEDVNVVRLSIDGGKTWVDANKTSAGVWDYNWT
TDITDGVHTLTVKVTDVAGNTATRTLDFTVDTTLSVPTITLDTANDSGVPGDNITNEKTPGFTINGIDTDASRVVVTVTH
NGTNQEVELTQSGGQWTFMPASDWVDGNYTLTVKVEDRAGNVSQSAPLAVTIDTQTEINNIVLVNDTGVPDDNLTNALRP
EFRIEVPEDVNVVRLSIDGGKTWVDANKTSAGVWDYNWTTDITDGVHTLTVKVTDVAGNTATRTLDFTVDTTLLVPTITL
DNADDSGTKGDDLTNVNKPTFLLGNIDSDARFVTVEIQHGSIKEVLTATRGTDGRWHFTPDNVWGDGRYTLTVKVEDEAG
NIRYSAPLSVTVDTDITINKIELVNDSGVVGDNMTNDIHPQFRVTVPEDVNSVRLSIDGGTTWVKATQGAAGTWGYTWPD
DVKDGKYTLQVEATDKAGNTITQMLEFTIDTTLSIPTIELDSKDDTGTQGDELTHRTQPKFILQHIDVDAVSVMVSVEHG
GVTSTFDAIKGASGWSFTPTAPWGDGAYTLTVMVEDKAGNVSHSAPLTVTVDTQTAINSIELVNDTGIPGDSLTNAVRPH
FRVAVPDDVKTVRLSIDGGKTWGDAKKTSAGVWDYSWLTDVTEGAHTLTVEATDVAGNTVKETMSFTIDTTLSVPLIALD
SADDSGAKGDELTRVNRPTFLLDNIDNDARYVTVEVQHGSVREVLKATQSASGRWSFTPVGDWADGQYTLTVKVEDEAGN
IRQSAPLTVTVDTQTAIDGIELVNDHGISGDNLTSALRPEFRVTTPGDVNAVRLSLDGDTNWVNATKNAAGVWEYSWPGD
VGEGKHTLTVEATDAAGNTATRTLDFTVDTTLSEPVITLDSADDSGNRGDNVTSVRSPGFTIENIDPDANRVTVQIAHDG
SSREVELTQTGGRWHFTPDSEWTDGSYTLTVKVEDNAGNIRYSTPLDVKVDTHTAIARIELVNDNGVPDDNLTNEMRPQF
RVTVPEDVTVVRLSLDGSGSWVNATAGATKGEWNYSWPSDVGEGKHTLTVEVTDAAGNTATKTLDFSIDTKLSEPVITLN
SADDTGVPGDGLTSRAQPSFTLQDIDADVVRVTVSVEHGGRTETFDVLQGAGGWSFTPTAAWADGSYTLKVTVEDEAGNI
RHSAPLDVKVDTQTVIDRIELVNDSGEPADNLTNDVRPEFRVTVPEDVNRVRVSLDGGKTWMDATKASAGVWSYTWSSDV
TEGAHVLTVEATDIAGNTATRTLDFTIDTTLSTPTIELAPDQDTGQSKNDNLTSLTQPVFVLGHIDNDVQRVELQIEHNG
TFKNIILTESADGWRYRPDAALNDGSYKLTVTVTDTAGNKTTSAPLTVTIDSTLSTPVIALANGEDSGVVGDQLTNHDHP
VFDLSHIDSDALHVMVRVTHNGSSHEEAAVFNNGKWRFSPSVSWADGLYQLAVVVEDRAGNVKESAPLDVRIDTTTTINN
IVLLNDTGVLGDQLTNNAKPSFRVEVPADVAQMRATLDGGTTWIPIRRNADGQWIFASTNNLTDGQHTLRIEATDTAGNV
ASKDLVFNIDTHLQIPTIALGAGQDTGANTSDHITNISRPTFVIGNVDADVIKVMVTIGTNTYNATKVGGAWEFRPDNAI
PDGSYNVSVTIEDKAGNIATSQPLSIMVDTRAEINSVTLLTDSGDSSSDNITNVNKPQFEIVAANDTVQVRVKIDNTGNW
IDLTQSVEGHWEFNVGTALPDGQHSLLVEVVDVAGNVAQQTLNFTVDTTLREPNIVLDPTQDTGDDSNDNITNINKPTFI
IGNVDNDVSHIVIHLDGRDYIIENNGAKLTFTPDKPLTDGHHTLTVTVTDIAGNTKTSSELQVEIDTQVQIDRVSLTTDS
GVNDSDRITNVARPSFNIVTPDDVTKVLVSFDGVIWSPASKNAAGQWDFTAGSALLEGHYVLHVQATDRAGNTANSSLAF
TVDTHVDGLNITMLDDTGNDAADRITNITSPRFEISARESLQVVTVTLNGNVTTLNKGMGNKWIYTPEIPLLDGHYKLEV
TAEDIAGNTINQEISFTIDTTVPVPDVDLLDADDSGESAVDNITNVTKPRFIISDIPTDIDTVTIKINGVSYPITLDGSN
TGTFQVPVALKDGVYEAVVVFRDLAGNISETKLPFTIDTATSVSVRMDPTSDTGSSNSDNLTNRKSPKFGGTAEPDAKLV
ITIIDDTSGHEVLKKLVTVGVDGNWSMTPDALADGIYTIKVVSTDVAGNTAEAQDRFTIDTVTPDPTIQLTDSSIDDMHE
ATSLRPEFKGIAEAFSTIMIQWDGKVIGSANANSNGEWSWTPPSILTPGSYVISIVAKDKAGNESSQVDFPVVIPVIDVT
PPTIKLSDDSDSGALGDFITNDKTPTLIGSTLPNTIVSIYIDGKKVGEATSDTAGRYAFQMQEQPDGTYVVEVGILNPRV
NEEIRSAAVSLVIDTQVADLEWHISGIHEDKYINTVTPEISGISEPNSKITVFVNGVEKAAAYTTAGGHWGVILPTLGND
GNYVLTFKVEDIAGNVKEFGPQEITLDTVIEPLTVTLREVDDSGKLGDWITNKSHVNIDGTAEAGSTLTIKTQGGVVVTT
FEVGSDGHWSAELDLSNGNNIFVVESVDKAGNSQQKELLVEYDTQIEISAISLSRDSNSGDKYDLITNDKSPELVAMTEP
GATVQVYINDVLQATVEANSAGNVSYTMPANSADGNYHVQFVATDIAGNRTESAVATVTIDSEIAVFTIDEGSLPTISNS
RALSVAGQGEAGAQVSIFVDNKLVNVVMVEADGSWRAPILLQDDGTFKIHFSITDIAGNTQASKNFSVDVDSSTEFPTIT
LEDSSNSGLVDDLITNHNTPSFVGTAEAGATIHFYVDEKIVANILVQDDGRWSYQFDNSLKDGEYSIRVVAEDTAGNRAE
SPRLIVTIDTSTYIEPPTLTAGSDNGMYINDGVTSQTRPQFSINGEFNQSVQIYIDGKLVDTVTVTDRNQVYQPVAPLGD
GSHNIYYVITDKAGNTATSKTLDFSIDTSNKTPVVIESIDGHTLAEMTGSDGKIYITDTTHNIIFRGSAEPDSLMDLTIN
GLNVGQVLVSKTGEWQMPVNPVYLSQGLLEIKIKSTDRGGNVNEKSFSIWVDTMIEDFTSELDDNKSSSQNDWWSNNTLI
TMRGLGEAGATVSLVLAGVTLATTVVAANGQWALLTDQLPEGKYDITLSIEDNAGNRKEEIREIFIDRAAPVAPAITYSD
IVDDLVIMKGTGEAKSKLTITDSEGNIYTLTVPDNGNWSMAIPYPSEGKFTISSTDRIGNTSDVVSVDLIREIPTISLAV
DSNSGSKNDNITQDKQPTFIIGNLESDIVNVQIDINGIAYNAEKRADGVWFFTPDIALADGTYTISVTANDAAGNQKNSL
PITITIDSTLKVPEIALAAGEDTGAPDSDNVTNHTQPKFTLQHIDADVTGVTVSVAHNGTTDTYPVTKGDDGWSFSPSAA
WSDGNYTLSVTVVDGAGNTQQSSSLTVTVDSTITATAPVEAGDVSEFAMATDVAQPESEMVSIESEKNHSPAMFSMMSAV
GEVAAQEDAYNIVLLNTESGDVTERSISQTPSFAISVPDNIVNVSVMFEGEEIDLPINNQKAIFEVPVPLNDGEYTIDVK
FIDKDADYLIKEKTFSVDHSSADIVNSMGERGNTEDEVNVSAPESAVTHHNNGAVEIFTISEVSLPVDNQEEHA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
SC4140 YP_219127.1 inner membrane protein Not tested SPI-4 Protein 0.0 64
siiE CAE11797.1 large repetitive protein Virulence SPI-4 Protein 0.0 64
STM4261 NP_463126.1 inner membrane protein Not tested SPI-4 Protein 0.0 64

• Homologs from VFDB (virulence genes)

GeneGenBank Accn Product ID of source DB Alignment Type E-val Identity
SARI_03417 YP_001572388.1 hypothetical protein VFG0581 Protein 0.0 64