Name : SBG_3705 (SBG_3705) Accession : YP_004732500.1 Strain : Salmonella bongori NCTC 12419 Genome accession: NC_015761 Putative virulence/resistance : Virulence Product : large repetitive protein Function : - COG functional category : - COG ID : - EC number : - Position : 4110308 - 4126978 bp Length : 16671 bp Strand : + Note : the product of this CDS is composed of multiple degenerate repeats; note similarity to SBG3755 29.701% identity in 3313 aa overlap DNA sequence : ATGGGAAATAAAAACGTACAAAAATTTTTTGCCGATCAAAACTCTGTAATTGATCTGTCTTCTTTGGGTAATGCCAAAGG CGCTAAGGTTTCTCTTTCCGGGCCAGACATGAACATTACCACTTCACGTGGTACTGTGATCATTGTTAACGGTGCGCTTT ATTCAAGTATTAAAGGTAATAATCTCGCTGTTAAATTTAAAGATAAAACTATCACTGGCTCTAAAATCCTGGGCAGCGTA GATTTAAAAGATATTCAACTGGAAAGAATTGACAGTTCGCTGGTTGACACTGCCCAGGTAGAAAAAAAAGGTAACGGCAA GCAACGTAATAAAAAGGAAGACGAGGAATTAAAAAAGCAGCTTGACGAAGCTGAAAATGCTAAGAAAGAAGCGGACAAAG CGAAGGAAGATGCAGAGAAAGCGAAAGATGCTGCAGAAAAAGCACTCAATGAGGCGTTTGAAGTCCAGAACGCTTCAAAG CAAATAGAAGAGATGTTGCAGAACTTTTTGGCTGATAATGTAGCAAAAGACAATCTGGCTCAACAAAGTGATGCTGCTCA ACAAAATACGCAGACTAAAGCAGCGCAGGCGCTTAAACAGGACGATGCAGAAAAAGTTACTCCTCAACCTGTTAATAAAA ACACTGGCACAGGAAAAAGCAATAGCAGTAAAAATGAGGAAAATCAGTTCGAGGCTGAACCTGTCAAAGAGAAACTTAAA GTCACATTGACGCTTGCTGGTGAGAGTAATAGCGGTAGTAAAGACGATAGTATAACTAATTTTACTAAACCACAGTTTGT TGGCAGTACCGCCCCCAATGCGACGGTCATTATTAAAATGAATGGTATTTCTGTTGGCCAGGCTGTCGCTGATGGTTTGG GCAACTTTACCTTCACGGTGTCTGAGGAATTGACTGACGGGACGTATAACCTGGAGGCTGAGGCGGCGACTGCAGATGCC AGCGGTAGTACGAAACTTGTGTTTACTATCGATTCTGTTACCGATAAACCAACCTTTGAACTTGCTCCTGAAAGTAGTAT TCCAGGTCATAAAGGCTTAACGCCGACTCTGACGCCTTCAATTGTGGGTACAGCGGAAGAGAATGCTAAAGTCGACATTT ATGTCGGTAATAAACTGGTTGCCAGCGTTGATGTCGATAATGACGGAAAGTGGAGCTATGAGTTTAAAGATAATGAGTTA ACAGAAGGCGAAAATAGTATTAAAGTTGTTGCCGTTGATAAAGCAGGTAATAAAAATGAAACGGCAGACAGTATTATAAC TGATACTATTCCTCCGGAAAAACCAACGCTTGAGCTGGATGATAGCAGTGATTCCGGTGTTAAAGATGACGGTATTACGA ACAGTACCTTACCGACATTTATCGGTGTGGCGGAGCCCGGTTCTACAGTCTCTCTCTATCTTGGGCTCAAACATCTGGGA GATGTGATTGTTGCTAAAGATGGCTCATGGAGCTATACGCTTACCACACCGCTGAAAGATGGCGAATATAACTTAACCGC AACCGCCACCGACATCGCCGGGCATACCTCTGAGACGACGACTTTGCCATTTACGATTGACACTCGTATCAGCTATTTCA GTGCTGCGATTGATGCAGCTGATGACAGTGGTATTGTTGGCGATAATGTCACTAATAACGTTCGTCCAACCTTTACGGGT AAAACCGAGCCAAATGCTGTTATTAGCGTCAGAAATATCGACACGGGTGAAGAGATTAGTTTTAAAGCGAATGACCAGGG TGAATGGAAATTCGATTTTGCTTCAGACTCCGTTGAAGGTATTAATAATCTCATTTTTACAGTGGAAGATGTCGCTGGTA ACAAAAAGGATTTTTCTTTTAGTTATATAATAGATACTGTCGCCCCTGTTGTTCCGACGATTTCTTTAGATGACTTTGTT GTATTGCCGAATGGTATCATTTTATCAGGAAATGACTTGCCGACATTAGTCGGTACGGCAGAACCCAAATCCACCATCTT ATTAATGCGAGATGGTAAACTTTATGACAGTATCGAAGTTGATTCAAACGGTACCTGGAATTATCAGTTCGATAAAAAAC TCCTCCAGGGGGCGTATGATATTGAAATTGTCTCTCAGGATGCTGCCGGTAATAAATCCCCCTCTGTTAAATATTCTTTT ACTATTCAAACCGATGTTGTGCTTCCAAAAGCTGAACTGGAAGACAGTGATGATTCTGGTGTGAAAGGTGACTGGATTAC TAATCAATATAATGCCCTTACATTACTTGGTACCGCAGATAAGTTTGCTACTGTCAATATCCTGATTGATGGTAAAACGA TTGGTGTGACAACGGCAGATGCAGATGGTAACTGGACTTTTGATATTTCTCGCAATCTGTCTGACAATGTTTATAAAATT ACGGTTGAAGCTATCGATCCTTTAGGAAGAACGGCTTCCGTAGATTATCAGCTTACCATTGATAGCTTTACACCCATTCC GACTGTCATGTTGCATGATAGCGCCGACTCTGGCGTTATAGGCGATATGATTACTAAGATTAATACACCGTTGTTCACCG GGATAGCTGAAGCTAATGCTAAGGTGTCTATCTATATCGACGGCGTCTTAAGCGGCGAGGCTATTGCAGGTGATGATGGT GTATGGAATTTCCAGTCTACCACCATTTTACCCGATGGTTCGCATAACGTAACGGTAAAGGTAGAGGATGTTGCCGGTAA TATTGCCTCGTCATCAGCTTATAATTTTCAGATTATTACACAAACGCAAAAACCCACAATAGAGTTGGTCAACGATACGG GAATTGATAACACTGACCATATTATTAATGAAAAGAGCCCTGCGCTGACAGGTACGGCTGCACCCTATTCAACCGTTAAA TTATATATTGACGGTGTACTGTTCGCTGAAGTTAAAACAAATAAAGATGGCGTCTGGGGATATACCCTGAAACTCGACCA GGGGCTGATTGATGGCGATTATAAAATTACTGCCACAGTTGAAGACGTCGCTGGCAACGTAGCGCACTCAGATCCGTTTT CAATTAGCGTAGATACTACTATCTCAGTACCGGTAATTTCACTGAGTCCGGATTCAGACTCGGGAATTTCAAATGACAAT TTGACGAACGTCGTTAAACCCACTCTGCATCTTAAAGATATTGATCCAGACGTCGCCAGTGTTCAGGTATGGGATGCGGT ATCTAATAAGCAGATAGGCGTCGCTACGCAACAACCTGACGGAACCTGGGCCTATACTTTTACTTCAGATTTAACCGAAG GTAAGCATCAGGTATATGTCAAGGTTGAAGATATTGCAGGTAATAAAGCGAGCAGCGCAGTATTTGATTTCACTATTGAT AATACTATATCCACACCGGTTATTTCGTTGCTTCCCCGGGATGATACAGGGCTTAAAGGCGATGATCTGACCAATATCAA TAAACCCGTCTTCGTTATTAACGGCGTTGATGTGGATGCGCATCGGGTCATCGTGCAGGTATTGCATAATGGCGTGACAC AAAATATCGAACTCTCCCACAGTAATGGCAACTGGATATTTACACCAGGGGATGCCTGGGCGGATGGCAGTTACACGTTG ACTGTGGAAGTTAAAGATAAGGCCGGGAATATCAGTCATTCAGCGCCGCTGACGGTGACGGTCGATACCCATATTGCCAT TAATAATGTAGAGCTGGTCAACGACAACGGCGTCAAGGGCGACAATATGACTAACGACGCCCATCCGCAGTTCCGTGTTA CGGTGCCGACGGACGTTAAAGAAGTCAGTCTGAGCATTGACGGTGGCGTGACCTGGGTTAAGGCGACACAGAGCGCGACG CCGGGGGTGTGGAATTATACGTGGCCAACCACCGTGCCGGATGGCGACTACACGCTGGCAGTGAAAGCGACTGACAACGC GGGTAATACGGTAACGGAGACGCTCCCCTTCACGATTGATACCACGTTGTCGACGCCGGTTATCGTACTGGATGACATGG ATGACACTGGCGATAAGGGCGATAACATGACCAATCGCACCCAGCCGACATTTACCCTACAGCATATTGATGAAGACGCG GTCAGCGTGAAGGTCAGCGTGGAGCATGGCGGTGTCTCCACCACATTTTACGCCACGAAAGGTGCGGGCGGATGGACCTT TACGCCGACAGGGGCATGGACGGATGGTGATTATACCCTAAGTGTGTCGGTCGAAGATGCAGCTGGCAACACCAGCCAAT CTGCGCCGCTGACGGTGACGGTAGACACGCAAATCGCCATTGATCGCATTGAAATGCTCAATGACAGAGGAATCCCCAAC GATAATCTGACCAATGAAGTGCGTCCACACTTCCAGGTGAAGGTCCCGACGGATGTCAACCAGGTACGCCTGAGCATTGA TGACGGCAATACATGGGTAACAGCAGTGCTGAAGTCAACCGGGGCTTGGGAATATATCTGGCCGGATGATATGGCTGATG GTTCCTACACTCTGACAGTAGAGGCGACCGATGTGGCGGGCAATAAGACGACGCAGACGCTCGATTTCACCATTGATACC ACGCTGTCAGAACCGACTATCACCCTGGATGACACGGATGACAGTGGAACAAAAGGCGATAACATCACCCACGTTAAAAC ACCGGGATTTACGCTTCGCAACATTGATACCGATGCTCGCCGGGTAGTGGTGGAGGTCATGCACAATGGCAGTAAACAGG AGATACCGCTGACTCAGTCCGGCGGAAAGTGGCACTTTACACCAACCAGCAACTGGATGGACGGTGACTATATCCTGACG GTGAAAGTGGAAGACAGAGCCGGTAATGTGAAGGAGTCCGCGCCGTTGACAGTGACGGTGGACACACAAATCGCCATCAA CAGTGTTGAACTGGTCAATGACACCAGTAATCCCAACGATAATCTGACTAAAGACGTGCGTCCACACTTCCAGGTGAAGG TCCCGACGGATGTCAACGAAGTACGCCTGAGCATTGACGGCGGCAAGACTTGGGTGAAGGCAACCCAAAGCGCGACGCCG GGCGTGTGGGATTACACCTGGCTGAGCGATGTGGGGGAGGGGAAACACACCCTGATAGTGGAAGCGACCGATGCGGCGGG AAACAAGGCGACTGAGAGGCTTGATTTCACCATCGATACCACACTATCAGAACCGACGATCACGCTGGATAGCCTGGATG ATAGTGCTGCTGGCGATAATATCACCAATGTTAAAACGCCAGGCTTTACTCTCGGCAATATTGACGCCGACGTGGCCAGC GTGTCGGTAACGGTGACGCACAATGGTAAGAGTCAACAGGTAGATCTGATTCAGACCGGCGGACAGTGGCGCTTTACGCC GGGTACAGCATGGGTCGATGGCGACTATACGCTGACGGTGAAGGTGGAAGATAAGGCGGGGAATATAAACTATTCTGCCC CGTTGACAGTCACTATCGATACGCAAACGGCCATTGATCGTATTGAACTTATGAACGACACAAGTCTCGCTGGCAGTAAC CTGACCAATGAATTGCGTCCACAGTTTCATATCGCCGTTCCGAAGGATGTGAACTCTGTTCAACTCAGTATTGATGGCGG CGCCAATTGGGTTAACGCAACGCTAACTGCCGGTGGCGTTTGGGAATATGTCTGGCCGACGGATCTGGTCGAAGGAACGT ATACGCTGACGGTGAAAGCGACCGATATCGCAGGCAATACGGCGACAGATACGCTGAATTTTACCATCGATAACACGCTG TCGATACCGACTATCGCTCTGGATGCCATGGATGATACGGGTACTGGTAACGATAATACGACTAACGTTAAAACGCCGGG CTTTATTATCGGCGGTGTTGATGCTGATGTGATTCAGGTTATCGTACAGATTGCGCACGATGGTGGCAGCGAGGAGGTGG AGCTGACGCAGAGCGGCGGTCAGTGGCGTTTTACGCCGGGTGCCGCATGGACCGATGGCGACTATACCCTGACGGTAATA GTAAAAGACGAAGCGGGAAATATTAGCCACTCAGCGCCGTTGACAGTCACCATCGATACCCAAATCGCCATTGATAACAT TGAACTGATCAATGACAGCGGTATTCCTGACGATAATCTGACCAATGACGTGCGTCCACACTTCCAGGTGAAGGTCCCCA CGGATGTCAACGAAGTACGCCTGAGCATTGACGGCGGCACGACCTGGGTGAAGGCCACCCAGAGCGCGACGAAAGGCGTC TGGGATTACACCTGGCTGAGAGATGTGAGCGAGGGGACACACACCCTGACGGTGGAAGCGACCGATGCGGCAGGAAATAA GACGACGCAGACGCTCGATTTCACCATTGATACCAAACTGTCAGAACCGACTATCACCCTGGATGACACGGATGACAGTG AAACAAAAGGCGATAACCTGACCAACGTAAATAGGCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTATGTC ACGGTTGAGGTGCAGCATGGCAGCACGAAAGAAGTGCTGACGGCCACCAAAGGCACGAACGGCGTCTGGAGCGTTATACC GACCGGAACATGGGCAGACGGCAGTTATACGCTGACGGTGAGGGTGGAAGATAACGCGGAGAACGTAAAATACTCCGCGC CGCTGACGGTGACAGTCGATACCCATGTTGCCATTAATAATGTAGAGCTGGTCAATGACAATGGCGTCAAGGGCGACAAT ATGACTAACGACGCCCATCCGCAGTTCCGCGTTACGGTGCCGGTGGACGTTAAAGAAGTCAGTCTGAGCATTGACGGCGG CACGACCTGGGTTAAGGCGACACAGAGCACGACGCAGGGGGTGTGGAGTTATACGTGGCCAGACATTGTGCCGGATGGCG ACTACACGCTGGAGGTGAAAGCGACTGACAACGCGGGTAATACGGTAACAAAGAAGCTCGACTTCACGATTGATACCACG TTGTCGACGCCGGTTATCGTACTGGATGATGTGGATGACACCGGTGACAAGGGCGATAACATAACCAATCACACCCAGCC GACATTTACCCTGCAGCATATTGATAAAGACGCCGTCAGCGTGAAGATCAGCGTGGAGCATGGTGGTGTCTCCACTACAT TTGACGCCACGAAAGGCGCGGGTGGATGGACCTTTACGCCGACAGGGGCATGGGCGGATGGTGATTACACTCTGACCGTA TCCGTCGAAGATGTGGCTGGTAACACCAGTCAATCGGCGTCGCTGACGGTGACGGTGGACACGCAAATCTCCATCAATAA TATTGAACTGATCAATGACAGCGGTATTACCAACGATAATCTGACTAATGATGTGCGTCCACACTTCCAGGTGAAGGTCC CCACGGATGTCAACGAAGTACGCCTGAGCATTGACGGTGGCACGACCTGGGTGAAGGCCACCCAGAGCGCGACGAAAGGC GTCTGGGATTACACCTGGCTGAGTGATGTGAGCGAGGGGAAACACACCCTGACGGTGGAAGCGACCGATGCGGCAGGAAA TAAGACGACGCAGACGCTCGATTTCACCATTGATACCACGCTGTCAGAACCGACTATCACCCTGGATGACACGAATGACA GTGGAACAAAAGGCGATAACCTGACCAACGTAAATAAGCCGACGTTTTTACTGGGCAATATTGACGCAGACGCGCGGTAT GTCACGGTTGAGGTGCAGCATGGCAGCACGAAAGAAGTGCTGACGGCCACCAAAGGCACGAACGGCGTCTGGAGCGTTAT ACCGACCGGAACATGGGCAGACGGCAGTTATACGCTGACGGTGAGGGTGGAAGATAACGCGGAGAACGTAAAATACTCCG CGCCGCTGACGGTGACAGTCGATACCCATATCAGCATTGATAATATTGAACTGGTTAATGACAACGGTACTCCAGGCGAT AACCTGACCAATGAAGTTCGGCCGCAGTTCCGTGTCACGGTGCCGGGAGATGTCAATGAGGTACGTCTGAGTATCGACGG CGGTAAGACGTGGGTTCCCGCTATGCAGGTCAAAGCAGGGATCTGGGATTACACCTGGCCGGAAGATGTAACCGACGGGT TACACACCCTGGTGGTGGAGGCGGTCGATGCGGCGGGAAATAAGACGACGCAGACGCTCGAATTTACCATCGATACCCAG CTGTCAACGCCGACCATCACGATGGATGGCAGGGATGATACAGGCATCACTGGCGATCATATTACGAGTGTCAAAACACC AGCCTTTACCATTGGCAATATTGACGCCGATGCGAAATCGGTTGTTTTGCGGATCACCCAGGGCAGCAATAGCCAGGAAG TGAAACTGACGCAGGTTGGAGGCCAGTGGCGCTTTACGCCTGATGCAGACTGGGCGGACGGTAGCTATACGCTTACGGTA GAAGTCAAAGACAACGCAGGGAATATCCGCCAGTCCACGCCACTGGTGGTGACAGTGGACACGCAAACCAGTATTACTGA TATTACATTGGTCAATGATAATGGCGAGCCTGATGACAATCTGACCAACAGCACCCGCCCACAGTTTGAGATCAAGGTGC CGGTGGATGTGAACTCTGTGCAATTGAGCATTGATGGTGGCACAAACTGGGTTAACGCGGTGCAAGGCATCAAAGGTGTC TGGGGCTATACCTGGCCTACGGAGATCGGCGATGGGAAACATATCCTGACCGTGATGGTCAAAGACACCGCGGGCAATAC GGCTACCCAAACACTTGAATTTACTATCGATACCAAATTGTCGACGCCGACTATTGCGCTGGATGGCATGGATGATACCG GTACGCCTGGTGATGGGATGACCAAAAAGACCCAGCCGACGTTTGTTCTGCAAAATATCGATTCAGATGTTGTCAAAGTC ACAGTGAGTGTTACGCATAACGGGACGACAAGCACCTTTGCCGCGACGCAGGGAGCCGGTGGATGGTACTTTACGCCGTT AACACCGTGGGGCGATGGTAATTATACGTTGACGGTAACAGCAGAAGATCGGGCGGGAAATACGCGTCCATCCACGCCAC TGACAGTGACGGTGGATACGCAAGTTGCCATTAATCATATTGAATTGGTCAACGATAGCGGCGCCCCTGATATCAACCTG ACGAAACATGTGCGTCCGCAGTTCCAGATCTCGGTACCTGAGGATGTCAACGAAGTACGCCTGAGCATTGACGGCGGCAC GACCTGGGTTGCTGCCATTAAGAGTTCGACGGCTGGCATCTGGGATTACACCTGGCCGACGGATGTGCCTGAGGGAGAGC ATGTCCTGACAGTGGAAGCGACCGATGCTGCGGGCAATACAATAAGACAAACGCTCACTTTCACCATCGACATCACGCTG TCGACACCAACCATTGAGTTAGCGCCGGATCAGGATACCGGACAGAGTAAGAATGATAACCTGACCAGCGTTACTCAGCC GGTATTTGTGTTGGGCCATATCGATAAAGATGTTCGACACGTGGAATTGAGTATTGAGCATAACGGCACGTTTAAAACGG TGGTGCTTACCGAATCCGCCGATGGCTGGCGCTATCGACCGGACTCCGCTTTGGAGGACGGTAGCTACAAATTAACCGTG ACGGTAACAGATGCAGCGGGCAACCAGCAGACCTCTGCGCCTTTAACGGTGACGATTGACGGCACATTGACGACACCGAC GATTGAACTGGCACCTGGCGAAGACAGCAGTACTGTCGGCGATCGCCTCACTAACCACGATCGGCCTGTGTTCGATATAC ACCAGATTGATTCTGACGTTACGCGCGTGATGGTTAAGGTCACTTACAACGGTAAAACGCATGAGGAAGCGGCGGTATTC AGCAATGGTCAATGGCGCTTTACCCCTTCTGCGAGCTGGGCTGATGGCTCATATCAGTTAGCCGTTGTGGTGGAAGATCG GGCGGGGAACGTAAAAGAATCCGCACCGTTAGAGGTGCGTATTGATACCACGACGACTGTTAACAATATCGTATTGCTTA ATGACACCGGTGTGCAGAATGACCAATTAACGAATGTTGCCAAACCGTCATTCAGAATTGAAGTTCCTGCGGATGTCGTT CAGGTACGCGTCACTCTGGATGGGGGCACTAGCTGGAGTCCGATACGCAAAAATGCCGACGGACAGTGGATTTTTGAAAG CACGAATACCCTGGTTGACGGTACATATACCCTTCGCGTAGAGGCCACGGATGAGGCAGGGAATATTGCGAATAAAGATT TAGTATTTAATATCGATACGACTATACAGGTGCCGACTATCGCTTTAGAGGCAGGACAAGATACCGGCGCGAATACCTCC GATAATATCACCAATATTTCACGTCCTACCTTTGCGATTGGTAATGTTGATCCGGATGTTATCAAAGTCGTGGTGACAAT TGATGGTCATAATTATAACGCGACTAAGGTTGGGTCTGGTTGGGCGTTTACGCCAGGCAATGCAATTCCTGATGGCGCTT ATAATATTACTGTTACCGTTGAAGATAAGGCCGGGAATATTGCAACATCGAAACCATTACCTGTTGTGATTGATACGACG GCTGAAATTAAAAGCGTAACGTTGGTGACAGATAGCGGCGACAGCACGGTAGATAATATTACTAACATCAATAAACCGCA GTTTAGTATTGTTACCGCTGATGACATTGTCCAGGTGCGTGTTAAAGTCGATAACGCGGCTAATTGGATTGAACTTACAA AAGGAGGGGATGGCCGCTGGATATTTAATACCAGTTCAGCATTACCGGATGGTCAGCATTCTCTGGTGGTTGACGTTGTT GATATCGCCGGGAACGTTGCGCAAGAAACGCTGCAGTTTACGGTAGATACGACTCTGCGAGTACCGACAATTGTACTCGA TCCTGGTCATGATACTGGCGATGATACTAATGATAATCTCACCAGAATTAACAAGCCGGTATTTATTATCGGTGATGTGG ATAATGATGTCTCACACATTGTAGTTCGCATTGATGGCCGGGATTACACCATTGAAAACACCGGAGGAAAGTTAACCTTT ACGCCAGATAAACCGCTATCCGATGGCCAGCATACGATCTCTGTTACCGTAACGGATATTGCCGGTAATACCAAAACATC GGCCGAGCTACAGATTGAAATCGACACACAGGTTCAGATTGATAACGTGACGTTAACGACAGATAGTGGCATCAACGATC ATGATAATGTCACCAATGCTAAACGTCCTTCTTTTGAAATTGAAACGCCTGCTGATGTGACGATAGTTCAGGTTTCTTTC GATGGCGTAAACTGGACGCCCATCAGTAAAAACGCGGCCGGACAGTGGGAATTTACTGCTGGTAGCGAACTGTCTGATGG TCATTATACACTCCATGTCCAGGCGACGGATCGAGCAGGAAACACGGCAAATTCCACGCTGGATTTCACCGTAGATACGC AGATTAACGGACTTAGCGTCGTTATGCTGGATGACGCCGGAAAGGATACTGCAGACGGTATCACCAATATTACTTCCCCA CGCTTTGAGATTTCGGCCGGAGAGCCGCTGCAAAGTGTGACGGTAATTTTGAATGGGAAATCCAGCACGTTGACTCAGGG AGCGGGTAATAAATGGCTATTTACCCCTGACACTCCCTTAGTGGATGGAACTTACAAAATAGAAATTGTTGCTGAAGATA TCGCAGGCAATAAGGTTAACAAAGAAGTCTCATTCACAATAGATACTATTATTTCTGATCCCAGTATTAACTTACTGGAT GCGGATGATTCCGGCGAAAGCTCTGTTGATAATATTACCAATGTCACTAAACCACGTTTCGTCATTGGCAATGTCCCTGC TGATATTGATACCGTTATTATCAGAATTAATGGCATTTCTTATCCGGTTACGGCAAATGGCAATAACCTCTGGGAATTTC AGGTTCCCGTTGCGTTAAAAGATGGTGTATATGAAGCTGCCGTTGTCTTCAAAGATATTGCAGGAAATACTTCGGAAACG AAATTACCCTTTACCATTGATACCACGACAAGTGTCACTGTAAGAATGGAGCCTGCATCTGATACCGGAAGCTCTAATAG TGATAATCTGACTAATAAGCAAAACCCCAAATTCGAAGGCACTGCGGAGCCAAATGCGAAACTGGAGATTACCATTGTTG ACGATGCGTCTAATGTGGTTCTAAAACAAACGGTTACAGTTGGCCCTGATGGCAACTGGAGTATTACACCGTCTCTACTG GCGGATGGTACATATACGATTAACGTTACGGCGACAGATGTGGCGGGAAATACTGCGCAAACGCAGGAAAAATTCACTAT CGATACCGTCACGACCGATCCGACCATTCGTCTTTCAGATCCGTCCGTCGATGATCAGCATGAAGCGACCAGCTTGCGTC CTGAGTTTAAAGGTATCGCTGAAGCGTTTTCGACGATTATGATTAAGTGGGATGGCAAAGTTGTTGGCTCAGCGAACGCA AATGCGAATGGCGACTGGAGCTGGACACCGCCGTCGGTATTAGCCCCTGGCTCCTATGTGGTGAGTATTGTTGCCAAAGA TAAAGCGGGTAATGAATCCTCGCAGGTCGACTTTGCTGTTGTCATCCCCGTTATTGACGTAACACCTCCAACGATAAAGC TCAGTGATGAAAGTGATACCGGGCCTTTAGGAGACTTTACGACCAGTAATAAAACGCCGACTCTGATAGGGAACACATTA CCTAATACGATTGTGAGTATTTATGTTGATGGTCTGAAGGTCGGCGAGGCGACAGCGGATACTGCCGGTCGATATACCTT CCAGCTGCCGGAAATGAATGACGGCCAGTATGTCGTTCAGGTCGGTATCATCAATCCTCGCGATCATAGCGAACTGCGTT CCACGGCCGTTGATGTCACCATTGATACTCAGGTTGCTGAACTGGTATGGAATGTATCCGGCATGCATGAGGGCGGATAC ATTAACACGGTGACGCCAGAGATTGGCGGCACCAGTGAGCCAAACAGTAAGGTTATTATCCTTGTGAATGGCGTTGAAAA AGCGATTGCTTATACCACAGGAACAGGTCACTGGGGGGTTGTATTACCCGCTTTGGGTAATGACGGTAATTATGTATTAA CCTTTAGGGTTGAAGATGTTGCCGGAAATACTAAAGAGTTTGGCCCGCAGCACATCATACTGGATACGGTCATTGCTCCG ATGACAGTGGAATTACGTGAAATAGATGACAGTGGCAAAATTGGCGACTGGATCACCAAAAAATCTCATGTCACTCTTGA GGGTACTGCCGAAGCAGGAAGTACATTAACCATCCGCAATCCGCAGGGCGTGGTTATTGCTACCCTGGTGGTAGGAAATG ATGGTCGATGGAGCGCGGAAGTCGATCTGCGTGAAGGTAGCAACGCCTTTGTCGTTATATCGGAAGATAAAGCAGGTAAC AGCCAACAAAAAGAAATCCTGATCGAACATGATACACAGATTGAAATCAGCGATATTTCATTAAGCCGGGATACGAACAG CGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTGCTGGTTGCTATGACCGACCCCGGCGCAACGGTACAGG TTTATATTAATGGCGTGTTACAAGGCACGGTTGAGGCAAACTCATCAGGTAATATTAGCTATACCATGCCGGCAAATAGT GCTGACGGCGAGTATCAGGTGCAATTTGTTGCTACAGATATCGCTGGCAACCGGGTTGAATCTGCGGTTACAACCGTGAC AATTGATTCTCAAATCGCAGTCTTTGACATTGATGAAAATACATTACCAGCTATCTCTAATAACCGGGCGCTGTCAGTCT CCGGCGTAGGGGAGGCTGGTTCACAGGTCAGCATTTTTGTCGATGGTAAATTAGTCAACGTTGTTATGGTGGAGGCTGAT GGCTCGTGGAGTGCGCCAATACTGCTACAAGATGACGGTACGTTTAATATTCATTTCAGCATTACTGACGTTGCCGGAAA CACTGAAGTCAGTAAGAATTATAGCGTGGATGTCGATTCATCAACTGCCTTCCCAACGCTCAACCTTGATGAGTTGAGCA ACTCAGGTTCACATGACGATCTGATCACTAATCATAACAAGCCAGTGTTAACTGGTACCGCAGAAGCGGGAGCAACAATC CATATTTATGTGGATGAAAAGATTGTGGCAAATGTTGTTGTGCTTGAGGATGGAACCTGGTCCTATCAGTTTGATAATGC CTTAAAAGACGGGGAATATTCTATTCGCGTGGTTGCCGAGGACCTTGCGGGTAATACGGCAGAATCGCCTCGCTTAATCG TTACGATAGATACCAGCACATACATTGATCCGCCTGCACTGGCTCCCGGGTCTGATAATGGCATGTTCATTAACGACGGT ATCACAAGTCAAACCCGGCCTAAGTTTAGTATCAACGGTGAGTTTAATCAGAGTGTCCAAATCTACATTGATGGGAAGCT CGTCGATACGGTAACCGTGACGGACAGAAACCAGGTTTATCAACCTGCGATTCCTTTGGGTGATGGTACCCATAGTATTC ATTACGTTATCACTGATAAAGCGGGCAACACAGCCACATCGAAACCCCTAAGCTTTACGGTAGATACTACTAATACAACG CCTGTCCTGATTGATTCTATCGATGGCCAAACGTTAGCCGAAATGACCGCCAGTGATGGGAAGATATATATAACAGATAC AACACATAACCTGATGTTTAGTGGGAGTGCTGAGCCCGATAGTTTAATAGAGTTAACTATTAATGGACTAGATGTAGGGA AGATTTGGGTTGACAATACAGGAAAATGGCAGATGCCTGTCAATCCCGTTTATCTCTCGCAAGGTCTTCTGGATATAAAT GTCAAATCTACGGACCGTGGCGGTAACGTAAATCAGGAAAACTATTCCATTTGGGTTGATACGATGATCCAGGAGTTTAC CAGCGAGCTTGATGACAATAAGTCGTTGTCGAAAACGGACTGGTGGAGTAATAGCGCTCTTATTACCATGAGAGGTATGG GTGAAATTGGCGCTACGGTATCATTAATAGTGGCAGGGGTCACGCTGGCAACCGCTGTCGTTGCAGCTAATGGGCAGTGG GAATTATCGACCGATAAGCTTCCGGAAGGGAAATACGATATCACTTTGAGTATTGAGGATAACGCAGGCAACCGTAAGGA AGAGGTACATGAAATATTTATTGATCGAACGCCGCCGAGTGCGCCTGTCGTAACGTATTCAGACATAGTTAACGATCTGA TTATTATGCAGGGAACGGCGGAAGCCAAATCACAGCTAATAATAACCGATAGCGAGGGAAATACTTATACGCTCACGGTT CCTGATAATGGTAACTGGAGTACGGCAATACCGTACCCATCGGAAGGGAAGTTCACCATTACGAGCGTGGATGCGATGGG TAACAAGAGCGATGTACTTTCTCTCGATATAATGAAAGACGTGCCTGTTATTTCATTAGCGGTAGACTCGGATGGTAATA TAGTAGGCGATAATATTACGCAAGATAATCAACCCACCTTTATTATCGGGAACCTGGAAAGCGATGTGGTCACTGTTCAG GTCGATATCAATGGGACCTTATATAATGCTGAACAACGCGCTGATGGCGTTTGGTTCTTTACGCCAGGTACCGCGCTAGC CGACGGTTCCTATACCATATCGGTCATTGCGAGTGACGCCGCAGGTAATAAGAAAAACTCATTACCGATTACCGTCACGA TCGACAGTACGCTGACGGTGCCGGAGATTGCGCTGGCGGCAGGTGAAGACAATGGCGCTTCAGACAGCGATAACGTGACG AATCATACCCAGCCTAAGTTCACGTTGCAGCATATTGATGCTGATGTGACCGGGGTGACCATAAATGTGGCGCATAGTGG AGGGACAGACACCTACCAGGCAACGCAGAGTGCGGATGGCTGGACCTTCACGCCGCCGGTCGCATGGAATGATGGCACAT ACACATTGAGCGTAACGGTGGTAGATGATGCCGGGAATAAAAAGCATTCTGCCTCGCTGACGGTAACGGTTGATTCAACG GTAACAGTAGCGACGAATGCGTTAAGCGGCCATAGTGATACCGACACACTAACGGACGTTATACAATCTGAGCCCGAAAC GAAGAATGCTGAAAGTGATACACATGCTCGTACCGGGATGCCTGCGGCTGAAGAAAGCACAGCAGCGGAGGAGGCATATA ACATTACATTGTTAAATGCTGACGCCGGAGATGAAACAGAACGTTCGATTAGCCAGACACCTTCTTTTGAAATCTCTGTG CCAGAAAATATTGTTAACGTGAGTGTCATGTTCGAAGGAGAAGAATTTACTCTGCCGATAATTAACCACAAAGCAATATT CGAAGTTCCATTATCTTTAGAAGATGGTGAATATACTATGGATGTGAAATTCCTTGATAAGGACGATGATTACCTCATCA AGGAGAAAACATTCTCCGTTGATCAGTCTTCTGCTGATATTGTGAATGCAATGAACGCAAGAGGAAAAACGGAAGATGAT ATTAATGATTCCCCTTCAGCGAGTTCTGTAGGGCATAATAATGGTGCAATTGAGGCTTTCACCGTTAATGAAGTTACGCT CCCTGTAGATAATCAAGAAGAATACGCATAA Protein sequence : MGNKNVQKFFADQNSVIDLSSLGNAKGAKVSLSGPDMNITTSRGTVIIVNGALYSSIKGNNLAVKFKDKTITGSKILGSV DLKDIQLERIDSSLVDTAQVEKKGNGKQRNKKEDEELKKQLDEAENAKKEADKAKEDAEKAKDAAEKALNEAFEVQNASK QIEEMLQNFLADNVAKDNLAQQSDAAQQNTQTKAAQALKQDDAEKVTPQPVNKNTGTGKSNSSKNEENQFEAEPVKEKLK VTLTLAGESNSGSKDDSITNFTKPQFVGSTAPNATVIIKMNGISVGQAVADGLGNFTFTVSEELTDGTYNLEAEAATADA SGSTKLVFTIDSVTDKPTFELAPESSIPGHKGLTPTLTPSIVGTAEENAKVDIYVGNKLVASVDVDNDGKWSYEFKDNEL TEGENSIKVVAVDKAGNKNETADSIITDTIPPEKPTLELDDSSDSGVKDDGITNSTLPTFIGVAEPGSTVSLYLGLKHLG DVIVAKDGSWSYTLTTPLKDGEYNLTATATDIAGHTSETTTLPFTIDTRISYFSAAIDAADDSGIVGDNVTNNVRPTFTG KTEPNAVISVRNIDTGEEISFKANDQGEWKFDFASDSVEGINNLIFTVEDVAGNKKDFSFSYIIDTVAPVVPTISLDDFV VLPNGIILSGNDLPTLVGTAEPKSTILLMRDGKLYDSIEVDSNGTWNYQFDKKLLQGAYDIEIVSQDAAGNKSPSVKYSF TIQTDVVLPKAELEDSDDSGVKGDWITNQYNALTLLGTADKFATVNILIDGKTIGVTTADADGNWTFDISRNLSDNVYKI TVEAIDPLGRTASVDYQLTIDSFTPIPTVMLHDSADSGVIGDMITKINTPLFTGIAEANAKVSIYIDGVLSGEAIAGDDG VWNFQSTTILPDGSHNVTVKVEDVAGNIASSSAYNFQIITQTQKPTIELVNDTGIDNTDHIINEKSPALTGTAAPYSTVK LYIDGVLFAEVKTNKDGVWGYTLKLDQGLIDGDYKITATVEDVAGNVAHSDPFSISVDTTISVPVISLSPDSDSGISNDN LTNVVKPTLHLKDIDPDVASVQVWDAVSNKQIGVATQQPDGTWAYTFTSDLTEGKHQVYVKVEDIAGNKASSAVFDFTID NTISTPVISLLPRDDTGLKGDDLTNINKPVFVINGVDVDAHRVIVQVLHNGVTQNIELSHSNGNWIFTPGDAWADGSYTL TVEVKDKAGNISHSAPLTVTVDTHIAINNVELVNDNGVKGDNMTNDAHPQFRVTVPTDVKEVSLSIDGGVTWVKATQSAT PGVWNYTWPTTVPDGDYTLAVKATDNAGNTVTETLPFTIDTTLSTPVIVLDDMDDTGDKGDNMTNRTQPTFTLQHIDEDA VSVKVSVEHGGVSTTFYATKGAGGWTFTPTGAWTDGDYTLSVSVEDAAGNTSQSAPLTVTVDTQIAIDRIEMLNDRGIPN DNLTNEVRPHFQVKVPTDVNQVRLSIDDGNTWVTAVLKSTGAWEYIWPDDMADGSYTLTVEATDVAGNKTTQTLDFTIDT TLSEPTITLDDTDDSGTKGDNITHVKTPGFTLRNIDTDARRVVVEVMHNGSKQEIPLTQSGGKWHFTPTSNWMDGDYILT VKVEDRAGNVKESAPLTVTVDTQIAINSVELVNDTSNPNDNLTKDVRPHFQVKVPTDVNEVRLSIDGGKTWVKATQSATP GVWDYTWLSDVGEGKHTLIVEATDAAGNKATERLDFTIDTTLSEPTITLDSLDDSAAGDNITNVKTPGFTLGNIDADVAS VSVTVTHNGKSQQVDLIQTGGQWRFTPGTAWVDGDYTLTVKVEDKAGNINYSAPLTVTIDTQTAIDRIELMNDTSLAGSN LTNELRPQFHIAVPKDVNSVQLSIDGGANWVNATLTAGGVWEYVWPTDLVEGTYTLTVKATDIAGNTATDTLNFTIDNTL SIPTIALDAMDDTGTGNDNTTNVKTPGFIIGGVDADVIQVIVQIAHDGGSEEVELTQSGGQWRFTPGAAWTDGDYTLTVI VKDEAGNISHSAPLTVTIDTQIAIDNIELINDSGIPDDNLTNDVRPHFQVKVPTDVNEVRLSIDGGTTWVKATQSATKGV WDYTWLRDVSEGTHTLTVEATDAAGNKTTQTLDFTIDTKLSEPTITLDDTDDSETKGDNLTNVNRPTFLLGNIDADARYV TVEVQHGSTKEVLTATKGTNGVWSVIPTGTWADGSYTLTVRVEDNAENVKYSAPLTVTVDTHVAINNVELVNDNGVKGDN MTNDAHPQFRVTVPVDVKEVSLSIDGGTTWVKATQSTTQGVWSYTWPDIVPDGDYTLEVKATDNAGNTVTKKLDFTIDTT LSTPVIVLDDVDDTGDKGDNITNHTQPTFTLQHIDKDAVSVKISVEHGGVSTTFDATKGAGGWTFTPTGAWADGDYTLTV SVEDVAGNTSQSASLTVTVDTQISINNIELINDSGITNDNLTNDVRPHFQVKVPTDVNEVRLSIDGGTTWVKATQSATKG VWDYTWLSDVSEGKHTLTVEATDAAGNKTTQTLDFTIDTTLSEPTITLDDTNDSGTKGDNLTNVNKPTFLLGNIDADARY VTVEVQHGSTKEVLTATKGTNGVWSVIPTGTWADGSYTLTVRVEDNAENVKYSAPLTVTVDTHISIDNIELVNDNGTPGD NLTNEVRPQFRVTVPGDVNEVRLSIDGGKTWVPAMQVKAGIWDYTWPEDVTDGLHTLVVEAVDAAGNKTTQTLEFTIDTQ LSTPTITMDGRDDTGITGDHITSVKTPAFTIGNIDADAKSVVLRITQGSNSQEVKLTQVGGQWRFTPDADWADGSYTLTV EVKDNAGNIRQSTPLVVTVDTQTSITDITLVNDNGEPDDNLTNSTRPQFEIKVPVDVNSVQLSIDGGTNWVNAVQGIKGV WGYTWPTEIGDGKHILTVMVKDTAGNTATQTLEFTIDTKLSTPTIALDGMDDTGTPGDGMTKKTQPTFVLQNIDSDVVKV TVSVTHNGTTSTFAATQGAGGWYFTPLTPWGDGNYTLTVTAEDRAGNTRPSTPLTVTVDTQVAINHIELVNDSGAPDINL TKHVRPQFQISVPEDVNEVRLSIDGGTTWVAAIKSSTAGIWDYTWPTDVPEGEHVLTVEATDAAGNTIRQTLTFTIDITL STPTIELAPDQDTGQSKNDNLTSVTQPVFVLGHIDKDVRHVELSIEHNGTFKTVVLTESADGWRYRPDSALEDGSYKLTV TVTDAAGNQQTSAPLTVTIDGTLTTPTIELAPGEDSSTVGDRLTNHDRPVFDIHQIDSDVTRVMVKVTYNGKTHEEAAVF SNGQWRFTPSASWADGSYQLAVVVEDRAGNVKESAPLEVRIDTTTTVNNIVLLNDTGVQNDQLTNVAKPSFRIEVPADVV QVRVTLDGGTSWSPIRKNADGQWIFESTNTLVDGTYTLRVEATDEAGNIANKDLVFNIDTTIQVPTIALEAGQDTGANTS DNITNISRPTFAIGNVDPDVIKVVVTIDGHNYNATKVGSGWAFTPGNAIPDGAYNITVTVEDKAGNIATSKPLPVVIDTT AEIKSVTLVTDSGDSTVDNITNINKPQFSIVTADDIVQVRVKVDNAANWIELTKGGDGRWIFNTSSALPDGQHSLVVDVV DIAGNVAQETLQFTVDTTLRVPTIVLDPGHDTGDDTNDNLTRINKPVFIIGDVDNDVSHIVVRIDGRDYTIENTGGKLTF TPDKPLSDGQHTISVTVTDIAGNTKTSAELQIEIDTQVQIDNVTLTTDSGINDHDNVTNAKRPSFEIETPADVTIVQVSF DGVNWTPISKNAAGQWEFTAGSELSDGHYTLHVQATDRAGNTANSTLDFTVDTQINGLSVVMLDDAGKDTADGITNITSP RFEISAGEPLQSVTVILNGKSSTLTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKVNKEVSFTIDTIISDPSINLLD ADDSGESSVDNITNVTKPRFVIGNVPADIDTVIIRINGISYPVTANGNNLWEFQVPVALKDGVYEAAVVFKDIAGNTSET KLPFTIDTTTSVTVRMEPASDTGSSNSDNLTNKQNPKFEGTAEPNAKLEITIVDDASNVVLKQTVTVGPDGNWSITPSLL ADGTYTINVTATDVAGNTAQTQEKFTIDTVTTDPTIRLSDPSVDDQHEATSLRPEFKGIAEAFSTIMIKWDGKVVGSANA NANGDWSWTPPSVLAPGSYVVSIVAKDKAGNESSQVDFAVVIPVIDVTPPTIKLSDESDTGPLGDFTTSNKTPTLIGNTL PNTIVSIYVDGLKVGEATADTAGRYTFQLPEMNDGQYVVQVGIINPRDHSELRSTAVDVTIDTQVAELVWNVSGMHEGGY INTVTPEIGGTSEPNSKVIILVNGVEKAIAYTTGTGHWGVVLPALGNDGNYVLTFRVEDVAGNTKEFGPQHIILDTVIAP MTVELREIDDSGKIGDWITKKSHVTLEGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAEVDLREGSNAFVVISEDKAGN SQQKEILIEHDTQIEISDISLSRDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEANSSGNISYTMPANS ADGEYQVQFVATDIAGNRVESAVTTVTIDSQIAVFDIDENTLPAISNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEAD GSWSAPILLQDDGTFNIHFSITDVAGNTEVSKNYSVDVDSSTAFPTLNLDELSNSGSHDDLITNHNKPVLTGTAEAGATI HIYVDEKIVANVVVLEDGTWSYQFDNALKDGEYSIRVVAEDLAGNTAESPRLIVTIDTSTYIDPPALAPGSDNGMFINDG ITSQTRPKFSINGEFNQSVQIYIDGKLVDTVTVTDRNQVYQPAIPLGDGTHSIHYVITDKAGNTATSKPLSFTVDTTNTT PVLIDSIDGQTLAEMTASDGKIYITDTTHNLMFSGSAEPDSLIELTINGLDVGKIWVDNTGKWQMPVNPVYLSQGLLDIN VKSTDRGGNVNQENYSIWVDTMIQEFTSELDDNKSLSKTDWWSNSALITMRGMGEIGATVSLIVAGVTLATAVVAANGQW ELSTDKLPEGKYDITLSIEDNAGNRKEEVHEIFIDRTPPSAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSEGNTYTLTV PDNGNWSTAIPYPSEGKFTITSVDAMGNKSDVLSLDIMKDVPVISLAVDSDGNIVGDNITQDNQPTFIIGNLESDVVTVQ VDINGTLYNAEQRADGVWFFTPGTALADGSYTISVIASDAAGNKKNSLPITVTIDSTLTVPEIALAAGEDNGASDSDNVT NHTQPKFTLQHIDADVTGVTINVAHSGGTDTYQATQSADGWTFTPPVAWNDGTYTLSVTVVDDAGNKKHSASLTVTVDST VTVATNALSGHSDTDTLTDVIQSEPETKNAESDTHARTGMPAAEESTAAEEAYNITLLNADAGDETERSISQTPSFEISV PENIVNVSVMFEGEEFTLPIINHKAIFEVPLSLEDGEYTMDVKFLDKDDDYLIKEKTFSVDQSSADIVNAMNARGKTEDD INDSPSASSVGHNNGAIEAFTVNEVTLPVDNQEEYA |
Gene | GenBank Accn | Product | Virulance or Resistance | PAI or REI | Alignment Type | E-val | Identity |
siiE | CAE11797.1 | large repetitive protein | Virulence | SPI-4 | Protein | 0.0 | 86 |
STM4261 | NP_463126.1 | inner membrane protein | Not tested | SPI-4 | Protein | 0.0 | 86 |
SC4140 | YP_219127.1 | inner membrane protein | Not tested | SPI-4 | Protein | 0.0 | 86 |
Gene | GenBank Accn | Product | ID of source DB | Alignment Type | E-val | Identity |
SBG_3705 | YP_004732500.1 | large repetitive protein | VFG0581 | Protein | 0.0 | 86 |