Gene Information

Name : TY21A_21180 (TY21A_21180)
Accession : YP_007928407.1
Strain : Salmonella enterica Ty21a
Genome accession: NC_021176
Putative virulence/resistance : Unknown
Product : large repetitive protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 4322151 - 4328924 bp
Length : 6774 bp
Strand : +
Note : COG1404 Subtilisin-like serine proteases

DNA sequence :
GTGGTGGAAGATCTGGCGGGGAATGTAAAAGAATCTGCGCCGTTAGAGGTACGTATTGATACCACGACAACCATTAACAA
TATCGTATTGCTTAATGATACTGGCGTGCAGAATGATCAATTAACGAATGTTGCCAAACCGTCATTCAGAATTGACGTTC
CCGGTGATGTCGTCCAGGTACGCGTAACCCTGGATGGTGGCGCTAACTGGAATGTGATACGCAAAAATGCCGACGGACAG
TGGATTTTTGACAGCCCGAATACTCTGGTTGACGGCACATATACCCTTCGCGTAGAGGCCACGGATGAGGCAGGTAATAT
TGCAAATAAAGATTTAGTATTTAATATCGATACTAATATACAGGTTCCGACTATTGCTTTAGACGCAGGACAAGATACCG
GAGCGAATACAGCCGATAATATTACTAATATTTCACGACCCACCTTTACGATTGGTAATGTTGACCCCGATGTTATCAAA
GTCGTGGTGACGATTGATGGTCATGATTATAACGCGACTAAGGTTGGGGCTGGTTGGCAATTTACACCAGGCAATGCCAT
TCCGGATGGTTCTTATAATATTACCGTTACGGTTGAAGATAAGGCCGGAAATACCGCGACATCGAAACCATTACCTGTTG
TGATAGATACGACGGCTGAAATTGAAAGCGTCACGTTGGTTACAGATAGCGGTGATAGCGATGTAGATAACATTACCAAA
GTCGACAAGCCGCAGTTTAGTATTGTTACCGCTGATGATATTACCCATGTGCGCGTTAAAATCGATAACGCCGCTAATTG
GATTGAACTCACAAAAGGAGGGGATGGTCGCTGGATATTTAATGTCGGTTCGGCATTACCTGATGGGCAACACACTCTCT
TGGTTGATGTGACTGATATCGCCGGCAACGTTGCGCAAGAAACGCTGCAGTTTACGATTGATACGACTCTGCGAGAGCCG
ACAATTGTACTCGATCCCACCCATGATACTGGTGATGATACTAATGATAATCTTACCAGGATTAACAAACCGGTGTTTAT
TATCGGTAATGTCGATAATGATGTATCACACATTGTGGTTCATCTTGATGGTCGGGATTACACCATTGAAAACAAAGGGG
GGAATTTAACCTTTACGCCGGATCAACCGCTGTCTGACGGTCAGCATACGATCTCTGTTACCGTAACGGATATTGCTGGT
AATACCAAAACATCGGCCGAACTGCAGATTGAAATCGACACGCAGGTTCAGATTGACAGTGTTACGTTAACAACAGATAG
CGGCGTCAACGATCACGATAATGTCACCAATGCTACCCGTCCCTCTTTTGAAATTGCAACGCCTGATGATGTGACATCGG
TGCTGGTTTCTTTCGATGGCGTAAACTGGACGCCCATCAGTAAAAATGCGGCCGGGCAGTGGCAATTTACTGCAGGTAGC
GCATTGTCTGATGGTCATTATACTCTCCATGTCCAGGCGACGGATCGGGCAGGGAATACGGCAAATTCCACGCTGGGCTT
TACCGTGGATACGCAGATTGACGGCCTGAGCGTCGTGATGCTGGACGACGCCGGAAAGGATTCTACGGATGGTATTACGA
ATATTACCTCTCCACGTTTTGAAATTTCAGCCAGAGAACAGTTGCAGAGCGTGACGGTAATTTTAAACGGGAAATCCAGC
ACCCTGACTCAGGGGGCAGGTAATAAATGGCTGTTTACCCCTGATACACCGTTAGTGGATGGAACTTACAAAATAGAAAT
AGTGGCTGAAGATATCGCAGGTAATAAAATTAGCAAAGAGGTATCATTCACAATAGACACTATTGTTTCTGATCCCAGTA
TTGATTTGCTGGATGCGGATGATACTGGCGAAAGCGCTGTTGATAATATTACGAGTGTCACTACACCACGTTTCGTTATT
GGCAATGTACCCGCCGATATTGATACTGTTGTAATCAGAATTAACGGCGTTTCTTATCCGGTTACGGCAAATGGCAATAA
CCTCTGGGAATTTCAGGTTCCCGTTGCGTTAAACGATGGCGTATATGAAGTCGTTGTTGTCTTCAGAGATATTGCCGGAA
ATACTTCTGAAACTAAGCTGCCCTTTACCATTGATACCACGACAAGCGTCAGTGTCAGAATGGAGCCAGCGTCTGATACC
GGCAGCTCCAATAGCGATAACCTTACGAATAAGCAAAATCCCAAATTCGAAGGTACTGCAGAGCCCAATGCGAAACTGGT
GATTACCATTGTTGACGATAAGTCAGGTCGGGAGGTTTTAAAACACACGATTACGGTTGGCGCCGATGGCAACTGGAGTG
TGACGCCGAATATACTGCCGGATGGCATGTATACCATCAACGTCGTCGCAACAGATGTCGCGGGAAATACTGCGCAAACG
CAGGAAAGATTCACTATCGATACGGTTACGATCGATCCCACCATTCGCCTTTCGGATCCATCTATTGATGATCAGTATGA
GGCAACCAGCCTGCGTCCTGAGTTCAAAGGGCTCGCCGAAGCGTTCTCGACGATTATGATTCAGTGGGATGGGAAAGTGG
TCGGCTCGGCAAACGCCAATGCGAATGGTGAATGGAGTTGGACGCCGCCATCAGTATTAGCGCCAGGCTCCTATGTTGTG
AGCATTGTTGCCAAAGATAAAGCGGGTAATGAATCGTCGCAGGTCGACTTTCCTGTAGTAATACCTGTTATTGATGTCAC
GCCTCCAACCATAAAGCTCAGCGAGGAGAGCGATAGTGGTGCCTTAGGAGACTTTACGACGAATAATAAAACGCCGACCC
TGATTGGGAGCACGTTACCTAATACAATTGTGAGTATTTATGTGGATGGCGTGAAGGTCGGCGAGGCGACAGCGGATACA
GCGGGCCGATATACTTTCCAGTTATCGGAAATGAAAGATGGCCATTATGTCGTCCAGGTGGGTATCGTCAACCCTCGCGA
TAATAGCGAACTGCGTTCCACCGCCGTTGATGTCACTATCGATACCGAGGTTGCTGAACTGGTATGGAATATATCTGGAA
TGCATGAGGGCGGATATATCAACACGGTGACGCCGGAGATTGGCGGCACCAGTGAGCCAAACAGCAAAATCACTATCTTT
GTGAATGGCGTTGAAAAAGCGATTGCTTATACGACAGGCGCAGGACACTGGGGCGTAGTATTACCCGCTTTGGGTAATGA
CGGTAATTATGAATTAACGTTTAAAGTTGAAGACGTTGCCGGCAATATCAGAGAGTTTGGTCCGCAGAATGTGATACTGG
ATACGGTAATTTCGCCGTTAACCGTGGTATTACGCGAAGCTGATGACAGTGGCAAAGTTGGCGACTGGATCACCAATAAA
TCTCATGTCACCATCGATGGTACTGCCGAAGCCGGAAGTACTTTGACCATCAGGAATCCGCAGGGAGTGGTTATTGCTAC
CCTGGTGGTAGGCAATGATGGTCGATGGAGCGCAGAATTAGATCTGCGTGAAGGTAGTAATGCCTTTGTCGTGGTATCGG
AAGATAAAGCGGGCAACGGCCAACAAAAAGATATTCTGATAGAACATGATACGCAGATTGAAATCAGCGATATTTCATTA
AGTCGGGATACTAATAGCGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTACTGGTTGCCATGACCGATCC
CGGCGCGACGGTACAGGTTTATATTAATGGTGTGTTACAAGGCACAGTAGAGGCGAGTTCGTCAGGTAATATTAGCTATA
CCATGCCGGCAAATAGCGCCGACGGCGAGTATCAGGTGCAATTTGTTGCTACGGATACTGCTGGTAACCGGGTTGAATCT
GCGATTACGACCGTGACAATCGATTCTCAAATTGCTGTCTTTGATATTGATGAAGATTCATTACCGGCCCTCTCTAATAA
CCGGGCGTTGTCAGTCTCAGGCGTCGGGGAGGCTGGTTCTCAGGTCAGCATCTTTGTCGATGGTAAATTAGTCAACGTTG
TTATGGTTGAGGCTGATGGCTCATGGCGCGCGCCGATACTGCTGCAAGATGATGGTACGTTTAATATTCATTTCAGCATT
ACTGACGTTGCTGGCAACACTCAAGTAAGCAAGAATTACAGTGTGGATGTCGATTCATCAACCGACTTCCCAACGCTCAA
CCTTGAAGATGCGAGCAACTCTGGTTCACTTGACGATCTGATTACTAATCACAACAAGCCTGTGTTAGTTGGCACCGCAG
AAGCGGGAGCCACAATCCATATTTATGTGGATGAAAAGATCGTGGCAAATGTGCTTGTGCTTGAAGATGGAACCTGGTCC
TATCAGTTTGATAATGCGTTAAAAGATGGTGAATATTCTATCCGTGTGGTTGCCGAAGACCCGGCAGGTAATACGGCAGA
ATCGCCTCGCTTACTCGTCACGATAGATACCAGTACGTTTATCGATAATCCTGCTATGGTGGCAGGTTCTGATAACGGTA
TTTTCAGTAATGATAGTATAACGAGTCAGACCCGGCCTACGTTTAGTATTTTTGGAGAAATGAACCAGAGTGTTCAGATT
TTCATTGATGGGGTGTTAGTCGATACGATCACGGTGACGGACAGAAATCAAGTTTATCGACCTGAGTCACCGTTGGGCGA
TGGTTCCCATAGCATTTATTATGTTATCACCGATAAAGCAGGCAACACGGCTACCTCGAAAACGCTAAACTTTACTATCG
ATACCTTTAATACGACGCCTGTCGCCATTGATTCTATCGGTGGACAAACGTTAGCAGAGATGACCGGTAGTGATGGCAAA
ATATATATAACGGACACGACGCGTAACTTATTGTTTAGTGGCAGTGCCGAGCCCAATAGCAAAATAGAAATCATTATTAA
TGGCTTAAATGTGGGGGAAGTTTGGGTTAATGAAAAAGGCCACTGGCAGATGCCGGTGAACCCGCTTTATTTCACAGAAG
GCCAACTGGATATCACTGTTAAATCTACGGACCGTGCTGGTAACGTAAATCAGGAAAAGTATTCCATTTGGGTCGATACG
CATATCCAGGTATTTACCAGCGAGCTTGATGACAATAAATCATCATCGAAAACGGACTGGTGGAGTAATAGCTCCACTAT
TACCATGAGAGGTATGGGGGAAATTGGCGCTACGGTATCATTAATCGTGGCAGGGGTCACGCTGGCAACCGCTGTCGTTG
CGGCTAATGGGCAGTGGGAATTATCGACCGATCAGCTTCCGGAAGGGAAATACGATATCACTTTGAGTATTGAGGATAAC
GCAGGCAACCGTAAGGAAGAGGTACATGAAATATTTATTGATCGAACGCCGCCAAACGCTCCGGTCGTAACTTATTCAGA
CATTGTCAACGATCTAATTATTATGCAGGGAACGGCGGAAGCCAAATCTCAGCTAATAATAACCGATAGTAATGGGAATA
CTTATACGTTAACCGTTCCTGATAATGGTAAATGGAGTATGGCGATCCCGTATCCATCGGAAGGGAAGTTTACCATTACG
AGTGTGGATGCGATTGGTAACCGGAGTGATGATGTCCCTCTCGATATCATGAAAGAGGTTCCCGTTATTTCATTATCTCC
AGACTCAGACAGTGGTACGGTGGGCGATAATATTACGCGCGATAAGCAACCTACCTTTATTATCGGGAATCTGGAAAGCG
ATGTTGTGGTCGTTCAGGTCGATATCAATGGGACAGTATATAATGCTGAAAAAAATGCCGATGGCGTTTGGTTCTTTACG
CCAGGTACACCGTTAGCTGATGGTTCCTATACGATATCGGTAATCGCAAGCGATGCCGCGGGTAATCAGAAAAACTCGTT
ACCCATTACCGTTACGATCGACAGTACGCTGACGGTGCCGGAGATTGCGTTGGCAGCAGGTGAAGACAATGGCGTTTCAG
ACAGCGATAACGTGACGAATCACACCCAGCCTAAGTTCACGCTGCAGCATATTGATGCTGATGTGACCGGGGTGACCGTA
AACGTGACGCATAACGGCGTGACAGACACCTATCAGGCGACGCAAGGCGCGGATGGCTGGACCTTCACGCCGCCAGCCGC
CTGGAATGATGGTACCTACACGCTGAGCGTGACGGTGGTGGATCGCGCGGGGAACTCACAGCAATCTGCTTCGCTAGCGG
TGACGGTTGACTCAACGGTGACGGTAACAGCGGATAGCCAGCATGACGATGCGAGCGATGACGCCACGCCAACAGCGGTT
ACTCCACCGGAGTCTGAAACAGTGAATGCCGAAAGCGATACGCATCTTCGTACAGTGCCGTCTGCGGCGGAAGAAAGCGT
GGTGAAGGAGACGGCCTATAGTATTACATTGTTAAACGCTAACTCTGGGGATGAAATAGATCGTTCAATTAGTCAGACAC
CTTCTTTTGAAATATCAGTACCTGAGAATATTGTTAATGTCAGTGTTATGTTTGAAGGAGAAGAGTTTACTCTGCCGATA
ACTAACCAGAAAGCAATATTCGAAGTTCCGCTATCTTTGGAAGATGGTGAATATACTATGGACGTGAAATTCATTGATAA
GGACGATGATTTCCTGATTAAGGAAAAAACATTCTCAGTCGATCACTCCTCGGCGGATATTGTGAACGCAATGAATGCAA
GAGGAAAGACCGAGGATGATATTAATGATTCCCCTTCCACGAGTTCTGTAGGGCACAACAATAACGGCGCTATTGATGTT
TTCGCCGTTAATGAAGTTACGCTACCTGTAGATAATCAAGAAGAACACGCATAA

Protein sequence :
MVEDLAGNVKESAPLEVRIDTTTTINNIVLLNDTGVQNDQLTNVAKPSFRIDVPGDVVQVRVTLDGGANWNVIRKNADGQ
WIFDSPNTLVDGTYTLRVEATDEAGNIANKDLVFNIDTNIQVPTIALDAGQDTGANTADNITNISRPTFTIGNVDPDVIK
VVVTIDGHDYNATKVGAGWQFTPGNAIPDGSYNITVTVEDKAGNTATSKPLPVVIDTTAEIESVTLVTDSGDSDVDNITK
VDKPQFSIVTADDITHVRVKIDNAANWIELTKGGDGRWIFNVGSALPDGQHTLLVDVTDIAGNVAQETLQFTIDTTLREP
TIVLDPTHDTGDDTNDNLTRINKPVFIIGNVDNDVSHIVVHLDGRDYTIENKGGNLTFTPDQPLSDGQHTISVTVTDIAG
NTKTSAELQIEIDTQVQIDSVTLTTDSGVNDHDNVTNATRPSFEIATPDDVTSVLVSFDGVNWTPISKNAAGQWQFTAGS
ALSDGHYTLHVQATDRAGNTANSTLGFTVDTQIDGLSVVMLDDAGKDSTDGITNITSPRFEISAREQLQSVTVILNGKSS
TLTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKISKEVSFTIDTIVSDPSIDLLDADDTGESAVDNITSVTTPRFVI
GNVPADIDTVVIRINGVSYPVTANGNNLWEFQVPVALNDGVYEVVVVFRDIAGNTSETKLPFTIDTTTSVSVRMEPASDT
GSSNSDNLTNKQNPKFEGTAEPNAKLVITIVDDKSGREVLKHTITVGADGNWSVTPNILPDGMYTINVVATDVAGNTAQT
QERFTIDTVTIDPTIRLSDPSIDDQYEATSLRPEFKGLAEAFSTIMIQWDGKVVGSANANANGEWSWTPPSVLAPGSYVV
SIVAKDKAGNESSQVDFPVVIPVIDVTPPTIKLSEESDSGALGDFTTNNKTPTLIGSTLPNTIVSIYVDGVKVGEATADT
AGRYTFQLSEMKDGHYVVQVGIVNPRDNSELRSTAVDVTIDTEVAELVWNISGMHEGGYINTVTPEIGGTSEPNSKITIF
VNGVEKAIAYTTGAGHWGVVLPALGNDGNYELTFKVEDVAGNIREFGPQNVILDTVISPLTVVLREADDSGKVGDWITNK
SHVTIDGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAELDLREGSNAFVVVSEDKAGNGQQKDILIEHDTQIEISDISL
SRDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEASSSGNISYTMPANSADGEYQVQFVATDTAGNRVES
AITTVTIDSQIAVFDIDEDSLPALSNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEADGSWRAPILLQDDGTFNIHFSI
TDVAGNTQVSKNYSVDVDSSTDFPTLNLEDASNSGSLDDLITNHNKPVLVGTAEAGATIHIYVDEKIVANVLVLEDGTWS
YQFDNALKDGEYSIRVVAEDPAGNTAESPRLLVTIDTSTFIDNPAMVAGSDNGIFSNDSITSQTRPTFSIFGEMNQSVQI
FIDGVLVDTITVTDRNQVYRPESPLGDGSHSIYYVITDKAGNTATSKTLNFTIDTFNTTPVAIDSIGGQTLAEMTGSDGK
IYITDTTRNLLFSGSAEPNSKIEIIINGLNVGEVWVNEKGHWQMPVNPLYFTEGQLDITVKSTDRAGNVNQEKYSIWVDT
HIQVFTSELDDNKSSSKTDWWSNSSTITMRGMGEIGATVSLIVAGVTLATAVVAANGQWELSTDQLPEGKYDITLSIEDN
AGNRKEEVHEIFIDRTPPNAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSNGNTYTLTVPDNGKWSMAIPYPSEGKFTIT
SVDAIGNRSDDVPLDIMKEVPVISLSPDSDSGTVGDNITRDKQPTFIIGNLESDVVVVQVDINGTVYNAEKNADGVWFFT
PGTPLADGSYTISVIASDAAGNQKNSLPITVTIDSTLTVPEIALAAGEDNGVSDSDNVTNHTQPKFTLQHIDADVTGVTV
NVTHNGVTDTYQATQGADGWTFTPPAAWNDGTYTLSVTVVDRAGNSQQSASLAVTVDSTVTVTADSQHDDASDDATPTAV
TPPESETVNAESDTHLRTVPSAAEESVVKETAYSITLLNANSGDEIDRSISQTPSFEISVPENIVNVSVMFEGEEFTLPI
TNQKAIFEVPLSLEDGEYTMDVKFIDKDDDFLIKEKTFSVDHSSADIVNAMNARGKTEDDINDSPSTSSVGHNNNGAIDV
FAVNEVTLPVDNQEEHA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
STY4459 NP_458559.1 large repetitive protein Not tested SPI-4 Protein 0.0 99