Gene Information

Name : STBHUCCB_44090 (STBHUCCB_44090)
Accession : YP_005219840.1
Strain : Salmonella enterica P-stx-12
Genome accession: NC_016832
Putative virulence/resistance : Unknown
Product : Large repetitive protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 4309378 - 4316151 bp
Length : 6774 bp
Strand : +
Note : similar to Large repetitive protein of Salmonella enterica UniRef RepID=B4TRI9_SALSV

DNA sequence :
GTGGTGGAAGATCTGGCGGGGAATGTAAAAGAATCTGCGCCGTTAGAGGTACGTATTGATACCACGACAACCATTAACAA
TATCGTATTGCTTAATGATACTGGCGTGCAGAATGATCAATTAACGAATGTTGCCAAACCGTCATTCAGAATTGACGTTC
CCGGTGATGTCGTCCAGGTACGCGTAACCCTGGATGGTGGCGCTAACTGGAATGTGATACGCAAAAATGCCGACGGACAG
TGGATTTTTGACAGCCCGAATACTCTGGTTGACGGCACATATACCCTTCGCGTAGAGGCCACGGATGAGGCAGGTAATAT
TGCAAATAAAGATTTAGTATTTAATATCGATACTAATATACAGGTTCCGACTATTGCTTTAGACGCAGGACAAGATACCG
GAGCGAATACAGCCGATAATATTACTAATATTTCACGACCCACCTTTACGATTGGTAATGTTGACCCCGATGTTATCAAA
GTCGTGGTGACGATTGATGGTCATGATTATAACGCGACTAAGGTTGGGGCTGGTTGGCAATTTACACCAGGCAATGCCAT
TCCGGATGGTTCTTATAATATTACCGTTACGGTTGAAGATAAGGCCGGAAATACCGCGACATCGAAACCATTACCTGTTG
TGATAGATACGACGGCTGAAATTGAAAGCGTCACGTTGGTTACAGATAGCGGTGATAGCGATGTAGATAACATTACCAAA
GTCGACAAGCCGCAGTTTAGTATTGTTACCGCTGATGATATTACCCATGTGCGCGTTAAAATCGATAACGCCGCTAATTG
GATTGAACTCACAAAAGGAGGGGATGGTCGCTGGATATTTAATGTCGGTTCGGCATTACCTGATGGGCAACACACTCTCT
TGGTTGATGTGACTGATATCGCCGGCAACGTTGCGCAAGAAACGCTGCAGTTTACGATTGATACGACTCTGCGAGAGCCG
ACAATTGTACTCGATCCCACCCATGATACTGGTGATGATACTAATGATAATCTTACCAGGATTAACAAACCGGTGTTTAT
TATCGGTAATGTCGATAATGATGTATCACACATTGTGGTTCATCTTGATGGTCGGGATTACACCATTGAAAACAAAGGGG
GGAATTTAACCTTTACGCCGGATCAACCGCTGTCTGACGGTCAGCATACGATCTCTGTTACCGTAACGGATATTGCTGGT
AATACCAAAACATCGGCCGAACTGCAGATTGAAATCGACACGCAGGTTCAGATTGACAGTGTTACGTTAACAACAGATAG
CGGCGTCAACGATCACGATAATGTCACCAATGCTACCCGTCCCTCTTTTGAAATTGCAACGCCTGATGATGTGACATCGG
TGCTGGTTTCTTTCGATGGCGTAAACTGGACGCCCATCAGTAAAAATGCGGCCGGGCAGTGGCAATTTACTGCAGGTAGC
GCATTGTCTGATGGTCATTATACTCTCCATGTCCAGGCGACGGATCGGGCAGGGAATACGGCAAATTCCACGCTGGGCTT
TACCGTGGATACGCAGATTGACGGCCTGAGCGTCGTGATGCTGGACGACGCCGGAAAGGATTCTACGGATGGTATTACGA
ATATTACCTCTCCACGTTTTGAAATTTCAGCCAGAGAACAGTTGCAGAGCGTGACGGTAATTTTAAACGGGAAATCCAGC
ACCCTGACTCAGGGGGCAGGTAATAAATGGCTGTTTACCCCTGATACACCGTTAGTGGATGGAACTTACAAAATAGAAAT
AGTGGCTGAAGATATCGCAGGTAATAAAATTAGCAAAGAGGTATCATTCACAATAGACACTATTGTTTCTGATCCCAGTA
TTGATTTGCTGGATGCGGATGATACTGGCGAAAGCGCTGTTGATAATATTACGAGTGTCACTACACCACGTTTCGTTATT
GGCAATGTACCCGCCGATATTGATACTGTTGTAATCAGAATTAACGGCGTTTCTTATCCGGTTACGGCAAATGGCAATAA
CCTCTGGGAATTTCAGGTTCCCGTTGCGTTAAACGATGGCGTATATGAAGCCGTTGTTGTCTTCAGAGATATTGCCGGAA
ATACTTCTGAAACTAAGCTGCCCTTTACCATTGATACCACGACAAGCGTCAGTGTCAGAATGGAGCCAGCGTCTGATACC
GGCAGCTCCAATAGCGATAACCTTACGAATAAGCAAAATCCCAAATTCGAAGGTACTGCAGAGCCCAATGCGAAACTGGT
GATTACCATTGTTGACGATAAGTCAGGTCGGGAGGTTTTAAAACACACGATTACGGTTGGCGCCGATGGCAACTGGAGTG
TGACGCCGAATATACTGCCGGATGGCATGTATACCATCAACGTCGTCGCAACAGATGTCGCGGGAAATACTGCGCAAACG
CAGGAAAGATTCACTATCGATACGGTTACGATCGATCCCACCATTCGCCTTTCGGATCCATCTATTGATGATCAGTATGA
GGCAACCAGCCTGCGTCCTGAGTTCAAAGGGCTCGCCGAAGCGTTCTCGACGATTATGATTCAGTGGGATGGGAAAGTGG
TCGGCTCGGCAAACGCCAATGCGAATGGTGAATGGAGTTGGACGCCGCCATCAGTATTAGCGCCAGGCTCCTATGTTGTG
AGCATTGTTGCCAAAGATAAAGCGGGTAATGAATCGTCGCAGGTCGACTTTCCTGTAGTAATACCTGTTATTGATGTCAC
GCCTCCAACCATAAAGCTCAGCGAGGAGAGCGATAGTGGTGCCTTAGGAGACTTTACGACGAATAATAAAACGCCGACCC
TGATTGGGAGCACGTTACCTAATACAATTGTGAGTATTTATGTGGATGGCGTGAAGGTCGGCGAGGCGACAGCGGATACA
GCGGGCCGATATACTTTCCAGTTATCGGAAATGAAAGATGGCCATTATGTCGTCCAGGTGGGTATCGTCAACCCTCGCGA
TAATAGCGAACTGCGTTCCACCGCCGTTGATGTCACTATCGATACCGAGGTTGCTGAACTGGTATGGAATATATCTGGAA
TGCATGAGGGCGGATATATCAACACGGTGACGCCGGAGATTGGCGGCACCAGTGAGCCAAACAGCAAAATCACTATCTTT
GTGAATGGCGTTGAAAAAGCGATTGCTTATACGACAGGCGCAGGACACTGGGGCGTAGTATTACCCGCTTTGGGTAATGA
CGGTAATTATGAATTAACGTTTAAAGTTGAAGACGTTGCCGGCAATATCAGAGAGTTTGGTCCGCAGAATGTGATACTGG
ATACGGTAATTTCGCCGTTAACCGTGGTATTACGCGAAGCTGATGACAGTGGCAAAGTTGGCGACTGGATCACCAATAAA
TCTCATGTCACCATCGATGGTACTGCCGAAGCCGGAAGTACTTTGACCATCAGGAATCCGCAGGGAGTGGTTATTGCTAC
CCTGGTGGTAGGCAATGATGGTCGATGGAGCGCAGAATTAGATCTGCGTGAAGGTAGTAATGCCTTTGTCGTGGTATCGG
AAGATAAAGCGGGCAACGGCCAACAAAAAGATATTCTGATAGAACATGATACGCAGATTGAAATCAGCGATATTTCATTA
AGTCGGGATACTAATAGCGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTACTGGTTGCCATGACCGATCC
CGGCGCGACGGTACAGGTTTATATTAATGGTGTGTTACAAGGCACAGTAGAGGCGAGTTCGTCAGGTAATATTAGCTATA
CCATGCCGGCAAATAGCGCCGACGGCGAGTATCAGGTGCAATTTGTTGCTACGGATACTGCTGGTAACCGGGTTGAATCT
GCGATTACGACCGTGACAATCGATTCTCAAATTGCTGTCTTTGATATTGATGAAGATTCATTACCGGCCCTCTCTAATAA
CCGGGCGTTGTCAGTCTCAGGCGTCGGGGAGGCTGGTTCTCAGGTCAGCATCTTTGTCGATGGTAAATTAGTCAACGTTG
TTATGGTTGAGGCTGATGGCTCATGGCGCGCGCCGATACTGCTGCAAGATGATGGTACGTTTAATATTCATTTCAGCATT
ACTGACGTTGCTGGCAACACTCAAGTAAGCAAGAATTACAGTGTGGATGTCGATTCATCAACCGACTTCCCAACGCTCAA
CCTTGAAGATGCGAGCAACTCTGGTTCACTTGACGATCTGATTACTAATCACAACAAGCCTGTGTTAGTTGGCACCGCAG
AAGCGGGAGCCACAATCCATATTTATGTGGATGAAAAGATCGTGGCAAATGTGCTTGTGCTTGAAGATGGAACCTGGTCC
TATCAGTTTGATAATGCGTTAAAAGATGGTGAATATTCTATCCGTGTGGTTGCCGAAGACCCGGCAGGTAATACGGCAGA
ATCGCCTCGCTTACTCGTCACGATAGATACCAGTACGTTTATCGATAATCCTGCTATGGTGGCAGGTTCTGATAACGGTA
TTTTCAGTAATGATAGTATAACGAGTCAGACCCGGCCTACGTTTAGTATTTTTGGAGAAATGAACCAGAGTGTTCAGATT
TTCATTGATGGGGTGTTAGTCGATACGATCACGGTGACGGACAGAAATCAAGTTTATCGACCTGAGTCACCGTTGGGCGA
TGGTTCCCATAGCATTTATTATGTTATCACCGATAAAGCAGGCAACACGGCTACCTCGAAAACGCTAAACTTTACTATCG
ATACCTTTAATACGACGCCTGTCGCCATTGATTCTATCGGTGGACAAACGTTAGCAGAGATGACCGGTAGTGATGGCAAA
ATATATATAACGGACACGACGCGTAACTTATTGTTTAGTGGCAGTGCCGAGCCCAATAGCAAAATAGAAATCATTATTAA
TGGCTTAAATGTGGGGGAAGTTTGGGTTAATGAAAAAGGCCACTGGCAGATGCCGGTGAACCCGCTTTATTTCACAGAAG
GCCAACTGGATATCACTGTTAAATCTACGGACCGTGCTGGTAACGTAAATCAGGAAAAGTATTCCATTTGGGTCGATACG
CATATCCAGGTATTTACCAGCGAGCTTGATGACAATAAATCATCATCGAAAACGGACTGGTGGAGTAATAGCTCCACTAT
TACCATGAGAGGTATGGGGGAAATTGGCGCTACGGTATCATTAATCGTGGCAGGGGTCACGCTGGCAACCGCTGTCGTTG
CGGCTAATGGGCAGTGGGAATTATCGACCGATCAGCTTCCGGAAGGGAAATACGATATCACTTTGAGTATTGAGGATAAC
GCAGGCAACCGTAAGGAAGAGGTACATGAAATATTTATTGATCGAACGCCGCCAAACGCTCCGGTCGTAACTTATTCAGA
CATTGTCAACGATCTAATTATTATGCAGGGAACGGCGGAAGCCAAATCTCAGCTAATAATAACCGATAGTAATGGGAATA
CTTATACGTTAACCGTTCCTGATAATGGTAAATGGAGTATGGCGATCCCGTATCCATCGGAAGGGAAGTTTACCATTACG
AGTGTGGATGCGATTGGTAACCGGAGTGATGATGTCCCTCTCGATATCATGAAAGAGGTTCCCGTTATTTCATTATCTCC
AGACTCAGACAGTGGTACGGTGGGCGATAATATTACGCGCGATAAGCAACCTACCTTTATTATCGGGAATCTGGAAAGCG
ATGTTGTGGTCGTTCAGGTCGATATCAATGGGACAGTATATAATGCTGAAAAAAATGCCGATGGCGTTTGGTTCTTTACG
CCAGGTACACCGTTAGCTGATGGTTCCTATACGATATCGGTAATCGCAAGCGATGCCGCGGGTAATCAGAAAAACTCGTT
ACCCATTACCGTTACGATCGACAGTACGCTGACGGTGCCGGAGATTGCGTTGGCAGCAGGTGAAGACAATGGCGTTTCAG
ACAGCGATAACGTGACGAATCACACCCAGCCTAAGTTCACGCTGCAGCATATTGATGCTGATGTGACCGGGGTGACCGTA
AACGTGACGCATAACGGCGTGACAGACACCTATCAGGCGACGCAAGGCGCGGATGGCTGGACCTTCACGCCGCCAGCCGC
CTGGAATGATGGTACCTACACGCTGAGCGTGACGGTGGTGGATCGCGCGGGGAACTCACAGCAATCTGCTTCGCTAGCGG
TGACGGTTGACTCAACGGTGACGGTAACAGCGGATAGCCAGCATGACGATGCGAGCGATGACGCCACGCCAACAGCGGTT
ACTCCACCGGAGTCTGAAACAGTGAATGCCGAAAGCGATACGCATCTTCGTACAGTGCCGTCTGCGGCGGAAGAAAGCGT
GGTGAAGGAGACGGCCTATAGTATTACATTGTTAAACGCTAACTCTGGGGATGAAATAGATCGTTCAATTAGTCAGACAC
CTTCTTTTGAAATATCAGTACCTGAGAATATTGTTAATGTCAGTGTTATGTTTGAAGGAGAAGAGTTTACTCTGCCGATA
ACTAACCAGAAAGCAATATTCGAAGTTCCGCTATCTTTGGAAGATGGTGAATATACTATGGACGTGAAATTCATTGATAA
GGACGATGATTTCCTGATTAAGGAAAAAACATTCTCAGTCGATCACTCCTCGGCGGATATTGTGAACGCAATGAATGCAA
GAGGAAAGACCGAGGATGATATTAATGATTCCCCTTCCACGAGTTCTGTAGGGCACAACAATAACGGCGCTATTGATGTT
TTCGCCGTTAATGAAGTTACGCTACCTGTAGATAATCAAGAAGAACACGCATAA

Protein sequence :
MVEDLAGNVKESAPLEVRIDTTTTINNIVLLNDTGVQNDQLTNVAKPSFRIDVPGDVVQVRVTLDGGANWNVIRKNADGQ
WIFDSPNTLVDGTYTLRVEATDEAGNIANKDLVFNIDTNIQVPTIALDAGQDTGANTADNITNISRPTFTIGNVDPDVIK
VVVTIDGHDYNATKVGAGWQFTPGNAIPDGSYNITVTVEDKAGNTATSKPLPVVIDTTAEIESVTLVTDSGDSDVDNITK
VDKPQFSIVTADDITHVRVKIDNAANWIELTKGGDGRWIFNVGSALPDGQHTLLVDVTDIAGNVAQETLQFTIDTTLREP
TIVLDPTHDTGDDTNDNLTRINKPVFIIGNVDNDVSHIVVHLDGRDYTIENKGGNLTFTPDQPLSDGQHTISVTVTDIAG
NTKTSAELQIEIDTQVQIDSVTLTTDSGVNDHDNVTNATRPSFEIATPDDVTSVLVSFDGVNWTPISKNAAGQWQFTAGS
ALSDGHYTLHVQATDRAGNTANSTLGFTVDTQIDGLSVVMLDDAGKDSTDGITNITSPRFEISAREQLQSVTVILNGKSS
TLTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKISKEVSFTIDTIVSDPSIDLLDADDTGESAVDNITSVTTPRFVI
GNVPADIDTVVIRINGVSYPVTANGNNLWEFQVPVALNDGVYEAVVVFRDIAGNTSETKLPFTIDTTTSVSVRMEPASDT
GSSNSDNLTNKQNPKFEGTAEPNAKLVITIVDDKSGREVLKHTITVGADGNWSVTPNILPDGMYTINVVATDVAGNTAQT
QERFTIDTVTIDPTIRLSDPSIDDQYEATSLRPEFKGLAEAFSTIMIQWDGKVVGSANANANGEWSWTPPSVLAPGSYVV
SIVAKDKAGNESSQVDFPVVIPVIDVTPPTIKLSEESDSGALGDFTTNNKTPTLIGSTLPNTIVSIYVDGVKVGEATADT
AGRYTFQLSEMKDGHYVVQVGIVNPRDNSELRSTAVDVTIDTEVAELVWNISGMHEGGYINTVTPEIGGTSEPNSKITIF
VNGVEKAIAYTTGAGHWGVVLPALGNDGNYELTFKVEDVAGNIREFGPQNVILDTVISPLTVVLREADDSGKVGDWITNK
SHVTIDGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAELDLREGSNAFVVVSEDKAGNGQQKDILIEHDTQIEISDISL
SRDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEASSSGNISYTMPANSADGEYQVQFVATDTAGNRVES
AITTVTIDSQIAVFDIDEDSLPALSNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEADGSWRAPILLQDDGTFNIHFSI
TDVAGNTQVSKNYSVDVDSSTDFPTLNLEDASNSGSLDDLITNHNKPVLVGTAEAGATIHIYVDEKIVANVLVLEDGTWS
YQFDNALKDGEYSIRVVAEDPAGNTAESPRLLVTIDTSTFIDNPAMVAGSDNGIFSNDSITSQTRPTFSIFGEMNQSVQI
FIDGVLVDTITVTDRNQVYRPESPLGDGSHSIYYVITDKAGNTATSKTLNFTIDTFNTTPVAIDSIGGQTLAEMTGSDGK
IYITDTTRNLLFSGSAEPNSKIEIIINGLNVGEVWVNEKGHWQMPVNPLYFTEGQLDITVKSTDRAGNVNQEKYSIWVDT
HIQVFTSELDDNKSSSKTDWWSNSSTITMRGMGEIGATVSLIVAGVTLATAVVAANGQWELSTDQLPEGKYDITLSIEDN
AGNRKEEVHEIFIDRTPPNAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSNGNTYTLTVPDNGKWSMAIPYPSEGKFTIT
SVDAIGNRSDDVPLDIMKEVPVISLSPDSDSGTVGDNITRDKQPTFIIGNLESDVVVVQVDINGTVYNAEKNADGVWFFT
PGTPLADGSYTISVIASDAAGNQKNSLPITVTIDSTLTVPEIALAAGEDNGVSDSDNVTNHTQPKFTLQHIDADVTGVTV
NVTHNGVTDTYQATQGADGWTFTPPAAWNDGTYTLSVTVVDRAGNSQQSASLAVTVDSTVTVTADSQHDDASDDATPTAV
TPPESETVNAESDTHLRTVPSAAEESVVKETAYSITLLNANSGDEIDRSISQTPSFEISVPENIVNVSVMFEGEEFTLPI
TNQKAIFEVPLSLEDGEYTMDVKFIDKDDDFLIKEKTFSVDHSSADIVNAMNARGKTEDDINDSPSTSSVGHNNNGAIDV
FAVNEVTLPVDNQEEHA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
STY4459 NP_458559.1 large repetitive protein Not tested SPI-4 Protein 0.0 99