Gene Information

Name : STY4459
Accession : NP_458559.1
Strain : Salmonella enterica CT18
Genome accession: NC_003198
Putative virulence/resistance : Unknown
Product : large repetitive protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 4337507 - 4344277 bp
Length : 6771 bp
Strand : +
Note : Similar to Synechocystis sp. hypothetical 308.8 kDa protein slr0364 TR:Q55582 (EMBL:D63999) (3029 aa) fasta scores:E(): 0, 26.2% id in 2291 aa. Also similar to Salmonella typhimurium SPI-4 hypothetical proteins: TR:O85324 (EMBL:AF060869) (1512 aa) fasta s

DNA sequence :
GTGGAAGATCTGGCGGGGAATGTAAAAGAATCTGCGCCGTTAGAGGTACGTATTGATACCACGACAACCATTAACAATAT
CGTATTGCTTAATGATACTGGCGTGCAGAATGATCAATTAACGAATGTTGCCAAACCGTCATTCAGAATTGACGTTCCCG
GTGATGTCGTCCAGGTACGCGTAACCCTGGATGGTGGCGCTAACTGGAATGTGATACGCAAAAATGCCGACGGACAGTGG
ATTTTTGACAGCCCGAATACTCTGGTTGACGGCACATATACCCTTCGCGTAGAGGCCACGGATGAGGCAGGTAATATTGC
AAATAAAGATTTAGTATTTAATATCGATACTAATATACAGGTTCCGACTATTGCTTTAGACGCAGGACAAGATACCGGAG
CGAATACAGCCGATAATATTACTAATATTTCACGACCCACCTTTACGATTGGTAATGTTGACCCCGATGTTATCAAAGTC
GTGGTGACGATTGATGGTCATGATTATAACGCGACTAAGGTTGGGGCTGGTTGGCAATTTACACCAGGCAATGCCATTCC
GGATGGTTCTTATAATATTACCGTTACGGTTGAAGATAAGGCCGGAAATACCGCGACATCGAAACCATTACCTGTTGTGA
TAGATACGACGGCTGAAATTGAAAGCGTCACGTTGGTTACAGATAGCGGTGATAGCGATGTAGATAACATTACCAAAGTC
GACAAGCCGCAGTTTAGTATTGTTACCGCTGATGATATTACCCATGTGCGCGTTAAAATCGATAACGCCGCTAATTGGAT
TGAACTCACAAAAGGAGGGGATGGTCGCTGGATATTTAATGTCGGTTCGGCATTACCTGATGGGCAACACACTCTCTTGG
TTGATGTGACTGATATCGCCGGCAACGTTGCGCAAGAAACGCTGCAGTTTACGATTGATACGACTCTGCGAGAGCCGACA
ATTGTACTCGATCCCACCCATGATACTGGTGATGATACTAATGATAATCTTACCAGGATTAACAAACCGGTGTTTATTAT
CGGTAATGTCGATAATGATGTATCACACATTGTGGTTCATCTTGATGGTCGGGATTACACCATTGAAAACAAAGGGGGGA
ATTTAACCTTTACGCCGGATCAACCGCTGTCTGACGGTCAGCATACGATCTCTGTTACCGTAACGGATATTGCTGGTAAT
ACCAAAACATCGGCCGAACTGCAGATTGAAATCGACACGCAGGTTCAGATTGACAGTGTTACGTTAACAACAGATAGCGG
CGTCAACGATCACGATAATGTCACCAATGCTACCCGTCCCTCTTTTGAAATTGCAACGCCTGATGATGTGACATCGGTGC
TGGTTTCTTTCGATGGCGTAAACTGGACGCCCATCAGTAAAAATGCGGCCGGGCAGTGGCAATTTACTGCAGGTAGCGCA
TTGTCTGATGGTCATTATACTCTCCATGTCCAGGCGACGGATCGGGCAGGGAATACGGCAAATTCCACGCTGGGCTTTAC
CGTGGATACGCAGATTGACGGCCTGAGCGTCGTGATGCTGGACGACGCCGGAAAGGATTCTACGGATGGTATTACGAATA
TTACCTCTCCACGTTTTGAAATTTCAGCCAGAGAACAGTTGCAGAGCGTGACGGTAATTTTAAACGGGAAATCCAGCACC
CTGACTCAGGGGGCAGGTAATAAATGGCTGTTTACCCCTGATACACCGTTAGTGGATGGAACTTACAAAATAGAAATAGT
GGCTGAAGATATCGCAGGTAATAAAATTAGCAAAGAGGTATCATTCACAATAGACACTATTGTTTCTGATCCCAGTATTG
ATTTGCTGGATGCGGATGATACTGGCGAAAGCGCTGTTGATAATATTACGAGTGTCACTACACCACGTTTCGTTATTGGC
AATGTACCCGCCGATATTGATACTGTTGTAATCAGAATTAACGGCGTTTCTTATCCGGTTACGGCAAATGGCAATAACCT
CTGGGAATTTCAGGTTCCCGTTGCGTTAAACGATGGCGTATATGAAGCCGTTGTTGTCTTCAGAGATATTGCCGGAAATA
CTTCTGAAACTAAGCTGCCCTTTACCATTGATACCACGACAAGCGTCAGTGTCAGAATGGAGCCAGCGTCTGATACCGGC
AGCTCCAATAGCGATAACCTTACGAATAAGCAAAATCCCAAATTCGAAGGTACTGCAGAGCCCAATGCGAAACTGGTGAT
TACCATTGTTGACGATAAGTCAGGTCGGGAGGTTTTAAAACACACGATTACGGTTGGCGCCGATGGCAACTGGAGTGTGA
CGCCGAATATACTGCCGGATGGCATGTATACCATCAACGTCGTCGCAACAGATGTCGCGGGAAATACTGCGCAAACGCAG
GAAAGATTCACTATCGATACGGTTACGATCGATCCCACCATTCGCCTTTCGGATCCATCTATTGATGATCAGTATGAGGC
AACCAGCCTGCGTCCTGAGTTCAAAGGGCTCGCCGAAGCGTTCTCGACGATTATGATTCAGTGGGATGGGAAAGTGGTCG
GCTCGGCAAACGCCAATGCGAATGGTGAATGGAGTTGGACGCCGCCATCAGTATTAGCGCCAGGCTCCTATGTTGTGAGC
ATTGTTGCCAAAGATAAAGCGGGTAATGAATCGTCGCAGGTCGACTTTCCTGTAGTAATACCTGTTATTGATGTCACGCC
TCCAACCATAAAGCTCAGCGAGGAGAGCGATAGTGGTGCCTTAGGAGACTTTACGACGAATAATAAAACGCCGACCCTGA
TTGGGAGCACGTTACCTAATACAATTGTGAGTATTTATGTGGATGGCGTGAAGGTCGGCGAGGCGACAGCGGATACAGCG
GGCCGATATACTTTCCAGTTATCGGAAATGAAAGATGGCCATTATGTCGTCCAGGTGGGTATCGTCAACCCTCGCGATAA
TAGCGAACTGCGTTCCACCGCCGTTGATGTCACTATCGATACCGAGGTTGCTGAACTGGTATGGAATATATCTGGAATGC
ATGAGGGCGGATATATCAACACGGTGACGCCGGAGATTGGCGGCACCAGTGAGCCAAACAGCAAAATCACTATCTTTGTG
AATGGCGTTGAAAAAGCGATTGCTTATACGACAGGCGCAGGACACTGGGGCGTAGTATTACCCGCTTTGGGTAATGACGG
TAATTATGAATTAACGTTTAAAGTTGAAGACGTTGCCGGCAATATCAGAGAGTTTGGTCCGCAGAATGTGATACTGGATA
CGGTAATTTCGCCGTTAACCGTGGTATTACGCGAAGCTGATGACAGTGGCAAAGTTGGCGACTGGATCACCAATAAATCT
CATGTCACCATCGATGGTACTGCCGAAGCCGGAAGTACTTTGACCATCAGGAATCCGCAGGGAGTGGTTATTGCTACCCT
GGTGGTAGGCAATGATGGTCGATGGAGCGCAGAATTAGATCTGCGTGAAGGTAGTAATGCCTTTGTCGTGGTATCGGAAG
ATAAAGCGGGCAACGGCCAACAAAAAGATATTCTGATAGAACATGATACGCAGATTGAAATCAGCGATATTTCATTAAGT
CGGGATACTAATAGCGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTACTGGTTGCCATGACCGATCCCGG
CGCGACGGTACAGGTTTATATTAATGGTGTGTTACAAGGCACAGTAGAGGCGAGTTCGTCAGGTAATATTAGCTATACCA
TGCCGGCAAATAGCGCCGACGGCGAGTATCAGGTGCAATTTGTTGCTACGGATACTGCTGGTAACCGGGTTGAATCTGCG
ATTACGACCGTGACAATCGATTCTCAAATTGCTGTCTTTGATATTGATGAAGATTCATTACCGGCCCTCTCTAATAACCG
GGCGTTGTCAGTCTCAGGCGTCGGGGAGGCTGGTTCTCAGGTCAGCATCTTTGTCGATGGTAAATTAGTCAACGTTGTTA
TGGTTGAGGCTGATGGCTCATGGCGCGCGCCGATACTGCTGCAAGATGATGGTACGTTTAATATTCATTTCAGCATTACT
GACGTTGCTGGCAACACTCAAGTAAGCAAGAATTACAGTGTGGATGTCGATTCATCAACCGACTTCCCAACGCTCAACCT
TGAAGATGCGAGCAACTCTGGTTCACTTGACGATCTGATTACTAATCACAACAAGCCTGTGTTAGTTGGCACCGCAGAAG
CGGGAGCCACAATCCATATTTATGTGGATGAAAAGATCGTGGCAAATGTGCTTGTGCTTGAAGATGGAACCTGGTCCTAT
CAGTTTGATAATGCGTTAAAAGATGGTGAATATTCTATCCGTGTGGTTGCCGAAGACCCGGCAGGTAATACGGCAGAATC
GCCTCGCTTACTCGTCACGATAGATACCAGTACGTTTATCGATAATCCTGCTATGGTGGCAGGTTCTGATAACGGTATTT
TCAGTAATGATAGTATAACGAGTCAGACCCGGCCTACGTTTAGTATTTTTGGAGAAATGAACCAGAGTGTTCAGATTTTC
ATTGATGGGGTGTTAGTCGATACGATCACGGTGACGGACAGAAATCAAGTTTATCGACCTGAGTCACCGTTGGGCGATGG
TTCCCATAGCATTTATTATGTTATCACCGATAAAGCAGGCAACACGGCTACCTCGAAAACGCTAAACTTTACTATCGATA
CCTTTAATACGACGCCTGTCGCCATTGATTCTATCGGTGGACAAACGTTAGCAGAGATGACCGGTAGTGATGGCAAAATA
TATATAACGGACACGACGCGTAACTTATTGTTTAGTGGCAGTGCCGAGCCCAATAGCAAAATAGAAATCATTATTAATGG
CTTAAATGTGGGGGAAGTTTGGGTTAATGAAAAAGGCCACTGGCAGATGCCGGTGAACCCGCTTTATTTCACAGAAGGCC
AACTGGATATCACTGTTAAATCTACGGACCGTGCTGGTAACGTAAATCAGGAAAAGTATTCCATTTGGGTCGATACGCAT
ATCCAGGTATTTACCAGCGAGCTTGATGACAATAAATCATCATCGAAAACGGACTGGTGGAGTAATAGCTCCACTATTAC
CATGAGAGGTATGGGGGAAATTGGCGCTACGGTATCATTAATCGTGGCAGGGGTCACGCTGGCAACCGCTGTCGTTGCGG
CTAATGGGCAGTGGGAATTATCGACCGATCAGCTTCCGGAAGGGAAATACGATATCACTTTGAGTATTGAGGATAACGCA
GGCAACCGTAAGGAAGAGGTACATGAAATATTTATTGATCGAACGCCGCCAAACGCTCCGGTCGTAACTTATTCAGACAT
TGTCAACGATCTAATTATTATGCAGGGAACGGCGGAAGCCAAATCTCAGCTAATAATAACCGATAGTAATGGGAATACTT
ATACGTTAACCGTTCCTGATAATGGTAAATGGAGTATGGCGATCCCGTATCCATCGGAAGGGAAGTTTACCATTACGAGT
GTGGATGCGATTGGTAACCGGAGTGATGATGTCCCTCTCGATATCATGAAAGAGGTTCCCGTTATTTCATTATCTCCAGA
CTCAGACAGTGGTACGGTGGGCGATAATATTACGCGCGATAAGCAACCTACCTTTATTATCGGGAATCTGGAAAGCGATG
TTGTGGTCGTTCAGGTCGATATCAATGGGACAGTATATAATGCTGAAAAAAATGCCGATGGCGTTTGGTTCTTTACGCCA
GGTACACCGTTAGCTGATGGTTCCTATACGATATCGGTAATCGCAAGCGATGCCGCGGGTAATCAGAAAAACTCGTTACC
CATTACCGTTACGATCGACAGTACGCTGACGGTGCCGGAGATTGCGTTGGCAGCAGGTGAAGACAATGGCGTTTCAGACA
GCGATAACGTGACGAATCACACCCAGCCTAAGTTCACGCTGCAGCATATTGATGCTGATGTGACCGGGGTGACCGTAAAC
GTGACGCATAACGGCGTGACAGACACCTATCAGGCGACGCAAGGCGCGGATGGCTGGACCTTCACGCCGCCAGCCGCCTG
GAATGATGGTACCTACACGCTGAGCGTGACGGTGGTGGATCGCGCGGGGAACTCACAGCAATCTGCTTCGCTAGCGGTGA
CGGTTGACTCAACGGTGACGGTAACAGCGGATAGCCAGCATGACGATGCGAGCGATGACGCCACGCCAACAGCGGTTACT
CCACCGGAGTCTGAAACAGTGAATGCCGAAAGCGATACGCATCTTCGTACAGTGCCGTCTGCGGCGGAAGAAAGCGTGGT
GAAGGAGACGGCCTATAGTATTACATTGTTAAACGCTAACTCTGGGGATGAAATAGATCGTTCAATTAGTCAGACACCTT
CTTTTGAAATATCAGTACCTGAGAATATTGTTAATGTCAGTGTTATGTTTGAAGGAGAAGAGTTTACTCTGCCGATAACT
AACCAGAAAGCAATATTCGAAGTTCCGCTATCTTTGGAAGATGGTGAATATACTATGGACGTGAAATTCATTGATAAGGA
CGATGATTTCCTGATTAAGGAAAAAACATTCTCAGTCGATCACTCCTCGGCGGATATTGTGAACGCAATGAATGCAAGAG
GAAAGACCGAGGATGATATTAATGATTCCCCTTCCACGAGTTCTGTAGGGCACAACAATAACGGCGCTATTGATGTTTTC
GCCGTTAATGAAGTTACGCTACCTGTAGATAATCAAGAAGAACACGCATAA

Protein sequence :
MEDLAGNVKESAPLEVRIDTTTTINNIVLLNDTGVQNDQLTNVAKPSFRIDVPGDVVQVRVTLDGGANWNVIRKNADGQW
IFDSPNTLVDGTYTLRVEATDEAGNIANKDLVFNIDTNIQVPTIALDAGQDTGANTADNITNISRPTFTIGNVDPDVIKV
VVTIDGHDYNATKVGAGWQFTPGNAIPDGSYNITVTVEDKAGNTATSKPLPVVIDTTAEIESVTLVTDSGDSDVDNITKV
DKPQFSIVTADDITHVRVKIDNAANWIELTKGGDGRWIFNVGSALPDGQHTLLVDVTDIAGNVAQETLQFTIDTTLREPT
IVLDPTHDTGDDTNDNLTRINKPVFIIGNVDNDVSHIVVHLDGRDYTIENKGGNLTFTPDQPLSDGQHTISVTVTDIAGN
TKTSAELQIEIDTQVQIDSVTLTTDSGVNDHDNVTNATRPSFEIATPDDVTSVLVSFDGVNWTPISKNAAGQWQFTAGSA
LSDGHYTLHVQATDRAGNTANSTLGFTVDTQIDGLSVVMLDDAGKDSTDGITNITSPRFEISAREQLQSVTVILNGKSST
LTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKISKEVSFTIDTIVSDPSIDLLDADDTGESAVDNITSVTTPRFVIG
NVPADIDTVVIRINGVSYPVTANGNNLWEFQVPVALNDGVYEAVVVFRDIAGNTSETKLPFTIDTTTSVSVRMEPASDTG
SSNSDNLTNKQNPKFEGTAEPNAKLVITIVDDKSGREVLKHTITVGADGNWSVTPNILPDGMYTINVVATDVAGNTAQTQ
ERFTIDTVTIDPTIRLSDPSIDDQYEATSLRPEFKGLAEAFSTIMIQWDGKVVGSANANANGEWSWTPPSVLAPGSYVVS
IVAKDKAGNESSQVDFPVVIPVIDVTPPTIKLSEESDSGALGDFTTNNKTPTLIGSTLPNTIVSIYVDGVKVGEATADTA
GRYTFQLSEMKDGHYVVQVGIVNPRDNSELRSTAVDVTIDTEVAELVWNISGMHEGGYINTVTPEIGGTSEPNSKITIFV
NGVEKAIAYTTGAGHWGVVLPALGNDGNYELTFKVEDVAGNIREFGPQNVILDTVISPLTVVLREADDSGKVGDWITNKS
HVTIDGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAELDLREGSNAFVVVSEDKAGNGQQKDILIEHDTQIEISDISLS
RDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEASSSGNISYTMPANSADGEYQVQFVATDTAGNRVESA
ITTVTIDSQIAVFDIDEDSLPALSNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEADGSWRAPILLQDDGTFNIHFSIT
DVAGNTQVSKNYSVDVDSSTDFPTLNLEDASNSGSLDDLITNHNKPVLVGTAEAGATIHIYVDEKIVANVLVLEDGTWSY
QFDNALKDGEYSIRVVAEDPAGNTAESPRLLVTIDTSTFIDNPAMVAGSDNGIFSNDSITSQTRPTFSIFGEMNQSVQIF
IDGVLVDTITVTDRNQVYRPESPLGDGSHSIYYVITDKAGNTATSKTLNFTIDTFNTTPVAIDSIGGQTLAEMTGSDGKI
YITDTTRNLLFSGSAEPNSKIEIIINGLNVGEVWVNEKGHWQMPVNPLYFTEGQLDITVKSTDRAGNVNQEKYSIWVDTH
IQVFTSELDDNKSSSKTDWWSNSSTITMRGMGEIGATVSLIVAGVTLATAVVAANGQWELSTDQLPEGKYDITLSIEDNA
GNRKEEVHEIFIDRTPPNAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSNGNTYTLTVPDNGKWSMAIPYPSEGKFTITS
VDAIGNRSDDVPLDIMKEVPVISLSPDSDSGTVGDNITRDKQPTFIIGNLESDVVVVQVDINGTVYNAEKNADGVWFFTP
GTPLADGSYTISVIASDAAGNQKNSLPITVTIDSTLTVPEIALAAGEDNGVSDSDNVTNHTQPKFTLQHIDADVTGVTVN
VTHNGVTDTYQATQGADGWTFTPPAAWNDGTYTLSVTVVDRAGNSQQSASLAVTVDSTVTVTADSQHDDASDDATPTAVT
PPESETVNAESDTHLRTVPSAAEESVVKETAYSITLLNANSGDEIDRSISQTPSFEISVPENIVNVSVMFEGEEFTLPIT
NQKAIFEVPLSLEDGEYTMDVKFIDKDDDFLIKEKTFSVDHSSADIVNAMNARGKTEDDINDSPSTSSVGHNNNGAIDVF
AVNEVTLPVDNQEEHA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
STY4459 NP_458559.1 large repetitive protein Not tested SPI-4 Protein 0.0 100