Gene Information

Name : t4167 (t4167)
Accession : NP_807771.1
Strain : Salmonella enterica Ty2
Genome accession: NC_004631
Putative virulence/resistance : Unknown
Product : large repetitive protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 4322157 - 4328927 bp
Length : 6771 bp
Strand : +
Note : corresponds to STY4459 from Accession AL513382: Salmonella typhi CT18

DNA sequence :
GTGGAAGATCTGGCGGGGAATGTAAAAGAATCTGCGCCGTTAGAGGTACGTATTGATACCACGACAACCATTAACAATAT
CGTATTGCTTAATGATACTGGCGTGCAGAATGATCAATTAACGAATGTTGCCAAACCGTCATTCAGAATTGACGTTCCCG
GTGATGTCGTCCAGGTACGCGTAACCCTGGATGGTGGCGCTAACTGGAATGTGATACGCAAAAATGCCGACGGACAGTGG
ATTTTTGACAGCCCGAATACTCTGGTTGACGGCACATATACCCTTCGCGTAGAGGCCACGGATGAGGCAGGTAATATTGC
AAATAAAGATTTAGTATTTAATATCGATACTAATATACAGGTTCCGACTATTGCTTTAGACGCAGGACAAGATACCGGAG
CGAATACAGCCGATAATATTACTAATATTTCACGACCCACCTTTACGATTGGTAATGTTGACCCCGATGTTATCAAAGTC
GTGGTGACGATTGATGGTCATGATTATAACGCGACTAAGGTTGGGGCTGGTTGGCAATTTACACCAGGCAATGCCATTCC
GGATGGTTCTTATAATATTACCGTTACGGTTGAAGATAAGGCCGGAAATACCGCGACATCGAAACCATTACCTGTTGTGA
TAGATACGACGGCTGAAATTGAAAGCGTCACGTTGGTTACAGATAGCGGTGATAGCGATGTAGATAACATTACCAAAGTC
GACAAGCCGCAGTTTAGTATTGTTACCGCTGATGATATTACCCATGTGCGCGTTAAAATCGATAACGCCGCTAATTGGAT
TGAACTCACAAAAGGAGGGGATGGTCGCTGGATATTTAATGTCGGTTCGGCATTACCTGATGGGCAACACACTCTCTTGG
TTGATGTGACTGATATCGCCGGCAACGTTGCGCAAGAAACGCTGCAGTTTACGATTGATACGACTCTGCGAGAGCCGACA
ATTGTACTCGATCCCACCCATGATACTGGTGATGATACTAATGATAATCTTACCAGGATTAACAAACCGGTGTTTATTAT
CGGTAATGTCGATAATGATGTATCACACATTGTGGTTCATCTTGATGGTCGGGATTACACCATTGAAAACAAAGGGGGGA
ATTTAACCTTTACGCCGGATCAACCGCTGTCTGACGGTCAGCATACGATCTCTGTTACCGTAACGGATATTGCTGGTAAT
ACCAAAACATCGGCCGAACTGCAGATTGAAATCGACACGCAGGTTCAGATTGACAGTGTTACGTTAACAACAGATAGCGG
CGTCAACGATCACGATAATGTCACCAATGCTACCCGTCCCTCTTTTGAAATTGCAACGCCTGATGATGTGACATCGGTGC
TGGTTTCTTTCGATGGCGTAAACTGGACGCCCATCAGTAAAAATGCGGCCGGGCAGTGGCAATTTACTGCAGGTAGCGCA
TTGTCTGATGGTCATTATACTCTCCATGTCCAGGCGACGGATCGGGCAGGGAATACGGCAAATTCCACGCTGGGCTTTAC
CGTGGATACGCAGATTGACGGCCTGAGCGTCGTGATGCTGGACGACGCCGGAAAGGATTCTACGGATGGTATTACGAATA
TTACCTCTCCACGTTTTGAAATTTCAGCCAGAGAACAGTTGCAGAGCGTGACGGTAATTTTAAACGGGAAATCCAGCACC
CTGACTCAGGGGGCAGGTAATAAATGGCTGTTTACCCCTGATACACCGTTAGTGGATGGAACTTACAAAATAGAAATAGT
GGCTGAAGATATCGCAGGTAATAAAATTAGCAAAGAGGTATCATTCACAATAGACACTATTGTTTCTGATCCCAGTATTG
ATTTGCTGGATGCGGATGATACTGGCGAAAGCGCTGTTGATAATATTACGAGTGTCACTACACCACGTTTCGTTATTGGC
AATGTACCCGCCGATATTGATACTGTTGTAATCAGAATTAACGGCGTTTCTTATCCGGTTACGGCAAATGGCAATAACCT
CTGGGAATTTCAGGTTCCCGTTGCGTTAAACGATGGCGTATATGAAGCCGTTGTTGTCTTCAGAGATATTGCCGGAAATA
CTTCTGAAACTAAGCTGCCCTTTACCATTGATACCACGACAAGCGTCAGTGTCAGAATGGAGCCAGCGTCTGATACCGGC
AGCTCCAATAGCGATAACCTTACGAATAAGCAAAATCCCAAATTCGAAGGTACTGCAGAGCCCAATGCGAAACTGGTGAT
TACCATTGTTGACGATAAGTCAGGTCGGGAGGTTTTAAAACACACGATTACGGTTGGCGCCGATGGCAACTGGAGTGTGA
CGCCGAATATACTGCCGGATGGCATGTATACCATCAACGTCGTCGCAACAGATGTCGCGGGAAATACTGCGCAAACGCAG
GAAAGATTCACTATCGATACGGTTACGATCGATCCCACCATTCGCCTTTCGGATCCATCTATTGATGATCAGTATGAGGC
AACCAGCCTGCGTCCTGAGTTCAAAGGGCTCGCCGAAGCGTTCTCGACGATTATGATTCAGTGGGATGGGAAAGTGGTCG
GCTCGGCAAACGCCAATGCGAATGGTGAATGGAGTTGGACGCCGCCATCAGTATTAGCGCCAGGCTCCTATGTTGTGAGC
ATTGTTGCCAAAGATAAAGCGGGTAATGAATCGTCGCAGGTCGACTTTCCTGTAGTAATACCTGTTATTGATGTCACGCC
TCCAACCATAAAGCTCAGCGAGGAGAGCGATAGTGGTGCCTTAGGAGACTTTACGACGAATAATAAAACGCCGACCCTGA
TTGGGAGCACGTTACCTAATACAATTGTGAGTATTTATGTGGATGGCGTGAAGGTCGGCGAGGCGACAGCGGATACAGCG
GGCCGATATACTTTCCAGTTATCGGAAATGAAAGATGGCCATTATGTCGTCCAGGTGGGTATCGTCAACCCTCGCGATAA
TAGCGAACTGCGTTCCACCGCCGTTGATGTCACTATCGATACCGAGGTTGCTGAACTGGTATGGAATATATCTGGAATGC
ATGAGGGCGGATATATCAACACGGTGACGCCGGAGATTGGCGGCACCAGTGAGCCAAACAGCAAAATCACTATCTTTGTG
AATGGCGTTGAAAAAGCGATTGCTTATACGACAGGCGCAGGACACTGGGGCGTAGTATTACCCGCTTTGGGTAATGACGG
TAATTATGAATTAACGTTTAAAGTTGAAGACGTTGCCGGCAATATCAGAGAGTTTGGTCCGCAGAATGTGATACTGGATA
CGGTAATTTCGCCGTTAACCGTGGTATTACGCGAAGCTGATGACAGTGGCAAAGTTGGCGACTGGATCACCAATAAATCT
CATGTCACCATCGATGGTACTGCCGAAGCCGGAAGTACTTTGACCATCAGGAATCCGCAGGGAGTGGTTATTGCTACCCT
GGTGGTAGGCAATGATGGTCGATGGAGCGCAGAATTAGATCTGCGTGAAGGTAGTAATGCCTTTGTCGTGGTATCGGAAG
ATAAAGCGGGCAACGGCCAACAAAAAGATATTCTGATAGAACATGATACGCAGATTGAAATCAGCGATATTTCATTAAGT
CGGGATACTAATAGCGGTGATAAATATGATCTGATTACCAATAATAAGTCTCCGGTACTGGTTGCCATGACCGATCCCGG
CGCGACGGTACAGGTTTATATTAATGGTGTGTTACAAGGCACAGTAGAGGCGAGTTCGTCAGGTAATATTAGCTATACCA
TGCCGGCAAATAGCGCCGACGGCGAGTATCAGGTGCAATTTGTTGCTACGGATACTGCTGGTAACCGGGTTGAATCTGCG
ATTACGACCGTGACAATCGATTCTCAAATTGCTGTCTTTGATATTGATGAAGATTCATTACCGGCCCTCTCTAATAACCG
GGCGTTGTCAGTCTCAGGCGTCGGGGAGGCTGGTTCTCAGGTCAGCATCTTTGTCGATGGTAAATTAGTCAACGTTGTTA
TGGTTGAGGCTGATGGCTCATGGCGCGCGCCGATACTGCTGCAAGATGATGGTACGTTTAATATTCATTTCAGCATTACT
GACGTTGCTGGCAACACTCAAGTAAGCAAGAATTACAGTGTGGATGTCGATTCATCAACCGACTTCCCAACGCTCAACCT
TGAAGATGCGAGCAACTCTGGTTCACTTGACGATCTGATTACTAATCACAACAAGCCTGTGTTAGTTGGCACCGCAGAAG
CGGGAGCCACAATCCATATTTATGTGGATGAAAAGATCGTGGCAAATGTGCTTGTGCTTGAAGATGGAACCTGGTCCTAT
CAGTTTGATAATGCGTTAAAAGATGGTGAATATTCTATCCGTGTGGTTGCCGAAGACCCGGCAGGTAATACGGCAGAATC
GCCTCGCTTACTCGTCACGATAGATACCAGTACGTTTATCGATAATCCTGCTATGGTGGCAGGTTCTGATAACGGTATTT
TCAGTAATGATAGTATAACGAGTCAGACCCGGCCTACGTTTAGTATTTTTGGAGAAATGAACCAGAGTGTTCAGATTTTC
ATTGATGGGGTGTTAGTCGATACGATCACGGTGACGGACAGAAATCAAGTTTATCGACCTGAGTCACCGTTGGGCGATGG
TTCCCATAGCATTTATTATGTTATCACCGATAAAGCAGGCAACACGGCTACCTCGAAAACGCTAAACTTTACTATCGATA
CCTTTAATACGACGCCTGTCGCCATTGATTCTATCGGTGGACAAACGTTAGCAGAGATGACCGGTAGTGATGGCAAAATA
TATATAACGGACACGACGCGTAACTTATTGTTTAGTGGCAGTGCCGAGCCCAATAGCAAAATAGAAATCATTATTAATGG
CTTAAATGTGGGGGAAGTTTGGGTTAATGAAAAAGGCCACTGGCAGATGCCGGTGAACCCGCTTTATTTCACAGAAGGCC
AACTGGATATCACTGTTAAATCTACGGACCGTGCTGGTAACGTAAATCAGGAAAAGTATTCCATTTGGGTCGATACGCAT
ATCCAGGTATTTACCAGCGAGCTTGATGACAATAAATCATCATCGAAAACGGACTGGTGGAGTAATAGCTCCACTATTAC
CATGAGAGGTATGGGGGAAATTGGCGCTACGGTATCATTAATCGTGGCAGGGGTCACGCTGGCAACCGCTGTCGTTGCGG
CTAATGGGCAGTGGGAATTATCGACCGATCAGCTTCCGGAAGGGAAATACGATATCACTTTGAGTATTGAGGATAACGCA
GGCAACCGTAAGGAAGAGGTACATGAAATATTTATTGATCGAACGCCGCCAAACGCTCCGGTCGTAACTTATTCAGACAT
TGTCAACGATCTAATTATTATGCAGGGAACGGCGGAAGCCAAATCTCAGCTAATAATAACCGATAGTAATGGGAATACTT
ATACGTTAACCGTTCCTGATAATGGTAAATGGAGTATGGCGATCCCGTATCCATCGGAAGGGAAGTTTACCATTACGAGT
GTGGATGCGATTGGTAACCGGAGTGATGATGTCCCTCTCGATATCATGAAAGAGGTTCCCGTTATTTCATTATCTCCAGA
CTCAGACAGTGGTACGGTGGGCGATAATATTACGCGCGATAAGCAACCTACCTTTATTATCGGGAATCTGGAAAGCGATG
TTGTGGTCGTTCAGGTCGATATCAATGGGACAGTATATAATGCTGAAAAAAATGCCGATGGCGTTTGGTTCTTTACGCCA
GGTACACCGTTAGCTGATGGTTCCTATACGATATCGGTAATCGCAAGCGATGCCGCGGGTAATCAGAAAAACTCGTTACC
CATTACCGTTACGATCGACAGTACGCTGACGGTGCCGGAGATTGCGTTGGCAGCAGGTGAAGACAATGGCGTTTCAGACA
GCGATAACGTGACGAATCACACCCAGCCTAAGTTCACGCTGCAGCATATTGATGCTGATGTGACCGGGGTGACCGTAAAC
GTGACGCATAACGGCGTGACAGACACCTATCAGGCGACGCAAGGCGCGGATGGCTGGACCTTCACGCCGCCAGCCGCCTG
GAATGATGGTACCTACACGCTGAGCGTGACGGTGGTGGATCGCGCGGGGAACTCACAGCAATCTGCTTCGCTAGCGGTGA
CGGTTGACTCAACGGTGACGGTAACAGCGGATAGCCAGCATGACGATGCGAGCGATGACGCCACGCCAACAGCGGTTACT
CCACCGGAGTCTGAAACAGTGAATGCCGAAAGCGATACGCATCTTCGTACAGTGCCGTCTGCGGCGGAAGAAAGCGTGGT
GAAGGAGACGGCCTATAGTATTACATTGTTAAACGCTAACTCTGGGGATGAAATAGATCGTTCAATTAGTCAGACACCTT
CTTTTGAAATATCAGTACCTGAGAATATTGTTAATGTCAGTGTTATGTTTGAAGGAGAAGAGTTTACTCTGCCGATAACT
AACCAGAAAGCAATATTCGAAGTTCCGCTATCTTTGGAAGATGGTGAATATACTATGGACGTGAAATTCATTGATAAGGA
CGATGATTTCCTGATTAAGGAAAAAACATTCTCAGTCGATCACTCCTCGGCGGATATTGTGAACGCAATGAATGCAAGAG
GAAAGACCGAGGATGATATTAATGATTCCCCTTCCACGAGTTCTGTAGGGCACAACAATAACGGCGCTATTGATGTTTTC
GCCGTTAATGAAGTTACGCTACCTGTAGATAATCAAGAAGAACACGCATAA

Protein sequence :
MEDLAGNVKESAPLEVRIDTTTTINNIVLLNDTGVQNDQLTNVAKPSFRIDVPGDVVQVRVTLDGGANWNVIRKNADGQW
IFDSPNTLVDGTYTLRVEATDEAGNIANKDLVFNIDTNIQVPTIALDAGQDTGANTADNITNISRPTFTIGNVDPDVIKV
VVTIDGHDYNATKVGAGWQFTPGNAIPDGSYNITVTVEDKAGNTATSKPLPVVIDTTAEIESVTLVTDSGDSDVDNITKV
DKPQFSIVTADDITHVRVKIDNAANWIELTKGGDGRWIFNVGSALPDGQHTLLVDVTDIAGNVAQETLQFTIDTTLREPT
IVLDPTHDTGDDTNDNLTRINKPVFIIGNVDNDVSHIVVHLDGRDYTIENKGGNLTFTPDQPLSDGQHTISVTVTDIAGN
TKTSAELQIEIDTQVQIDSVTLTTDSGVNDHDNVTNATRPSFEIATPDDVTSVLVSFDGVNWTPISKNAAGQWQFTAGSA
LSDGHYTLHVQATDRAGNTANSTLGFTVDTQIDGLSVVMLDDAGKDSTDGITNITSPRFEISAREQLQSVTVILNGKSST
LTQGAGNKWLFTPDTPLVDGTYKIEIVAEDIAGNKISKEVSFTIDTIVSDPSIDLLDADDTGESAVDNITSVTTPRFVIG
NVPADIDTVVIRINGVSYPVTANGNNLWEFQVPVALNDGVYEAVVVFRDIAGNTSETKLPFTIDTTTSVSVRMEPASDTG
SSNSDNLTNKQNPKFEGTAEPNAKLVITIVDDKSGREVLKHTITVGADGNWSVTPNILPDGMYTINVVATDVAGNTAQTQ
ERFTIDTVTIDPTIRLSDPSIDDQYEATSLRPEFKGLAEAFSTIMIQWDGKVVGSANANANGEWSWTPPSVLAPGSYVVS
IVAKDKAGNESSQVDFPVVIPVIDVTPPTIKLSEESDSGALGDFTTNNKTPTLIGSTLPNTIVSIYVDGVKVGEATADTA
GRYTFQLSEMKDGHYVVQVGIVNPRDNSELRSTAVDVTIDTEVAELVWNISGMHEGGYINTVTPEIGGTSEPNSKITIFV
NGVEKAIAYTTGAGHWGVVLPALGNDGNYELTFKVEDVAGNIREFGPQNVILDTVISPLTVVLREADDSGKVGDWITNKS
HVTIDGTAEAGSTLTIRNPQGVVIATLVVGNDGRWSAELDLREGSNAFVVVSEDKAGNGQQKDILIEHDTQIEISDISLS
RDTNSGDKYDLITNNKSPVLVAMTDPGATVQVYINGVLQGTVEASSSGNISYTMPANSADGEYQVQFVATDTAGNRVESA
ITTVTIDSQIAVFDIDEDSLPALSNNRALSVSGVGEAGSQVSIFVDGKLVNVVMVEADGSWRAPILLQDDGTFNIHFSIT
DVAGNTQVSKNYSVDVDSSTDFPTLNLEDASNSGSLDDLITNHNKPVLVGTAEAGATIHIYVDEKIVANVLVLEDGTWSY
QFDNALKDGEYSIRVVAEDPAGNTAESPRLLVTIDTSTFIDNPAMVAGSDNGIFSNDSITSQTRPTFSIFGEMNQSVQIF
IDGVLVDTITVTDRNQVYRPESPLGDGSHSIYYVITDKAGNTATSKTLNFTIDTFNTTPVAIDSIGGQTLAEMTGSDGKI
YITDTTRNLLFSGSAEPNSKIEIIINGLNVGEVWVNEKGHWQMPVNPLYFTEGQLDITVKSTDRAGNVNQEKYSIWVDTH
IQVFTSELDDNKSSSKTDWWSNSSTITMRGMGEIGATVSLIVAGVTLATAVVAANGQWELSTDQLPEGKYDITLSIEDNA
GNRKEEVHEIFIDRTPPNAPVVTYSDIVNDLIIMQGTAEAKSQLIITDSNGNTYTLTVPDNGKWSMAIPYPSEGKFTITS
VDAIGNRSDDVPLDIMKEVPVISLSPDSDSGTVGDNITRDKQPTFIIGNLESDVVVVQVDINGTVYNAEKNADGVWFFTP
GTPLADGSYTISVIASDAAGNQKNSLPITVTIDSTLTVPEIALAAGEDNGVSDSDNVTNHTQPKFTLQHIDADVTGVTVN
VTHNGVTDTYQATQGADGWTFTPPAAWNDGTYTLSVTVVDRAGNSQQSASLAVTVDSTVTVTADSQHDDASDDATPTAVT
PPESETVNAESDTHLRTVPSAAEESVVKETAYSITLLNANSGDEIDRSISQTPSFEISVPENIVNVSVMFEGEEFTLPIT
NQKAIFEVPLSLEDGEYTMDVKFIDKDDDFLIKEKTFSVDHSSADIVNAMNARGKTEDDINDSPSTSSVGHNNNGAIDVF
AVNEVTLPVDNQEEHA

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
STY4459 NP_458559.1 large repetitive protein Not tested SPI-4 Protein 0.0 100