Gene Information

Name : YpsIP31758_0333 (YpsIP31758_0333)
Accession : YP_001399327.1
Strain : Yersinia pseudotuberculosis IP 31758
Genome accession: NC_009708
Putative virulence/resistance : Unknown
Product : RHS/YD repeat-containing protein
Function : -
COG functional category : M : Cell wall/membrane/envelope biogenesis
COG ID : COG3209
EC number : -
Position : 391335 - 395591 bp
Length : 4257 bp
Strand : +
Note : identified by match to protein family HMM PF03527; match to protein family HMM PF05488; match to protein family HMM PF05593; match to protein family HMM TIGR01643

DNA sequence :

ATGTTTGAAGCGGCCCGTGTTGATGACAAGCTTTATCATTCCAGTGCCTTAGCGGGTTTTATTATTGGCTCCATTATTGG
TGCCGCCGTGATTTTTGCGGCCGCGGCTTACGCCGCCTCCATTGTTCTCACCGGCGGGGCGACGCTGGTCGCTACCGGCT
TTATTGTGGGTATGGGGGTGACCACGCTGGGCGTCGTTGCCGGTGGGTTAATACGCTCCGTGGGCGAAAAAATAGGGAGC
ATGTGCCATCACGATGTCGGACAAATTACGACAGGGTCCAAAAACGTTAAAGTGAACAGTAAACGGGCGGCGCATGTCGA
GCTCAGTACCGTGGCCTGTAAAGATGACTCCGCCATTCAGCGCATGGCCGAAGGTTCGTCAAATATCTTTATTAACAGTA
AAGCCGCCGTTCGTCTGGAAGATAAAACGACCTGTGATGCGGTTGTCGATTCCGCTTCCAGCAATGTGACGTTTGGTGGG
GGGCGCGTTCAGTATCTCGATATTAAACGCGAGATTTCTGATGAAATGCGTGATTTGTCAGAGAAGCTGTTTATTGTCGC
CGGGCTGGCGGGCGGCATATTTGGGGCGGCAAAACAGGCGGGGTGTTTCGGCCTTAAATGCCTGAGCAAGATTGCGTTGG
GTGAGATGGCCGGGGCGGCTGCCGGGTATGGGCTGGAAAAAGGGGTTGGGGCCATCGCCGGTTATTTCGGTTACCCGGTT
GATGTGATCAGTGGACAGAAATTGCTGACAGGTGAGGGCGATGATACCGATTTTATTCTGCCGGGTATCTTCCCGCTGCA
CTGGAGCCGGATTTATCGCAGTGAAAATCACCATGTCGGGGCGCTGGGACAAGGCTGGTCTCTGGTATGGGAGCGTTCAT
TACGCAAAGAAGATGACAGCATTGTTTATCAGAATGATGAAGGTCGGGAGATTGTCTTTCCCCTGATTAAACGTGGAGAG
CGCTATTTCTCCCCCACGGAGCATATCTGGCTGGCACGTACCGAGCGTGATACCTATGCCATCAGCAGCCCGTTTGAAAC
CTGTTTTATTTTTGAGGCCTTTTCTGAGGCTGGCGTTGCGAAATTAGCCAGCCTCGAAGATCTCAATGGTCATGCCCTGT
ATTTCTCTTATGACGATATCGGGCAACTGAAAAAAATATCGACCACCAGCGGTTATGGGGTGTATTGCCAGTATGAAAAA
GGGCGTCTGGTGTCCGTTGCCTGCGTCAAGGGCGGTACGCCGGGCACACTGGTCCGCTACCAGTATAATGAACAGCACCA
GTTGGTCAGCGTCACTAACCGTGAGGGGCAAATCACCCGCCAGTTTGGTTACCATGGCCATCTGATCAATAAACTGGCGG
ATGTCAGGGGGCTGGAGTGCCGTTACACATGGGCTGATATCGGCGGAACCCCGCGAATTACGCACAGTGCCACCAATCTG
GGGGAGCAGTGGCAGTTTGATTATGATATCGACAATCAACAGACCACCCTGACGGACCTCAATACCGGGCAGACCGCCTG
CTGGGGATATAACGCCCAACATTTAATTACCGACTATCGGGATTTTGATGGCGGGAAATATGCATTTGACTACAACGACC
TCAATATGCCGGTACGCGTTGTGCTGGCAGGCGAGAGAACGCTCGTTCTGGCTTACGATGCACTGGCGCGCCCGATCCAG
ATCACCGATCCGCTAAAACGTGAAATCCACATTGATTATCACCGTAACAGTCTGCGGGTGATGCGCCGTCAGTACCCTGA
CGGGCAGGTCTGGAAGGGGGAATATGACCGAACCGGCCGTTTGCTGAAAGAGAACGCGCCGGATGGCGGGGTGACGCGTT
ATCATTATCCGGGGGCCTCATCCCTTCCTGAACGCATAACCAATGCCGTAGGGGCGCAGACACACTTTGGCTGGGAAAGG
CACGGGCAACTGACGGAGCACACCGACTGTTCGGGTAAACTGACCCGCTACGAATATGATATCGATGGCCATCTGCTGAC
GGTCATCGATGCTGAAAACCATGCAACACATTACAGCTACAACCGTCTCGGGCAGCTCACCGGGGTCAGGTACGCCGATG
GCCGCAAAGAGCAGTTGCGGTATAACGCTCAGGGACTGGTTGAACAGTTTACCGATCCTGTCGGGCGGCAGTTGCACTGG
CGTTATAACCTGCGGGGTCAGCCGGTCAGCTTTACTGATCGTCTGCAACGGCAATACCGTTACCGCTATGACTGCCATGG
GCAGATGATTGAGCTGGATAATGCCAATGGTGGCCAGTATCACTTCCGGTGGAGCAGCGGCGGGCAATTGGTGGAAGAGC
AGTATCCCGATAACCTTGTCCGGCGTTATCGCTATGGGGAGAGCGGGATGCTGATGGCGCTGGAGACCACCGCGCCCACG
GTTGACGATCTTACCGTCTCCCGGCAGGTCAGTTTTGACTATGATGCGGGCGGGCGAATGACGCAGCGCCTGACGGGCAT
GAGTGCGACCCGGTATGACTGGGACATTATGGACCGTTTATTGCTGGCCGAGCGTGTGCCAACGGCGGTGGGCGAACAGG
CGGGGATCGTCGGTCATGGTGTTCGTTTGGCGTATGACAAGGCCGGGCATTTACTGACGGAAAGCGGTGACCTGGGTGCG
GTGACGTATCAGTGGGATCCGCTGCATCACCTGGCCGCCCTGACGCTGCCCGATGGGCAGACGCTGTCATGGTTGCGTTA
CGGTGCGGGCCATGTCAGTGCCATTCGTCATGGTGATACGCTTATTTCCGAGTTCAGCCGGGATAATCTTCATCGGGAAG
TGAGCCGGACCCAGGGTATTTTGACGCAGTATCGTGATTATGACGCGATGGGGCGGCGGTTGTGGCAATCGGCGGGTTCT
GATGCGCCGACAGTGGCGGCCGATCTGCTGCCCCGTCAGGGGGATATCTGGCGTAAATTTAGCTTTGACACTGCCGGTGA
ACTGAGCATGGCCACCGATTTTATCCGGGGTGAGCAGCAGTACCGTTATGATGCGGAAGGGCGGCTGACTGACAGCCGGG
AGCGTCATCAGTTATCCGTTGCGGAGGATTTTGCTTACGACAATGCGGATAACCTGCTGAACCTGAGGAAACTGCCGTTT
GACACCGTCGATCCACTGTACGATACACCGGTCGCCAACAACCGTTTGACGCAATGGCAGCATTACCGTTTTGAGTATGA
TGCCTGGGGAAACATGACCACGCGGCATGCCGGTGGTCGGATGCAACATTTTGCCTATGACGATGATAACCGGCTGCTGC
GGGCCTGGGGAACCGGGCCGTTAGGGGAGCATGACAGCCACTATCGGTATGATGCGCTGGGGCGGCGTATCCACAAATCG
GTGACGATAAAGCGCGGCGCAGAAAAAACCACCCGTCAGACCGATTTTATCTGGCAGGGGTTGCGGTTATTGCAGGAGCA
ACATGCGGACGGTAACGCGACCTATATTTACGACCCGAACGAAAGTTATACGCCGCTGGCGCGGGTCGATCAGCGTCATG
GCGAGACAGAAAGTCAGGTGTATTATTTTCATACGGATATCAACGGTACCCCGCTGGATGTCACGGACGGAGAGGGTAAG
CACCGTTGGTCAGGGAAATACCACGCCTGGGGCAAAGTTACCCGGCAGAATGTCAGCGATCCAAGGCAAAGCACGGTCAG
CCGGTTCGCGCAGCCGCTGCGTTATCCGGGGCAATACAGTGATGACGAGACGGGTTTGCACTACAATACGTTCAGGTACT
ATGACCCGGAGATAGGGCGATTTAGTACGCAGGACCCGATAGGGCTGGCGGGGGGGATAAATCTTTATCAGTATGGGCCA
AATCCGCTAGGTTGGGTGGATCCTTTAGGATGGATGCCTTGGGCGTGGAATCCAAATGGTATGGGGCATCACCTTATTCC
TCGGAATAAAGCTAATAGCATTGGACTTACTGAGCTAGGAACGAAATTAAATACGCCTACTTTCTTCCCAGACCCTTATC
AGGCTGGTATGCATGAGGAACTGCATAGAGCAATTAAAAACGATATAGGGAAAATTCAAGGTCCTTGGAAAGGTTCTGCA
GCCGATTTATTTGAAGCTACTGGTAGAAATTTAGATTCCGTCTCTCATATTCGAGGGGATTTACGTATTCCTTCAACTGG
AGAAGTTATTGCTAGAAATGTCACTCCTAAAGAAGCTCATTCAAGATTAACTGAATGGTTTAATAATAAAAAGTCAGGTG
GTGGAGGTGGTTGTTAA

Protein sequence :

MFEAARVDDKLYHSSALAGFIIGSIIGAAVIFAAAAYAASIVLTGGATLVATGFIVGMGVTTLGVVAGGLIRSVGEKIGS
MCHHDVGQITTGSKNVKVNSKRAAHVELSTVACKDDSAIQRMAEGSSNIFINSKAAVRLEDKTTCDAVVDSASSNVTFGG
GRVQYLDIKREISDEMRDLSEKLFIVAGLAGGIFGAAKQAGCFGLKCLSKIALGEMAGAAAGYGLEKGVGAIAGYFGYPV
DVISGQKLLTGEGDDTDFILPGIFPLHWSRIYRSENHHVGALGQGWSLVWERSLRKEDDSIVYQNDEGREIVFPLIKRGE
RYFSPTEHIWLARTERDTYAISSPFETCFIFEAFSEAGVAKLASLEDLNGHALYFSYDDIGQLKKISTTSGYGVYCQYEK
GRLVSVACVKGGTPGTLVRYQYNEQHQLVSVTNREGQITRQFGYHGHLINKLADVRGLECRYTWADIGGTPRITHSATNL
GEQWQFDYDIDNQQTTLTDLNTGQTACWGYNAQHLITDYRDFDGGKYAFDYNDLNMPVRVVLAGERTLVLAYDALARPIQ
ITDPLKREIHIDYHRNSLRVMRRQYPDGQVWKGEYDRTGRLLKENAPDGGVTRYHYPGASSLPERITNAVGAQTHFGWER
HGQLTEHTDCSGKLTRYEYDIDGHLLTVIDAENHATHYSYNRLGQLTGVRYADGRKEQLRYNAQGLVEQFTDPVGRQLHW
RYNLRGQPVSFTDRLQRQYRYRYDCHGQMIELDNANGGQYHFRWSSGGQLVEEQYPDNLVRRYRYGESGMLMALETTAPT
VDDLTVSRQVSFDYDAGGRMTQRLTGMSATRYDWDIMDRLLLAERVPTAVGEQAGIVGHGVRLAYDKAGHLLTESGDLGA
VTYQWDPLHHLAALTLPDGQTLSWLRYGAGHVSAIRHGDTLISEFSRDNLHREVSRTQGILTQYRDYDAMGRRLWQSAGS
DAPTVAADLLPRQGDIWRKFSFDTAGELSMATDFIRGEQQYRYDAEGRLTDSRERHQLSVAEDFAYDNADNLLNLRKLPF
DTVDPLYDTPVANNRLTQWQHYRFEYDAWGNMTTRHAGGRMQHFAYDDDNRLLRAWGTGPLGEHDSHYRYDALGRRIHKS
VTIKRGAEKTTRQTDFIWQGLRLLQEQHADGNATYIYDPNESYTPLARVDQRHGETESQVYYFHTDINGTPLDVTDGEGK
HRWSGKYHAWGKVTRQNVSDPRQSTVSRFAQPLRYPGQYSDDETGLHYNTFRYYDPEIGRFSTQDPIGLAGGINLYQYGP
NPLGWVDPLGWMPWAWNPNGMGHHLIPRNKANSIGLTELGTKLNTPTFFPDPYQAGMHEELHRAIKNDIGKIQGPWKGSA
ADLFEATGRNLDSVSHIRGDLRIPSTGEVIARNVTPKEAHSRLTEWFNNKKSGGGGGC

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
YpsIP31758_3692	YP_001402646.1	RHS/YD repeat-containing protein	Not tested	YAPI	Protein	0.0	41
api89	CAF28563.1	putative membrane-bound sugar-binding protein	Not tested	YAPI	Protein	0.0	41