Gene Information

Name : YPK_0403 (YPK_0403)
Accession : YP_001719161.1
Strain : Yersinia pseudotuberculosis YPIII
Genome accession: NC_010465
Putative virulence/resistance : Unknown
Product : YD repeat-containing protein
Function : -
COG functional category : M : Cell wall/membrane/envelope biogenesis
COG ID : COG3209
EC number : -
Position : 442267 - 446439 bp
Length : 4173 bp
Strand : +
Note : TIGRFAM: YD repeat protein; PFAM: RHS protein; YD repeat-containing protein; PAAR repeat-containing protein; KEGG: yps:YPTB3621 hypothetical protein

DNA sequence :

ATGTTTGAAGCGGCCCGTGTTGATGACAAGCTTTATCATTCCAGTGCCTTAGCGGGTTTTATTATTGGCTCCATTATTGG
TGCCGCCGTGATTTTTGCGGCCGCGGCTTACGCCGCCTCCATTGTTCTCACCGGCGGGGCGACGCTGGTCGCTACCGGCT
TTATTGTGGGTATGGGGGTGACCACGCTGGGCGTCGTTGCCGGTGGGTTAATACGCTCCGTGGGCGAAAAAATAGGGAGC
ATGTGCCATCACGATGTCGGACAAATTACGACAGGGTCCAAAAACGTTAAAGTGAACAGTAAACGGGCGGCGCATGTCGA
GCTCAGTACCGTGGCCTGTAAAGATGACTCCGCCATTCAGCGCATGGCCGAAGGTTCGTCAAATATCTTTATTAACAGTA
AAGCCGCCGTTCGTCTGGAAGATAAAACGACCTGTGATGCGGTTGTCGATTCCGCTTCCAGCAATGTGACGTTTGGTGGG
GGGCGCGTTCAGTATCTCGATATTAAACGCGAGATTTCTGATGAAATGCGTGATTTGTCAGAGAAGCTGTTTATTGTCGC
CGGGCTGGCGGGCGGCATATTTGGGGCGGCAAAACAGGCGGGGTGTTTCGGCCTTAAATGCCTGAGCAAGATTGCGTTGG
GTGAGATGGCCGGGGCGGCTGCCGGGTATGGGCTGGAAAAAGGGGTTGGGGCCATCGCCGGTTATTTCGGTTACCCGGTT
GATGTGATCAGTGGACAGAAATTGCTGACAGGTGAGGGCGATGATACCGATTTTATTCTGCCGGGTATCTTCCCGCTGCA
CTGGAGCCGGATTTATCGCAGTGAAAATCACCATGTCGGGGCGCTGGGACAAGGCTGGTCTCTGGTATGGGAGCGTTCAT
TACGCAAAGAAGATGACAGCATTGTTTATCAGAATGATGAAGGTCGGGAGATTGTCTTTCCCCTGATTAAACGTGGAGAG
CGCTATTTCTCCCCCACGGAGCATATCTGGCTGGCACGTACCGAGCGTGATACCTATGCCATCAGCAGCCCGTTTGAAAC
CTGTTTTATTTTTGAGGCCTTTTCTGAGGCTGGCGTTGCGAAATTAGCCAGCCTCGAAGATCTCAATGGTCATGCCCTGT
ATTTCTCTTATGACGATATCGGGCAACTGAAAAAAATATCGACCACCAGCGGTTATGGGGTGTATTGCCAGTATGAAAAA
GGGCGTCTGGTGTCCGTTGCCTGCGTCAAGGGCGGTACGCCGGGCACACTGGTCCGCTACCAGTATAATGAACAGCACCA
GTTGGTCAGCGTCACTAACCGTGAGGGGCAAATCACCCGCCAGTTTGGTTACCATGGCCATCTGATCAACAAACTGGCGG
ATGTCAGGGGGCTGGAGTGCCGTTACACATGGGCTGATATCGGCGGAACCCCGCGAATTACGCACAGTGCCACCAATCTG
GGGGAGCAGTGGCAGTTTGATTATGATATCGACAATCAACAGACCACCCTGACGGACCTCAATACCGGGCAGACCGCCTG
CTGGGGATATAACGCCCAACATTTAATTACCGACTATCGGGATTTTGATGGCGGGAAATATGCATTTGACTACAACGACC
TCAATATGCCGGTACGCGTTGTGCTGGCAGGCGAGAGAACGCTCGTTCTGGTTTACGATGCACTGGCGCGCCCGATCCAG
ATCACCGATCCGCTAAAACGTGAAACCCACATTGATTATCACCGTAACAGTCTGCGGGTGGTGCGCCGTCAGTACCCTGA
CGGGCAGGTCTGGAAGGGGGAATATGACCGTACCGGCCGTTTGCTGAAAGAGAACGCGCCGGATGGCGGGGTGACGCTTT
ATCATTATCCAGGGGCCTCATCCCTTCCTGAACGCATAACCAATGCCGTAGGGGCGCAGACACACCTTGGTTGGGAAAGG
CACGGGCAACTGACGGAGCACACCGACTGCTCGGGTAAACTGACCCGCTACGAATATGATATCGATGGCCATCTGCTGAC
GGTCATCGATGCTGAAAACCATTCAACACATTACAGCTACAACCGTCTCGGGCAGCCCACCGGGGTCAGGTACGCCGATG
GCCGCAAAGAGCAGTTGCGGTATAACGCTCAGGGGCTGGTTGAACAGTTTACCGATCCTGTCGGGCGGCAGTTGCACTGG
CGTTATAACCTGCGGGGTCAGCCGGTCAGCTTTACTGATCGTCTGCAACGGGAATACCGTTACCGCTATGACTGCCATGG
GCAGATGATTGAGCTGGATAATGCCAATGGTGGCCAGTATCACTTCCGGTGGAGCAGTGGCGGGCAATTGGTGGAAGAGC
AGTATCCCGATAACCTTGTCCGGCGTTATCGCTATGGGGAGAGCGGGATGCTGATGGCGCTGGAGACCACCGCGCCCACG
GTTGACGATCTTACCGTCTCCCGGCAGGTCAGTTTTGACTATGATGCGGGCGGGCGAATGACGCAGCGCCTGACGGGCAT
GAGTGCGACCCGGTATGACTGGGACATTATGGACCGTTTATTGTTGGCCGAGCGTGTGCCAACGGCGGTGGGCGAACAGG
CGGGGATCGTCGGTCATGGTGTTCGTTTGGCGTATGACAAGGCCGGGCATTTACTGACGGAAAGCGGTGACCTGGGTGCG
GTGACGTATCAGTGGGATCCGCTGCATCATCTGGCCGCCCTGACGCTGCCCGATGGTCAGACGCTGTCATGGTTGCGTTA
CGGTGCGGGCCATGTCAGTGCCATTCGTCATGGTGATACGCTTATTTCCGAGTTCAGCCGGGATAATCTTCATCGGGAAG
TGAGCCGGACCCAGGGTATTTTGACGCAGTATCGTGATTATGACGCGATGGGGCGGCGGTTGTGGCAATCGGCGGGTTCT
GATGCGCCGACAGTGGCGGCCGATCTGCTGCCCCGTCAGGGGGATATCTGGCGTAAATTTAGCTTTGACACTGCCGGTGA
ACTGAGCATGGCCACCGATTTTATCCGGGGTGAGCAGCAGTACCGTTATGATGCGGAAGGGCGGCTGACTGACAGCCGGG
AGCGTCATCAGTTATCCGTTGCGGAGGATTTTGCTTACGACAATGCGGATAACCTGCTGAACCTGAGGAAACTGCCGTTT
GACACGGTCGATCCACTGTACGATACACCGGTCGCCAACAACCGTTTGACGCAATGGCAGCATTACCGTTTTGAGTATGA
TGCCTGGGGAAACATCACCACGCGGCATGCCGGTGGTCGGATGCAACATTTTGCCTATGACGATGATAACCGGCTGCTGC
GGGCCTGGGGAACCGGGCCGTTAGGGGAGCATGACAGCCACTATCGGTATGATGCGCTGGGGCGGCGTATCCACAAATCG
GTGACGATAAAGCGCGGCGCAGAAAAAACCACCCGTCAGACCGATTTTATCTGGCAGGGGTTGCGGTTATTGCAGGAGCA
ACATGCGGACGGCAACGCGACCTATATTTACGACCCGAACGAAAGTTATACGCCGCTGGCGCGGGTCGATCAGCGTCATG
GCGAGACAGAAAGTCAGGTGTATTATTTTCATACGGATATCAACGGTACCCCGCTGGATGTCACGGACGGAGAGGGTAAG
CACCGCTGGTCAGGGAAATACCACGCCTGGGGCAAAGTTACCCGGCAGAATGTCAGCGATCCAAGGCAAAGCACGGTCAG
CCGGTTCGCGCAGCCGCTGCGTTATCCGGGGCAATACAGTGATGACGAGACGGGTTTGCACTACAATACGTTCAGGTACT
ATGACCCGGAGATAGGGCGATTTAGTACGCAGGACCCGATAGGGCTGGCGGGGGGGGTGAATCTTTATCAGTATGGGCCA
AATCCGCTAGGTTGGGTGGATCCTTGGGGCTTGGCTACATATACATCATATGAGCAAGCAAGAAATGCAGCTCTAAAATG
GCTACAAGATAGAGGGTTTAAGGCTGAAACTGAAAATCTTGGTCGTTTTGGTGATATAAAAGGCAAACCTGTTGGAATGC
AAACGGGCAATGGAAAAGTTGGATTTAGGGTCGAGTTCGATGAGCGAAGTGGGGCTCATATTAATACATGGTCAGGTAAG
GAAAAAGGTCCTCATTTCCAATTTGAAGCAAGTGAGAAAACTGTTAAAAAAATTCAAAAAGGATTTGATAAAAAAACGAA
TGGAAGGTGCTAA

Protein sequence :

MFEAARVDDKLYHSSALAGFIIGSIIGAAVIFAAAAYAASIVLTGGATLVATGFIVGMGVTTLGVVAGGLIRSVGEKIGS
MCHHDVGQITTGSKNVKVNSKRAAHVELSTVACKDDSAIQRMAEGSSNIFINSKAAVRLEDKTTCDAVVDSASSNVTFGG
GRVQYLDIKREISDEMRDLSEKLFIVAGLAGGIFGAAKQAGCFGLKCLSKIALGEMAGAAAGYGLEKGVGAIAGYFGYPV
DVISGQKLLTGEGDDTDFILPGIFPLHWSRIYRSENHHVGALGQGWSLVWERSLRKEDDSIVYQNDEGREIVFPLIKRGE
RYFSPTEHIWLARTERDTYAISSPFETCFIFEAFSEAGVAKLASLEDLNGHALYFSYDDIGQLKKISTTSGYGVYCQYEK
GRLVSVACVKGGTPGTLVRYQYNEQHQLVSVTNREGQITRQFGYHGHLINKLADVRGLECRYTWADIGGTPRITHSATNL
GEQWQFDYDIDNQQTTLTDLNTGQTACWGYNAQHLITDYRDFDGGKYAFDYNDLNMPVRVVLAGERTLVLVYDALARPIQ
ITDPLKRETHIDYHRNSLRVVRRQYPDGQVWKGEYDRTGRLLKENAPDGGVTLYHYPGASSLPERITNAVGAQTHLGWER
HGQLTEHTDCSGKLTRYEYDIDGHLLTVIDAENHSTHYSYNRLGQPTGVRYADGRKEQLRYNAQGLVEQFTDPVGRQLHW
RYNLRGQPVSFTDRLQREYRYRYDCHGQMIELDNANGGQYHFRWSSGGQLVEEQYPDNLVRRYRYGESGMLMALETTAPT
VDDLTVSRQVSFDYDAGGRMTQRLTGMSATRYDWDIMDRLLLAERVPTAVGEQAGIVGHGVRLAYDKAGHLLTESGDLGA
VTYQWDPLHHLAALTLPDGQTLSWLRYGAGHVSAIRHGDTLISEFSRDNLHREVSRTQGILTQYRDYDAMGRRLWQSAGS
DAPTVAADLLPRQGDIWRKFSFDTAGELSMATDFIRGEQQYRYDAEGRLTDSRERHQLSVAEDFAYDNADNLLNLRKLPF
DTVDPLYDTPVANNRLTQWQHYRFEYDAWGNITTRHAGGRMQHFAYDDDNRLLRAWGTGPLGEHDSHYRYDALGRRIHKS
VTIKRGAEKTTRQTDFIWQGLRLLQEQHADGNATYIYDPNESYTPLARVDQRHGETESQVYYFHTDINGTPLDVTDGEGK
HRWSGKYHAWGKVTRQNVSDPRQSTVSRFAQPLRYPGQYSDDETGLHYNTFRYYDPEIGRFSTQDPIGLAGGVNLYQYGP
NPLGWVDPWGLATYTSYEQARNAALKWLQDRGFKAETENLGRFGDIKGKPVGMQTGNGKVGFRVEFDERSGAHINTWSGK
EKGPHFQFEASEKTVKKIQKGFDKKTNGRC

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
api89	CAF28563.1	putative membrane-bound sugar-binding protein	Not tested	YAPI	Protein	0.0	41
YpsIP31758_3692	YP_001402646.1	RHS/YD repeat-containing protein	Not tested	YAPI	Protein	0.0	41