Gene Information

Name : EPYR_00900 (EPYR_00900)
Accession : YP_005801651.1
Strain : Erwinia pyrifoliae DSM 12163
Genome accession: NC_017390
Putative virulence/resistance : Unknown
Product : protein rhsC
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 981751 - 986037 bp
Length : 4287 bp
Strand : +
Note : YD repeat, RHS protein

DNA sequence :

ATGAGTGAAGCCGCACGCGTTGGCGATGCCACCGGCCATTCCTCCGCGCTGGCCGGGATGATCGGCGGTACGATTGTCGG
CGGGCTGATTGCCGCCGCCGGTGCCGTGGCCGCCGGTGCGCTGTTTGTCGCCGGGCTGGCCTCGGCCTGTCTCGGCGTTG
GCGTGCTGCTGATGGGTGCCAGCCTGGCGGTGGGTTATCTCACCGGGGAGGCGGCCACGGCGGCGCGCGACGGCATGGCC
GCCGCCGGGGCAGCCAGCCTGTCCGCTTCGGGGCAGATACTGACCGGCTCGCCGGACGTGTTTATCAACGGCAAACCGGC
GGCCATCGCCACGGTCAGCCAGGCGGGCTGCGATAAGGACGGGCCGTCGATGCAGATGGCGCAAGGCTCCGACCGGGTGT
TTATCAACGGCCAGCCCGCTTCCCGCGTCGGCGACAAAACCAACTGCGGTGCCACGGTGATGGCCGGCTCGCCCANCGTG
CACATCGGCGGCGGCACCGCCACCACGCTGGCGATAAAACCCGAAGTGCCGGAGTGGGCCTNCAAGGCCTCTGACCTGAC
GCTGCTGTTTACCGGGCTGCTCGGCGGTGCCGGCGGCGCGGCCGGTAAGGCTGGCAGGCTGGGTAAACTGCTGAGCAGGC
TGCCCGGCATCAGTAAGCTTGCGCAGGTGGCCTGCCGCTTCGGCACCCTGATGACCGCCAGCGCCGCAGCGGGCATCATC
GCCCGCCCGGTGGATATCATCAGCGGGCAGAANTTTCTCTCCGGCGACGACGAGCTGGACTTCGTGCTGCCCTCACGTCT
GCCGGTCGAATGGCAGCGCTACTGGCGCAGCGGCAACCCGGCGGAAAGCGTGCTGGGGCGCGGCTGGAGCCTGTTCTGGG
AAAGCCGCCTGCAGCATTATGATGACGGCCTGGTGTGGCGCGCGCCGTCCGGTGACTTTGTCCCGTTCCCGATGGTGCCA
CGCGGCCGCAAAAGCTGGTGCGAAGCGGAAAAATGCTGGCTGATGCACAATGCCGACGGCAGCTGGCAGGTGTCCGACGT
CAGTGAACAGGTCTGGCACTATCCGCCGCCCGAGGGTAAGCATCCCGCCCGGCTGCACATGCTGACGGACGCCGGCGGNA
ACGCCACCTCGCTGTTTTACGATGAGCAGGGACGGCTGAGCGAACTGGTGGACAGCGCCGGTCAGCGCCTGAGCTGCCGC
TATCTGACCCGCGCCGCCGGGCATGACCGCCTGAGCGCGGTGCTGCTGCACACCCCGGACGGGGAGNGCACGCTGGTCAG
CTACGATTATGACGACGAGGGGCAGCTTGTCACCGTGCGCAACCGCGCCGGCGAGGTGACGCGCCGCTTCAGCTGGCGCG
ACGGGCTGATGGCCAGCCACCAGGACGCCAACGGGCTGCTGAACGAATATCTGTGGCAGGAGATTGACGGCCTGCCGCGC
GTCACCGGCTGGCGGCACAGCGCCGGGGAAGAGCTGGCGCTGCACTACGACTTTAGCGGCGGCACGCGCCGGGCGGTGCG
CGACGACGGCATGCAGGCGTGGTGGCAGCTGGACGACGACGACAGCGTGGCGCAGTTCACCGACTTTGACGGCCGCCGGC
TGGCGTTTGTCTACGCCCGCGGCGAGCTGTGCAGCGTGCTGCTGCCGGACGGCGGCCAGCGTCAGAGCGAGTGGGACCGC
TACGGGCGACTGCTGAGCGAAACCGACCCGACCGGGCGCAAAACCCTTTACCAGTACCAGCGTAACAGCGACCGGCTGGT
CTGTGTCACCCACCCCGACGGCAGCCGCGAGAGCCGGTCATGGGACCGCCAGGGGCGCCTGATTAAACAGACTGACGCGG
CAGAAAACACCACGCTTTACCACTACCCGGACGAAGAAGAGAGCCTGCCGGCGCGCATCACCGANGCCTCCGGCGGCGTG
GTGCAGCTTGAGTGGAACGGCCGGGGGCTGCTGACGCGCCATACCGACTGTTCCGGCAGCGTCACCGCCTATGGCTATGA
CGTTTTCGGCCAGCTCACCGACCGTACCGATGCGGAAGGCAGTGTGACCCGCTACCGCCGGGATGCCGCCGGTCGCCTGC
ACACCCTGCACCACGCGGACGGCAGCGAAGAGCATTTCACCTGGAACGAACGCGGGCAGCTGGTGCGGCATCAGGANCCG
CCCGGCAGCGAGACGCACTGGCGCTACAACCTGCTGGGCCAGCCGGTCAGCATCACCGACCGCATCAACCGCACGCGAAA
CTGGCACTACAACCCGCGCGGCTGGCTGACGCGGCTGGAGAACGGCAACGGCGGCGAGTATCANTTCAGCCACGATGCCG
CCGGGCGCATCACCGCCGAACGGCGTCCGGACAACACCGACCACCTGTACCGCTACGGCCCGGACGGCCAGCTGGCCGAA
CACCGGGAAACCGGCCCGCAGAACAGCCTTGCGCCGCCCGCGCACCGCCTGCACCGCTTCCGCTTTGACGGGGCGGGTCG
CCCGGCATGGCGCGGCAACGACAGCGCCGAATGGCAGTATCACTACGATGCCGCCGGCAGGCTGAGCCNGCTCACGCGTA
CCCCCACCGCCGCCGGGGCGGAGGCGGGGATTGAAGCGGACCGCATTGAGCTGCAGTACGACCGGGCGGGCAACCTGCTG
TGCGAGCGCGGCGTGAACGGCGGGCTGCACTACCAGTGGGACGCGCTGNCTAACCTGCAGGCGCTGACGCTGCCGCAGGG
CGACAGCCTGCAGTGGCTGCACTACGGCTCCGGCCACGTCAGCGCGCTGAAGTTCAACCGGCAGCGGGTCAGTGAATTTA
CCCGTGACCGCCTGCACCGCGAAACCGGGCGCAGCCAGGGCGCGCTGCACCAGCAGCGGCGCTACGATGCGCTGGGCAGG
CGCAGCTGGCAGAGCAGCGCCTTCAGTGACGGGAAGATAACCCGGCCGGAGGACGGTATTCTGTGGCGGGCNTTCCGCTA
TACCGGGCGCGGCGAGCTGGCGGGCNTCAGCGATGCGCTGCGCGGCGAGGTGCACTACGGCTACGACGCCGAAGGCCGNC
TGTTGCAGCACCGCGAGCTGAAGTCCGGCAGGGTTGGCAACCGGCTGCTGTATGACGCCGCCGATAACCTGCTGGGCGGG
CAAAGCCCGCACGACGACCCGGNACAGCCGCCGCCGCCGCCGCTGAGCAGCAACCGCCTGCCGCACTGGCAGCGGCTGTT
CTACCGCTACGACGTCTGGGGCAATCTGGTCAGCCGCCGCCACGGCGTCAACGAACAGCATTACACCTACGACGCCGACA
ACCGCCTGATACNCGCGCGCGGCTTCGGTCCGCAGGGCGAATTCAGCGCGCGGTATCACTATGACGCGCTGGGCAGGCGC
AGCCGCAAGGAGGTCACCTTCGCGGGCAAAGCGCCGCAGACCACGCGCTTCCTGTGGCAGGGCTACCGGCTGCTGCAGGA
GCAGCGCGGCAACGGCACGCGCCGCACCTGGAGCTACGACCCGGCCAGCCCGTGGACGCCGCTGGCGGCCATCGAACAGG
CGGGTGACGCTGAGCAGGCCGATATTTACTGGCTGAACGCCGACCTCAACAGCGCGCCGCTGGAGGTCACCGACGCAGAG
GGCAATCTGCGCTGGTCGGGACANTACGACACCTTCGGCAAACTGCTGGGCCAGACGGTCGCCGGGGCGGCACAGCGCAC
GGGGCCGGTCTACGATCAGCCGCTGCGCTACGCCGGGCAGTACCAGGACAACGAGAGCGGACTGCACTATAATCTGTTCC
GTTTTTACGAGCCTGATGTAGGAAGATTCACGACCCAGGATCCAATTTCTATCCGTGGCGGACTGAACCTGTATGCTTAT
GCNCCGAATCCGTATGGGTGGGTGGATCCGCTGGGGCTGAGCAATTTCTTTATACCATCGGTATTCAATGCTCCGTCCGG
TAGTACACATACTGTTTACCAGCAAAAAATCGATTGGGATTTACCTGTCAACACACGAAGTGGAGTTAAAACAAATCTGG
ATTTAGCGTTAGATGGTAAAAGTCCATTTGTGGTTAAAAATGGAAAGTACTCCCAGATAAATCTACATCACTCGAAGCAA
GATGGATTAGGATCATTGTTTGAACTTTCAGCAGCTACTCATCAGAAATACTATGGGACGAATGCATTACATCCGTACTT
ACCTAATCCGCATCCAATAAATCCCGTCAACAGAGATAGTTTTAATGGCGATCGTGATAGTTATTGGCGACAGCGCGGCG
AAAGTGAACTACATAGCCGAAGATTAAAAACTAACTGTAGAGGTTAA

Protein sequence :

MSEAARVGDATGHSSALAGMIGGTIVGGLIAAAGAVAAGALFVAGLASACLGVGVLLMGASLAVGYLTGEAATAARDGMA
AAGAASLSASGQILTGSPDVFINGKPAAIATVSQAGCDKDGPSMQMAQGSDRVFINGQPASRVGDKTNCGATVMAGSPXV
HIGGGTATTLAIKPEVPEWAXKASDLTLLFTGLLGGAGGAAGKAGRLGKLLSRLPGISKLAQVACRFGTLMTASAAAGII
ARPVDIISGQXFLSGDDELDFVLPSRLPVEWQRYWRSGNPAESVLGRGWSLFWESRLQHYDDGLVWRAPSGDFVPFPMVP
RGRKSWCEAEKCWLMHNADGSWQVSDVSEQVWHYPPPEGKHPARLHMLTDAGGNATSLFYDEQGRLSELVDSAGQRLSCR
YLTRAAGHDRLSAVLLHTPDGEXTLVSYDYDDEGQLVTVRNRAGEVTRRFSWRDGLMASHQDANGLLNEYLWQEIDGLPR
VTGWRHSAGEELALHYDFSGGTRRAVRDDGMQAWWQLDDDDSVAQFTDFDGRRLAFVYARGELCSVLLPDGGQRQSEWDR
YGRLLSETDPTGRKTLYQYQRNSDRLVCVTHPDGSRESRSWDRQGRLIKQTDAAENTTLYHYPDEEESLPARITXASGGV
VQLEWNGRGLLTRHTDCSGSVTAYGYDVFGQLTDRTDAEGSVTRYRRDAAGRLHTLHHADGSEEHFTWNERGQLVRHQXP
PGSETHWRYNLLGQPVSITDRINRTRNWHYNPRGWLTRLENGNGGEYXFSHDAAGRITAERRPDNTDHLYRYGPDGQLAE
HRETGPQNSLAPPAHRLHRFRFDGAGRPAWRGNDSAEWQYHYDAAGRLSXLTRTPTAAGAEAGIEADRIELQYDRAGNLL
CERGVNGGLHYQWDALXNLQALTLPQGDSLQWLHYGSGHVSALKFNRQRVSEFTRDRLHRETGRSQGALHQQRRYDALGR
RSWQSSAFSDGKITRPEDGILWRAFRYTGRGELAGXSDALRGEVHYGYDAEGRLLQHRELKSGRVGNRLLYDAADNLLGG
QSPHDDPXQPPPPPLSSNRLPHWQRLFYRYDVWGNLVSRRHGVNEQHYTYDADNRLIXARGFGPQGEFSARYHYDALGRR
SRKEVTFAGKAPQTTRFLWQGYRLLQEQRGNGTRRTWSYDPASPWTPLAAIEQAGDAEQADIYWLNADLNSAPLEVTDAE
GNLRWSGXYDTFGKLLGQTVAGAAQRTGPVYDQPLRYAGQYQDNESGLHYNLFRFYEPDVGRFTTQDPISIRGGLNLYAY
APNPYGWVDPLGLSNFFIPSVFNAPSGSTHTVYQQKIDWDLPVNTRSGVKTNLDLALDGKSPFVVKNGKYSQINLHHSKQ
DGLGSLFELSAATHQKYYGTNALHPYLPNPHPINPVNRDSFNGDRDSYWRQRGESELHSRRLKTNCRG

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
YpsIP31758_3692	YP_001402646.1	RHS/YD repeat-containing protein	Not tested	YAPI	Protein	0.0	46
api89	CAF28563.1	putative membrane-bound sugar-binding protein	Not tested	YAPI	Protein	0.0	46