Gene Information

Name : EpC_31430 (EpC_31430)
Accession : YP_002650124.1
Strain : Erwinia pyrifoliae Ep1/96
Genome accession: NC_012214
Putative virulence/resistance : Unknown
Product : Rhs family protein
Function : -
COG functional category : M : Cell wall/membrane/envelope biogenesis
COG ID : COG3209
EC number : -
Position : 3437425 - 3441711 bp
Length : 4287 bp
Strand : +
Note : silverDB:cEP03144

DNA sequence :

ATGAGTGAAGCCGCACGCGTTGGCGATGCCACCGGCCATTCCTCCGCGCTGGCCGGGATGATCGGCGGTACGATTGTCGG
CGGGCTGATTGCCGCCGCCGGTGCCGTGGCCGCCGGTGCGCTGTTTGTCGCCGGGCTGGCCTCGGCCTGTCTCGGCGTTG
GCGTGCTGCTGATGGGTGCCAGCCTGGCGGTGGGTTATCTCACCGGGGAGGCGGCCACGGCGGCGCGCGACGGCATGGCC
GCCGCCGGGGCAGCCAGCCTGTCCGCTTCGGGGCAGATACTGACCGGCTCGCCGGACGTGTTTATCAACGGCAAACCGGC
GGCCATCGCCACGGTCAGCCAGGCGGGCTGCGATAAGGACGGGCCGTCGATGCAGATGGCGCAAGGCTCCGACCGGGTGT
TTATCAACGGCCAGCCCGCTTCCCGCGTCGGCGACAAAACCAACTGCGGTGCCACGGTGATGGCCGGCTCGCCCAACGTG
CACATCGGCGGCGGCACCGCCACCACGCTGGCGATAAAACCCGAAGTGCCGGAGTGGGCCTACAAGGCCTCTGACCTGAC
GCTGCTGTTTACCGGGCTGCTCGGCGGTGCCGGCGGCGCGGCCGGTAAGGCTGGCAGGCTGGGTAAACTGCTGAGCAGGC
TGCCCGGCATCAGTAAGCTTGCGCAGGTGGCCTGCCGCTTCGGCACCCTGATGACCGCCAGCGCCGCAGCGGGCATCATC
GCCCGCCCGGTGGATATCATCAGCGGGCAGAAGTTTCTCTCCGGCGACGACGAGCTGGACTTCGTGCTGCCCTCACGTCT
GCCGGTCGAATGGCAGCGCTACTGGCGCAGCGGCAACCCGGCGGAAAGCGTGCTGGGGCGCGGCTGGAGCCTGTTCTGGG
AAAGCCGCCTGCAGCATTATGATGACGGCCTGGTGTGGCGCGCGCCGTCCGGTGACTTTGTCCCGTTCCCGATGGTGCCA
CGCGGCCGCAAAAGCTGGTGCGAAGCGGAAAAATGCTGGCTGATGCACAATGCCGACGGCAGCTGGCAGGTGTCCGACGT
CAGTGAACAGGTCTGGCACTATCCGCCGCCCGAGGGTAAGCATCCCGCCCGGCTGCACATGCTGACGGACGCCGGCGGCA
ACGCCACCTCGCTGTTTTACGATGAGCAGGGACGGCTGAGCGAACTGGTGGACAGCGCCGGTCAGCGCCTGAGCTGCCGC
TATCTGACCCGCGCCGCCGGGCATGACCGCCTGAGCGCGGTGCTGCTGCACACCCCGGACGGGGAGTGCACGCTGGTCAG
CTACGATTATGACGACGAGGGGCAGCTTGTCACCGTGCGCAACCGCGCCGGCGAGGTGACGCGCCGCTTCAGCTGGCGCG
ACGGGCTGATGGCCAGCCACGAGGATGCCAACGGGCTGCTGAACGAATATCTGTGGCAGGAGATTGACGGCCTGCCGCGC
GTCACCGGCTGGCGGCACAGCGCCGGGGAAGAGCTGGCGCTGCACTACGACTTTAGCGGCGGCACGCGCCGGGCGGTGCG
CGACGACGGCATGCAGGCGTGGTGGCAGCTGGACGACGACGACAGCGTGGCGCAGTTCACCGACTTTGACGGCCGCCGGC
TGGCGTTTGTCTACGCCCGCGGCGAGCTGTGCAGCGTGCTGCTGCCGGACGGCGGCCAGCGTCAGAGCGAGTGGGACCGC
TACGGGCGACTGCTGAGCGAAACCGACCCGACCGGGCGCAAAACCCTTTACCAGTACCAGCGTAACAGCGACCGGCTGGT
CTGTGTCACCCACCCCGACGGCAGCCGCGAGAGCCGGTCATGGGACCGCCAGGGGCGCCTGATTAAACAGACTGACGCGG
CAGAAAACACCACGCTTTACCACTACCCGGACGAAGAAGAGAGCCTGCCGGCGCGCATCACCGACGCCTCCGGCGGCGTG
GTGCAGCTTGAGTGGAACGGCCGGGGGCTGCTGACGCGCCATACCGACTGTTCCGGCAGCGTCACCGCCTATGGCTATGA
CGTTTTCGGCCAGCTCACCGACCGTACCGATGCGGAAGGCAACGTGACCCGCTACCGCCGGGATGCCGCCGGTCGCCTGC
ACACCCTGCACCACGCGGACGGCAGCGAAGAGCATTTCACCTGGAACGAACGCGGGCAGCTGGTGCGGCATCAGGATCCG
CCCGGCAGCGAGACGCACTGGCGCTACAACCTGCTGGGCCAGCCGGTCAGCATCACCGACCGCATCAACCGCACGCGAAA
CTGGCACTACAACCCGCGCGGCTGGCTGACGCGGCTGGAGAACGGCAACGGCGGCGAGTATCACTTCAGCCACGATGCCG
CCGGGCGCATCACCGCCGAACGGCGTCCGGACAACACCGACCACCTGTACCGCTACGGCCCGGACGGCCAGCTGGCCGAA
CACCGGGAAACCGGCCCGCAGAACAGCCTTGCGCCGCCCGCGCACCGCCTGCACCGCTTCCGCTTTGACGGGGCGGGTCG
CCCGGCATGGCGCGGCAACGACAGCGCCGAATGGCAGTATCACTACGATGCCGCCGGCAGGCTGAGCCGGCTCACGCGTA
CCCCCACCGCCGCCGGGGCGGAGGCGGGGATTGAAGCGGACCGCATTGAGCTGCAGTACGACCGGGCGGGCAACCTGCTG
TGCGAGCGCGGCGTGAACGGCGGGCTGCACTACCAGTGGGACGCGCTGACTAACCTGCAGGCGCTGACGCTGCCGCAGGG
CGACAGCCTGCAGTGGCTGCACTACGGCTCCGGCCACGTCAGCGCGCTGAAGTTCAACCGGCAGCGGGTCAGTGAATTTA
CCCGTGACCGCCTGCACCGCGAAACCGGGCGCAGCCAGGGCGCGCTGCACCAGCAGCGGCGCTACGATGCGCTGGGCAGG
CGCAGCTGGCAGAGCAGCGCCTTCAGTGACGGGAAGATAACCCGGCCGGAGGACGGTATTCTGTGGCGGGCGTTCCGCTA
TACCGGGCGCGGCGAGCTGGCGGGCGTCAGCGATGCGCTGCGCGGCGAGGTGCACTACGGCTACGACGCCGAAGGCCGGC
TGTTGCAGCACCGCGAGCTGAAGTCCGGCAGGGTTGGCAACCGGCTGCTGTATGACGCCGCCGATAACCTGCTGGGCGGG
CAAAGCCCGCACGACGACCCGGAACAGCCGCCGCCGCCGCCGCTGAGCAGCAACCGCCTGCCGCACTGGCAGCGGCTGTT
CTACCGCTACGACGTCTGGGGCAATCTGGTCAGCCGCCGCCACGGCGTCAACGAACAGCATTACACCTACGACGCCGACA
ACCGCCTGATACGCGCGCGCGGCTTCGGTCCGCAGGGCGAATTCAGCGCGCGGTATCACTATGACGCGCTGGGCAGGCGC
AGCCGCAAGGAGGTCACCTTCGCGGCTAAAGCGCCGCAGACCACGCGCTTCCTGTGGCAGGGCTACCGGCTGCTGCAGGA
GCAGCGCGGCAACGGCACGCGCCGCACCTGGAGCTACGACCCGGCCAGCCCGTGGACGCCGCTGGCGGCCATCGAACAGG
CGGGTGACGCTGAGCAGGCCGATATTTACTGGCTGAACGCCGACCTCAACAGCGCGCCGCTGGAGGTCACCGACGCAGAG
GGCAATCTGCGCTGGTCGGGACACTACGACACCTTCGGCAAACTGCTGGGCCAGACGGTCGCCGGGGCAGCACAGCGCAC
CGGGCCGGTCTATGACCAGCCGCTGCGCTACGCCGGGCAGTACCAGGACAACGAGAGCGGACTGCACTATAATCTGTTCC
GTTACTACGAGCCTGATGTAGGAAGATTCACGACCCAGGACCCGGTGGGGCTGGCGGGAGGGATGAACCTGTATGCTTAT
GCGCCGAATCCGTATGGGTGGGTTGATCCGCTGGGGTTAAGTAAGTGTGCACTGGAAGGAAAATATAAAGAAGTCGATAA
GGCTAATTTACCTGATTGGATTAAAGATTCTTTCAAGAATGGCGAATATAAAACGGTAAGAACAACTGATGAAGTGAATT
TATATCGTGTGTTCGGTGGTAATGCGAAAATAGACGGATCATTTGTTAGTACATCACCAGCGTTGAATAAAATACAAGCC
AAAATTGATTCGGCACTTTTACCAGAATGGAAAAATACGCGACAGTTTGAAGCTACTATTACTGTACCTAAAGGAACAAT
CCTTCAGGTCGGCAAGGTTGAACAGCAAGTTATGCTCTCTGGTGCAAAACTCCAGGGAGGGGCTGACCAAATATTGTTAC
CACATGGCTATCCTACAAGTTGGATAAGTGATGTCAGATTTTTATAA

Protein sequence :

MSEAARVGDATGHSSALAGMIGGTIVGGLIAAAGAVAAGALFVAGLASACLGVGVLLMGASLAVGYLTGEAATAARDGMA
AAGAASLSASGQILTGSPDVFINGKPAAIATVSQAGCDKDGPSMQMAQGSDRVFINGQPASRVGDKTNCGATVMAGSPNV
HIGGGTATTLAIKPEVPEWAYKASDLTLLFTGLLGGAGGAAGKAGRLGKLLSRLPGISKLAQVACRFGTLMTASAAAGII
ARPVDIISGQKFLSGDDELDFVLPSRLPVEWQRYWRSGNPAESVLGRGWSLFWESRLQHYDDGLVWRAPSGDFVPFPMVP
RGRKSWCEAEKCWLMHNADGSWQVSDVSEQVWHYPPPEGKHPARLHMLTDAGGNATSLFYDEQGRLSELVDSAGQRLSCR
YLTRAAGHDRLSAVLLHTPDGECTLVSYDYDDEGQLVTVRNRAGEVTRRFSWRDGLMASHEDANGLLNEYLWQEIDGLPR
VTGWRHSAGEELALHYDFSGGTRRAVRDDGMQAWWQLDDDDSVAQFTDFDGRRLAFVYARGELCSVLLPDGGQRQSEWDR
YGRLLSETDPTGRKTLYQYQRNSDRLVCVTHPDGSRESRSWDRQGRLIKQTDAAENTTLYHYPDEEESLPARITDASGGV
VQLEWNGRGLLTRHTDCSGSVTAYGYDVFGQLTDRTDAEGNVTRYRRDAAGRLHTLHHADGSEEHFTWNERGQLVRHQDP
PGSETHWRYNLLGQPVSITDRINRTRNWHYNPRGWLTRLENGNGGEYHFSHDAAGRITAERRPDNTDHLYRYGPDGQLAE
HRETGPQNSLAPPAHRLHRFRFDGAGRPAWRGNDSAEWQYHYDAAGRLSRLTRTPTAAGAEAGIEADRIELQYDRAGNLL
CERGVNGGLHYQWDALTNLQALTLPQGDSLQWLHYGSGHVSALKFNRQRVSEFTRDRLHRETGRSQGALHQQRRYDALGR
RSWQSSAFSDGKITRPEDGILWRAFRYTGRGELAGVSDALRGEVHYGYDAEGRLLQHRELKSGRVGNRLLYDAADNLLGG
QSPHDDPEQPPPPPLSSNRLPHWQRLFYRYDVWGNLVSRRHGVNEQHYTYDADNRLIRARGFGPQGEFSARYHYDALGRR
SRKEVTFAAKAPQTTRFLWQGYRLLQEQRGNGTRRTWSYDPASPWTPLAAIEQAGDAEQADIYWLNADLNSAPLEVTDAE
GNLRWSGHYDTFGKLLGQTVAGAAQRTGPVYDQPLRYAGQYQDNESGLHYNLFRYYEPDVGRFTTQDPVGLAGGMNLYAY
APNPYGWVDPLGLSKCALEGKYKEVDKANLPDWIKDSFKNGEYKTVRTTDEVNLYRVFGGNAKIDGSFVSTSPALNKIQA
KIDSALLPEWKNTRQFEATITVPKGTILQVGKVEQQVMLSGAKLQGGADQILLPHGYPTSWISDVRFL

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
YpsIP31758_3692	YP_001402646.1	RHS/YD repeat-containing protein	Not tested	YAPI	Protein	0.0	47
api89	CAF28563.1	putative membrane-bound sugar-binding protein	Not tested	YAPI	Protein	0.0	47