Gene Information

Name : D781_0523 (D781_0523)
Accession : YP_007343067.1
Strain : Serratia marcescens FGI94
Genome accession: NC_020064
Putative virulence/resistance : Unknown
Product : RHS repeat-associated core domain protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 565814 - 570127 bp
Length : 4314 bp
Strand : +
Note : PFAM: RHS protein; PAAR motif; RHS Repeat; TIGRFAM: RHS repeat-associated core domain; YD repeat (two copies)

DNA sequence :

ATGGGTGAAGCAGCGCGCGTCGGGGACAGCATCGGCCATTCCCATGCGCTGGCAGGGATGATTGGCGGCACGTTTATCGG
CGGCCTGATTGCCGCCGCCGGTGCGGTGGCGGCGGGCGCCCTGTTTGTCGCCGGGCTGGCGGCCTCCTGCGTGGGCGTCG
GCGTGCTGCTGATTGGCGCCAGCCTGGCGGTGGGCTACCTCTCCGGCGAGCTGGCCACCCAGGCGCGCGACGGCATTGCC
GCCGCCGGCGCCGGCAGTCTGTCGCCCAAGGGCACGATACTGACCGGCTCCGGCAACGTGTTTATCAACGGCAAACCGGC
GGCCATCGCCACCGTCAGCCGCGTGGTCTGCGAGGATGACGGCCCGAGCATGCAGATGGCGCAGGGCTCGGACAAGGTGT
TTATCAACGGTTACCCGGCGGTGCGCAGCGGCGACAAGACCAACTGCGACGCGCAGGTGATGGCCGGCTCGCCCGATGTG
CGCATCGGCGGCGGCACCGTCACCACGCTGCCCATCAAACCGGAAGTGCCCGACTGGCTGTATAAAATCTCTGACCTGAC
GCTGCTGTTCGCCGGCCTGATAGGCGGCGTCGGCGGCGCGGCCAGCAAGCTGGGGGCGCTCGGGCGCATGCTCAGCAAGG
CGCCGGGCATCAACAAGCTTGGCCGCGTGGCCTGCCGCGCCGGTGCATTGATGACCGCCACCGCGGCGACGGGCATTATC
GCCCGTCCGCTGGACGTGGTCAGCGGCCAGAAGTTTCTCGACGGCGATGACGAGCTGGACTTTGTGCTGCCGTCGCGCCT
GCCGGTGGCGTGGCAGCGCTACTGGCGCAGCGGCAACCCGGCGGAGGGCGTGCTGGGGCGTGGCTGGAGCCTGTTCTGGG
AGAGCAGCCTGCAAATCTGGCAGGAGGGGCTGGTGTGGCGCGCGCCGTCCGGCGATTATGTCTCCTTCCCGATGGTGCCG
CGCGGCCACAAGACCTACTGCGAAGCGGAAAAATGCTGGCTGATGCACAACGCCGACGGCAGCTGGCAGGTGTTCGACGT
CAGCGAACAGGCGTGGCACTATCCGCGGCTGGAGGCGCAGCAGCCGAGCCGGCTGAGTATGATGACCGACGCCGTCGGCA
ACGCCACCTCGCTGTTCTATAACGATGCGGGGCAACTGAGTGAGCTGGTGGACAGCGCCGGGCAGCGTCTGGTCTGCCGC
TACCTGACGACGGCCAACGGTGCGTTGCGGCTGGCGGCGGTAGCGTGGCAAAACGGCCAGGATGAGCAGGTGCTGGCGAG
CTACGGCTACGACGACGCGGGGCAACTGGTCACCGTCCGCAACCGCGCCGGCGAGGTGACGCGGCGTTTTGGCTGGCAGG
ACGGGCTGATGGTTAGCCATCAGGACCAGAACGGCCTGCTGAACGAATACCGCTGGCAGGAGATTGACGGCCTGCCGCGG
GTGGTGGCCTACCGCAACAGCGCCGGCGAGCAGCTGTCCGTCTATTATGATTTCGCCAACGGGACGCGCCGGGCGGTGCG
TGACGACGGCAAACAGGCGCTGTGGCAGCTGGACGATGACGACAACGTCGCGCAGTTCACCGACTATGACAGCCGTCGCT
ACGGCCTTATCTACGCGCGCGGCGAACTGTGCAGCGTGGTGCTGCCGGGCGGTGCGCAGCGACAGAGCGAGTGGGACCCG
TACGGCCGCATGCTGAGCGAGACCGACCCGCTGGGCCGCACCACCACCTACCAATATTCCCGCAACAGCGGCCGCCTGTT
CTCGGTCACCGGGCCTGACGGCAGCCAGGCGTTCCAGCACTGGGACGAGCAGGGGCGTCTGGTCAGACAGACGGACGCGC
AGGGGCAGAGCACGCATTACCACTACCCGGACCCGGAAGAGAGCCTGCCGGAGCGCATCACCGACGCGCTGGGCGGTGAA
GTGCAGATGGTCTGGAACGCACAGGGGCAGCTGACGCGCCATACCGACTGTTCCGGCAGCGTCACCGCCTACACCTATGA
CGCGCTGGGACAGCTGACGCACCGCACCGATGCGGAAGGCCACCTGACCCGTTACCGCTGGGACGCCGCCGGCCGGCTGC
AGCAGCTGCGCCATCCGGACGGCAGCGACGAGCAGTTTGACTGGAACGCGCAGGGCCAGCTGGCCGCGCACCGGGACCCG
CTCGGCAGCGAGACGCGCTGGCAGTACACCCCGCTGGGCCTGCCGGACAGCATCACCGACCGCATCAACCGCACGCGTCG
TTATCACTACGGCCCGCGCGGCTGGCTGATGCGGCTGGAGAACGGCAACGGCGCCGACTACCAGTTCAGCTACGACGCGG
CAGGCCGCCTGCAGGTGGAACAGCGGCCGGACGGGCAGCGCCGTTACTACCATTACGGCGCCGACGGGCTGCCGACGACG
CTGCTGGAAACCGGCGCACCGGCCGCTGATGGCACCATGGCAGAGCGGCGGCAGCACTTCCGCTTTGATGAGGCGGGTCA
GCTGACGGCGCGCACCACCGACAGCGCCGAATGGCGCTACGACTATGACGCCGACGGGCGGCTGACGACGCTGACGCGCA
CGCCGACCGCCGCCGGTGCGGCGCTGGGCATCGAGCCGGACAGCATCCGGCTGCGCTACGACCGCGCCGGTAACCTGCTG
AGCGAGCAAGGCGTCAACGGCGAGCTGCAGTATCAGTGGGATGCGCTGGGCAACCTGCAGGCGCTGACGCTGCCGCAGGG
CGACCGGCTGCAGTGGCTCTATTACGGCTCCGGCCACGCCAGCGCCATCAGGTTCAATCAGCAGCTGGTGAGCGAGTTCA
GCCGCGACCGGCTGCACCGGGAGACCGGACGTACGCAGGGGGCGCTGCACCAGCGGCGGCAGTACGATGCGCTGGGCCGC
CGCAGCTGGCAGAGCAGCGGCTTCAGCCACGGGCAACTGACGAAGCCGGAAGACGGCGTGCTGTGTCGGGTGTACCACTA
CAGCGGCCGCGGCGAGATAGCCGGCGTCGACGACGCGCTGCGCGGAGAAGTCCGCTACGGCTACGATGCGGAAGGACGCC
TGCTGCAGCACCGCGAGGCGCAGCAGGGCAAGCCGGGCCACCGCCTGCAGTACGACATGGCGGACAACCTGCTGGGCGCG
CAGAGCGCCAGCCGCGCGCTGGAGGAGCAGCTGCCGCCGGCGCCGCTGGGGGATAACCGGCTGACGCACTGGCAGCAGCT
GTTCTACCGTTACGACGGCTGGGGCAACCTGATAAGCCGGCGCAACGGGCTGTACGAGCAGCACTATGTCTACGATGCGG
ACAACCGGCTGACGGCAGCGCACGGTCGCGGCCCGCAGGGCGAGTTCCGGGCGCAGTATCACTACGATGCGCTGGGCAGG
CGCACGCGCAAGCAGGTGGACTACAAGGGCAAGGCGGCGCAGAGCGCGCGTTTCCTGTGGCAGGGCTACCGGCTGTTGCA
GGAGCAGCGGGACGATGGCACGCGCCGCAGCTGGAGCTATGAGCCGGACAGCCCGTGGACGCCGCTGGCGGCCATTGAGC
AGGCGGGGGAGAGCCGGCAGGCGGATATCTTCTGGCTGCACAGCGAGCAGAACGGCGCGCCGCTGGAGGTGACGGACGGT
GAAGGCGGGCTGCGCTGGTCGGGGGATTACGACACCTTCGGCAGGCTGAAGGGGCAGACGGCGGCGGGCATCCTGCAGCG
CCGGGGCGCGGCCTATGAGCAGCCGCTGCGCTACGCCGGACAGTACCAGGATAGCGAGAGCGGACTACACTATAATCTGT
TCCGCTACTACGAGCCGGAGGTAGGTCGCTTTACTACCCAGGATCCGATAGGGCTGCAGGGCGGACTGAACCTGTATCAG
TATGCGCCGAACCCGTATGGGTGGGTGGATCCGTTGGGGTTGACTGCTTGTTCGTCAGGTTCTTCTTTAACCGTAAATAA
ACCTAAAATTTTGAGTAGCTCGAATTTAACTAATGCGGAAAGAAGCTATCTGGAAAGACAGTTTACAAAAAAACAAAATG
CACTTAATCGGGCGGCACAGCGTGGTGAGTTGGTTTGGTCTCCTGGGACTCATGATGTTAGAATTTCCTCAGTACAAAGT
TCATATCGGCAGGCAGTAGCGGCTCGTTATGAGAGAATGTTTGGTCAAGCGCCAGATTTAACAAAGCTGAACGCAGATCA
TCCAGTTGACTTGATTGTTGGTGGTTCCCCAACGCAGAGATTACAAATGCTCAATGAATCAATAAACAAAAGCGTTGGTA
GTTCCTTAAAAAATGCAGGTAGAAAAGCCGGTCTTCAACCAGGAGACCGAATTAGTGAAATAATATTTCAATAA

Protein sequence :

MGEAARVGDSIGHSHALAGMIGGTFIGGLIAAAGAVAAGALFVAGLAASCVGVGVLLIGASLAVGYLSGELATQARDGIA
AAGAGSLSPKGTILTGSGNVFINGKPAAIATVSRVVCEDDGPSMQMAQGSDKVFINGYPAVRSGDKTNCDAQVMAGSPDV
RIGGGTVTTLPIKPEVPDWLYKISDLTLLFAGLIGGVGGAASKLGALGRMLSKAPGINKLGRVACRAGALMTATAATGII
ARPLDVVSGQKFLDGDDELDFVLPSRLPVAWQRYWRSGNPAEGVLGRGWSLFWESSLQIWQEGLVWRAPSGDYVSFPMVP
RGHKTYCEAEKCWLMHNADGSWQVFDVSEQAWHYPRLEAQQPSRLSMMTDAVGNATSLFYNDAGQLSELVDSAGQRLVCR
YLTTANGALRLAAVAWQNGQDEQVLASYGYDDAGQLVTVRNRAGEVTRRFGWQDGLMVSHQDQNGLLNEYRWQEIDGLPR
VVAYRNSAGEQLSVYYDFANGTRRAVRDDGKQALWQLDDDDNVAQFTDYDSRRYGLIYARGELCSVVLPGGAQRQSEWDP
YGRMLSETDPLGRTTTYQYSRNSGRLFSVTGPDGSQAFQHWDEQGRLVRQTDAQGQSTHYHYPDPEESLPERITDALGGE
VQMVWNAQGQLTRHTDCSGSVTAYTYDALGQLTHRTDAEGHLTRYRWDAAGRLQQLRHPDGSDEQFDWNAQGQLAAHRDP
LGSETRWQYTPLGLPDSITDRINRTRRYHYGPRGWLMRLENGNGADYQFSYDAAGRLQVEQRPDGQRRYYHYGADGLPTT
LLETGAPAADGTMAERRQHFRFDEAGQLTARTTDSAEWRYDYDADGRLTTLTRTPTAAGAALGIEPDSIRLRYDRAGNLL
SEQGVNGELQYQWDALGNLQALTLPQGDRLQWLYYGSGHASAIRFNQQLVSEFSRDRLHRETGRTQGALHQRRQYDALGR
RSWQSSGFSHGQLTKPEDGVLCRVYHYSGRGEIAGVDDALRGEVRYGYDAEGRLLQHREAQQGKPGHRLQYDMADNLLGA
QSASRALEEQLPPAPLGDNRLTHWQQLFYRYDGWGNLISRRNGLYEQHYVYDADNRLTAAHGRGPQGEFRAQYHYDALGR
RTRKQVDYKGKAAQSARFLWQGYRLLQEQRDDGTRRSWSYEPDSPWTPLAAIEQAGESRQADIFWLHSEQNGAPLEVTDG
EGGLRWSGDYDTFGRLKGQTAAGILQRRGAAYEQPLRYAGQYQDSESGLHYNLFRYYEPEVGRFTTQDPIGLQGGLNLYQ
YAPNPYGWVDPLGLTACSSGSSLTVNKPKILSSSNLTNAERSYLERQFTKKQNALNRAAQRGELVWSPGTHDVRISSVQS
SYRQAVAARYERMFGQAPDLTKLNADHPVDLIVGGSPTQRLQMLNESINKSVGSSLKNAGRKAGLQPGDRISEIIFQ

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
YpsIP31758_3692	YP_001402646.1	RHS/YD repeat-containing protein	Not tested	YAPI	Protein	0.0	48
api89	CAF28563.1	putative membrane-bound sugar-binding protein	Not tested	YAPI	Protein	0.0	48