Gene Information

Name : SCE1572_29155 (SCE1572_29155)
Accession : YP_008152220.1
Strain : Sorangium cellulosum So0157-2
Genome accession: NC_021658
Putative virulence/resistance : Unknown
Product : hypothetical protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 8288361 - 8291501 bp
Length : 3141 bp
Strand : +
Note : Derived by automated computational analysis using gene prediction method: GeneMarkS+.

DNA sequence :

GTGAGCCCCGCCGCCGGCGTCCCCGCCGTGACCGAGTCGGACGTCGAGGAGCTCGCCCTCCAGACGTTCGCTCGGCTCGG
CTACGAGTGCCTCCACGGCCCGGACATCGCCCCCGGCGAGCCCGCCGCGGAGCGCGCCACCTACGCCGACGTCGTCCTCC
GCGGCCGCCTCGACGAGGCGCTCCGCCGCCTCAACCCCGGCGTCCCGCAGACCGCCATCCACGAGGCGCTCCGCAAGATC
CTCGTCCCGGACGCCCCCTCGCTCCTCCAGAACAACCGCCGCTTCCACCGCCTGCTCCGCGACGGCGTCGAGGTCGAGAT
CGCGACGCCCGGCGGCGAGGTCCGCGGCGAGCGCCTCCGCCTCTTCGACTTCGACGACATCGAGGAGAACGAATACCTCG
TCGTCAACCAGCTCACCGTCATCGAGGGACCGCACAGGCACCGCCGCCCCGACATCGTCGTCTTCGTCAACGGCGTCCCC
CTCGCCGTCGTCGAGCTCAAGAGCCCCGCCGACGAGAACGCGACGGTCCAGGGCGCGTTCAACCAGCTCCAGACCTACAA
GGCGGAGATCCCGTCGCTCTTCGTCTACAACGAGCTGCTCGTCGTCTCGGATGGCACGACGGCGCGCCTCGGGACCCTCA
CCTCCTCCTGGGAGCGCTTCGGCCCCTGGCGCACGGTCGACGGCAGCGCCGTGGCCGCGCGGGGCACCCTGGAGATGATC
ACGCTCCTCGAGGGCGTCTTCGACCGCGCGCGCCTCCTCGACCTCGTCCGCCACTTCGTCGTGTTCGAGGAAGACCGCGA
CGAGGTCGTGAAGAAGATCGCCGGCTACCACCAGTTCCACGCCGTGCGCACGGCCGTCGAGGAGACGGTCCGCGCGACCC
GCCCCGGCGGCGACCGCAAGGTCGGCGTCGTCTGGCACACGCAGGGCTCGGGCAAGTCGCTGACCATGACCTTCTACGCG
GGGAAGGTCGTGCTCGATCCGGCCATGGAAAACCCCACGATCGTGGTCATCACGGACCGCAACGACCTCGACGACCAGCT
CTTCGGGACCTTCGGGCGCTGCCACGAGCTGCTCCGGCAGAAGCCGGTCCAGGCGCGCGACCGGAGCCACCTGCGCGAGC
TGCTCCAGGTCGCGGCCGGCGGCGTCGTCTTCACCACGGTGCAGAAGTTCCTGCCCGAGGAGAAGGGCGACAGATTCCCC
CGGCTCTCCGAGCGGCGGAACGTGGTCGTCATCGCCGACGAGGCGCACCGCAGCCAGTACGGCTTCAAGAGCAAGCTCGT
CAAGACGAAGGACGGCGGCTATCTCGTGCCCGGCTTCGCGCAGCACATGCGCGACGCCCTGCCGAGCGCGTCGTTCATCG
GCTTCACCGGCACCCCCATCGAAGCGGTCGACAAGGACACGCGCGCCGTCTTCGGCGACTACATCTCGGTCTACGACATC
CAGCGCGCCGTGGAGGACGGGGCGACCGTCCCCATCTACTACGAGAGCCGCGTCGCGAAGCTCGACCTGAACGACGACCT
CAAGAAGGTCATCGACGACGAGTTCGAGGAGGTCACCGAACAAGAAGAGGAGTCGAGGAAGGAAAAGCTCAAGTCGAAGT
GGGCCGCGCTGGAGGCCGTCGTCGGCGCGGAGAAGCGCGTGAACATGATCGCCGAGGACTTGATCCGGCACTTCGAGGCT
CGGGTCGAGGCGATGGAGGGCAAGGCGATGGTCGTCTGCATGTCGCGCCGCATCTGCGTGGACATGTACGCCGCGCTCGT
CGCGCTCCGGCCCGCCTGGCACAGCCCGGACGACGACAAGGGCGCGATCAAGGTGGTGATGACCGGCTCCGCGTCCGATC
CGCAGCCGTGGCAGCAGCACATCCGGAACAAGGCGCGCCTCCGCGACCTCGCCGACCGGCTGAAGGACCCGGCCGACCCG
CTCAAGGTGGTCATCGTGCGCGACATGTGGCTCACCGGGTTCGACGCGCCCTGCCTGCACACGCTCTACGTCGACAAACC
CATGCAGGGACACGGCCTCATGCAGGCCATCGCGCGCGTGAACCGCGTGTTCCGCGACAAGCCGGGCGGGCTGGTCGTCG
ACTACCTCGGCCTCGCCGAGAACCTGCGCAAGGCGCTGGCGACGTACACCGAGAGCGGCGGCAAGGGCGACCCCGCACGC
GATCATGCCAGGGCCGTGCCGCGCATGATGGAGATGATCGAGGTCTGTCGCGGCCTGTTCCACGGGTTCGACGTCATGGC
GTTCGTGAACGGCTCGCCGATCGAGCGGCTCATGCTCCTGCCGGCCGCCCAGGAGCACATCTTCGGGCTCGAGGACGGGC
GCGACCGGCTCGTGCAGGCCGTGACCGAGCTGAGCAGGAGCTTCGCGCTCGCGGTGCCGCACGACGACGCGCTGGCCGTC
CGCGACGAGGTCGCGTTCTATCAGGCCGTGAAGGCCGCCGTCGTGAAGACGTCGCTGTCGGCGTCGGGCAAGTCGGAGGC
TGAGGTCGAGCTGGCGATCCGTCAGATCGTGTCGAAGGCGATCTCGACCGACGGCGTGATGGACGTGTTCGCGGCCGCCG
GGCTGAAGCGGCCGGACCTCTCCATCCTGTCGGAGGAGTTCCTCGCCGACGTGAAGGCGATGCAGCACAAGAACGTCGCC
GTGGAGCTGCTGCGGAAGCTCCTGCACGACGAGCTGAAGGTCCGGAGGCGCACGAACCTCGTCCAGTCGGAGGCGTTCTC
CGACAAGCTGGAGAAGACCATCGCGCGGTACCGCAACCGCGGTGTCGAGACGGCGCAGGTCATCGAGGAGCTGATCCGGA
TGGCCAGGGATGTGAAGGTCGCGCAGAAGCGCGGCGAGGATCTGAAGCTCAACGACGCGGAGCTGGCCTTCTACGACGCC
CTCGGGGCGAACGACTCTGCCGTGCAGGTGCTCGGCGACGCGGTGCTCGCGCAGATCGCCCGCGAGCTGACCGAGACCAT
CCGCAACTCGGTGACCATCGACTGGGCCGTGAAGGAGACAGTGCGGGCGAAGCTCCGCACCCTCGTGCGCCGCAGGCTGA
AGAAGCACGGGTATCCGCCGGACAAGACGGATGATGCGGTCAAGAAGGTGCTGGATCAGGCCGAGCTGCTCGCGCTGGAG
TGGGCGGCGCAGACACCCTGA

Protein sequence :

MSPAAGVPAVTESDVEELALQTFARLGYECLHGPDIAPGEPAAERATYADVVLRGRLDEALRRLNPGVPQTAIHEALRKI
LVPDAPSLLQNNRRFHRLLRDGVEVEIATPGGEVRGERLRLFDFDDIEENEYLVVNQLTVIEGPHRHRRPDIVVFVNGVP
LAVVELKSPADENATVQGAFNQLQTYKAEIPSLFVYNELLVVSDGTTARLGTLTSSWERFGPWRTVDGSAVAARGTLEMI
TLLEGVFDRARLLDLVRHFVVFEEDRDEVVKKIAGYHQFHAVRTAVEETVRATRPGGDRKVGVVWHTQGSGKSLTMTFYA
GKVVLDPAMENPTIVVITDRNDLDDQLFGTFGRCHELLRQKPVQARDRSHLRELLQVAAGGVVFTTVQKFLPEEKGDRFP
RLSERRNVVVIADEAHRSQYGFKSKLVKTKDGGYLVPGFAQHMRDALPSASFIGFTGTPIEAVDKDTRAVFGDYISVYDI
QRAVEDGATVPIYYESRVAKLDLNDDLKKVIDDEFEEVTEQEEESRKEKLKSKWAALEAVVGAEKRVNMIAEDLIRHFEA
RVEAMEGKAMVVCMSRRICVDMYAALVALRPAWHSPDDDKGAIKVVMTGSASDPQPWQQHIRNKARLRDLADRLKDPADP
LKVVIVRDMWLTGFDAPCLHTLYVDKPMQGHGLMQAIARVNRVFRDKPGGLVVDYLGLAENLRKALATYTESGGKGDPAR
DHARAVPRMMEMIEVCRGLFHGFDVMAFVNGSPIERLMLLPAAQEHIFGLEDGRDRLVQAVTELSRSFALAVPHDDALAV
RDEVAFYQAVKAAVVKTSLSASGKSEAEVELAIRQIVSKAISTDGVMDVFAAAGLKRPDLSILSEEFLADVKAMQHKNVA
VELLRKLLHDELKVRRRTNLVQSEAFSDKLEKTIARYRNRGVETAQVIEELIRMARDVKVAQKRGEDLKLNDAELAFYDA
LGANDSAVQVLGDAVLAQIARELTETIRNSVTIDWAVKETVRAKLRTLVRRRLKKHGYPPDKTDDAVKKVLDQAELLALE
WAAQTP

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
api52	CAF28526.1	hsdr-like Type I restriction enzyme	Not tested	YAPI	Protein	0.0	51
hsdR	BAH57699.1	type I restriction-modification system endonuclease homologue	Not tested	Type-VII SCCmec	Protein	0.0	48
hsdR	YP_251977.1	type I restriction-modification system restriction subunit	Not tested	SCCmec	Protein	0.0	47
hsdR	BAD24840.1	type I restriction-modification system endonuclease homologue	Not tested	Type-V SCCmec	Protein	0.0	47