Gene Information

Name : ECs2633 (ECs2633)
Accession : NP_310660.1
Strain : Escherichia coli Sakai
Genome accession: NC_002695
Putative virulence/resistance : Unknown
Product : phage replication protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 2599540 - 2602224 bp
Length : 2685 bp
Strand : +
Note : similar to replication proteins e.g. GpA [Bacteriophage 186] gi|1351406|sp|P41064|VPA_BP186

DNA sequence :

ATGGCTGATGCGGCGTTCTCCGCAACGCCGCTGGGCAACCTGATTAATAAAAGCCTGGACGCACAGGAAAAACAGGACAA
AACCATCACACTGGCAGGAGACGCCAGAAAACAGGCACGCGGTGCGGTGGATGAAGCCATGGCCTCGCTGCGCCTGCTGC
CGTCCTATCTGCGCGATCCGCTTATTCGCCACCTCTCCTTCCTGCGCAAAAAACAGGAAGCCGATCGTCAGAAAGGCAAA
AAGAGCTGGCAGGCTGAACGCTACGCGCGCGGAAACCTGCGCAAAATATTCGAACGTCTGGAGCGCACCGATCACCGCTG
GCTGACACAGGGTTATCGCTCCCTTGCCGGACGCGAACGCCTGGACGATTTGCTTTACCTGCCGCAGCTCAACAAACACC
AGATACAGACGCTGGCCACCATGACGGCGGCGATGTTCAGCAGCACCTTCGAAAAACTCTGCGATGGCTTTGGCGCGACC
GATGGCGAACTGACCATGGATGTAACGCTGAAGGCGTATCAGATGCTGGCCCGCATGGCGTTACACCTGCACGCCATGCC
TCCACATTATGACGCACTGACAACAGACAAAGACCGGAGGAACGAACCGGACACGGAGCTGCTGCCGGGCGCAATCCTTC
GCCTGACCTGTGCGGAATGGTGGAAACGCAAACTGTGGCTGTTACGTTGCGAGTGGAGAGAAGAACAACTCCGCGCCGCC
TGTCTGGTTTCCAGAAAAACATCGCCCTATCTGAGCCAGGACGCGTTAAGCGAGTTTCGCGCACAGCGCGAGAAAACACG
CGATTTCCTGAAAAGTTTCATGCTGGAAAACGAAGACGGGTTCACGATTGATCTCGAGACAGTGTATTACGCGGGAGTAA
GTAACCCGGTTCACCGTAAGGCAGAAATGATGGCCACCATGAAGGGGCTGGAACTTCTGGCCGAAGCCCGTGGCGACAAA
GCGGTGTTTCTGACTGTCACCTGCCCGTCAAAATACCACGCTACAACAGAGAACGGTCATCCGAATCCCAAATGGAACGG
GGCCACCATGCGCGACTCCAGCGATTACCTGGTTAACACGTTTTTTGCGGCGGTCCGCAAGAAACTGAACCGCGACGGCC
TGCGCTGGTATGGCATCCGCACGGTGGAGCCTCACCATGACGGCACCGTGCACTGGCATATGATGGTCTTTGCTCATCCG
GAAGAAATCGACACCATTGTGTCCCACACCCGCGATATTGCCATTCAGGAAGATCGTCACGAGCTGGGCGATGATATTAC
TCCGCGCTTTAAGGCGGAGTATGTCGACGGCTCAAAAGGCACGCCAACCAGCTACATCGCCACCTACATCGGAAAAAACC
TGGACAGCCGCGCCGTGGATGGCATCGACCCGAAAACAGGCAAACCACGCGTTGACCACGAAACCGGAAAATCAATGACC
GAGAGCGTGGAACGCGCCATTGGCTGGGCGCGCCTTCACCGGGTCCGCCAGTTCCAGTTCTTTGGCATCCCCTCCCGTCA
GGTGTGGCGTGAACTGCGTCGCCTTGCCAGCCAGATGGCACGCAACCCGGAAGGCCCGCAACGGCTGAAGGATGACGCAA
TGGATGCGGTTCTTGCTGCCGCTGATGCCGGATGTTTTACCACCTACATTGAGAAACAGGGAGGCGTACTTGTTCCACGC
AAGGACTACCTGATTCGCACCGCCTACGACCTCGCAGATGAGCTGAACGATTACGGCGAACAGAGCGTACAGATTTACGG
GATCTGGTCACCACTCATCGGGGAATCCTCCCGTGTGTGCACGCACCCGGATAACTGGAAGCTGGTAAGACGTAAACCGG
GAGTAGAAGACAGCGCCCGCGAAAATGGTTTTGACCTTCAGGGCGGCCCTGCCGCCCCTTGGACTCGTGGCAATAACTGT
CCCCGTGTACAGGAAACGGACAACAACGGGACAGAACAGCCGGAAGAACGGCCAGCACCGTGGCCGCAGCTTCCTGACGG
CGTTGACGTGAACGAATGGATGCGCTCACTGAAACGGCACGAACGCCGGGCGCTGATGCGTTCGCTTCGTGACAAACAGG
CAAAAAACAGCAGTGATGAAATGCAGAGCTGGACACAGAGCCGCAAACAGCAGCGGCCTTTGCCTGATAACCACGAATTA
CTCGCTAAAGAATGGCGGGAGTCTGCTGAATCTCTCGGCCTGCATATCGGTGAACAACAGATGCAGCACCTGTTACGGGG
CGGCAGTCTGTACGTTGACGGCAGCATCATTGCACCGCAGGGATTTGAAATTGTACGCAAACCGGATACCCGCCCGGACA
GCCGAATCACGCAGCTCTGGCAGCGCCTGAGCCGTAATCATGGCGTAAGCAGCACGGAGATCCGCCATAACCCGGTCGCC
AGCTATCTGGCACAGCTGGGGGCATCAGACCCTGAAGCCGCCGCACGCCTGGCATCCACACTTCAGCAGGACCAGAACAC
CATGAAAACACCCGTTACCGTGCTTTCTGACATGCTGCGCGCCATCCGCGACGCAGAGCACGCACAGAGAATCAGTGAAA
CCACTGAACGCGCCAGCCGCAAAGCAGACCTGCTGCGGGGTGGCCTGACCAGTGGAAACAAAAAACAGACAGAAACGGGA
CTCACAAATCCCGTAAATGAGCAAAAAACGCGCCGCGATATATGA

Protein sequence :

MADAAFSATPLGNLINKSLDAQEKQDKTITLAGDARKQARGAVDEAMASLRLLPSYLRDPLIRHLSFLRKKQEADRQKGK
KSWQAERYARGNLRKIFERLERTDHRWLTQGYRSLAGRERLDDLLYLPQLNKHQIQTLATMTAAMFSSTFEKLCDGFGAT
DGELTMDVTLKAYQMLARMALHLHAMPPHYDALTTDKDRRNEPDTELLPGAILRLTCAEWWKRKLWLLRCEWREEQLRAA
CLVSRKTSPYLSQDALSEFRAQREKTRDFLKSFMLENEDGFTIDLETVYYAGVSNPVHRKAEMMATMKGLELLAEARGDK
AVFLTVTCPSKYHATTENGHPNPKWNGATMRDSSDYLVNTFFAAVRKKLNRDGLRWYGIRTVEPHHDGTVHWHMMVFAHP
EEIDTIVSHTRDIAIQEDRHELGDDITPRFKAEYVDGSKGTPTSYIATYIGKNLDSRAVDGIDPKTGKPRVDHETGKSMT
ESVERAIGWARLHRVRQFQFFGIPSRQVWRELRRLASQMARNPEGPQRLKDDAMDAVLAAADAGCFTTYIEKQGGVLVPR
KDYLIRTAYDLADELNDYGEQSVQIYGIWSPLIGESSRVCTHPDNWKLVRRKPGVEDSARENGFDLQGGPAAPWTRGNNC
PRVQETDNNGTEQPEERPAPWPQLPDGVDVNEWMRSLKRHERRALMRSLRDKQAKNSSDEMQSWTQSRKQQRPLPDNHEL
LAKEWRESAESLGLHIGEQQMQHLLRGGSLYVDGSIIAPQGFEIVRKPDTRPDSRITQLWQRLSRNHGVSSTEIRHNPVA
SYLAQLGASDPEAAARLASTLQQDQNTMKTPVTVLSDMLRAIRDAEHAQRISETTERASRKADLLRGGLTSGNKKQTETG
LTNPVNEQKTRRDI

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
STY4635	NP_458715.1	conserved hypothetical protein	Not tested	SPI-7	Protein	1e-134	43
t4328	NP_807922.1	hypothetical protein	Not tested	SPI-7	Protein	8e-135	43