Gene Information

Name : ECOK1_2568 (ECOK1_2568)
Accession : YP_006101717.1
Strain : Escherichia coli IHE3034
Genome accession: NC_017628
Putative virulence/resistance : Unknown
Product : putative replication gene A protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 2653753 - 2656560 bp
Length : 2808 bp
Strand : +
Note : identified by match to protein family HMM PF05840

DNA sequence :

ATGACGGCAGAGTACATCAGGGACTGGCAACAACCGCGCCACGCAGTGGGGCGTGAAGGAACGGGGATCCCCGCTCCTGA
ATCCGCGCTTTCCTCCTGGCTGGATGCCTACCGGGTAGAGAACGAGCGCTGCCAGGAAATGGCTGATGCGGCGTTCTCCG
CAACGCCGCTGGGCAACCTGATTAATAAAAGCCTGGACGCACAGGAAAAACAGGACAAAACCATCACACTGGCAGGAGAC
GCCAGAAAACAGGCACGCGGCGCGGTGGATGAAGCCATGGCTTCGCTGCGCCTGCTGCCGTCCTATCTGCGCGATCCGCT
TATTCGCCACCTCTCCTTCCTGCGCAAAAAACAGGAAGCCGATCGTCAGAAAGGCAAAAAGAGCTGGCAGGCTGAACGCT
ACGCGCGCGGAAACCTGCGCAAAATATTCGAACGTCTGGAGCGCACCGATCACCGCTGGCTGACACAGGGTTATCGCTCC
CTTGCCGGACGCGAACGCCTGGATGATTTGCTTTACCTGCCGCAGCTCAACCAGCACCAGATACAGACGCTGGCCACCAT
GACGGCGGCGATGTTCAGCAGCACCTTCGAAAAACTCTGCGATGGCTTTGGCGCGACCGATGGCGAACTGACCATGGATG
TAACGCTGAAGGCGTATCAGATGCTGGCCCGCATGGCGTTACACCTGCACGCCATGCCGCCACATTACGAAGCTCTGAAC
AAGAGCGATCCGGATACGGAACTGTTACCGGGCGCAATCCTTCGCCTGACCTGTGCGGAATGGTGGAAACGCAAACTGTG
GCTGTTACGTTGCGAGTGGCGGGAAGAACAACTCCGCGCCGCCTGTCTGGTTTCCAGAAAAACATCGCCCTATCTGAGCC
AGGACGCGTTAAGCGAGTTTCGCGCACAGCGCGAGAAAACACGCGATTTCCTGAAAAGTTTCATGCTGGAAAACGAAGAC
GGGTTCACGATTGATCTCGAGACAGTGTATTACGCGGGAGTAAGTAACCCGGTTCACCGTAAGGCAGAAATGATGGCCAC
CATGAAGGGGCTGGAACTTCTGGCCGAAGCCCGTGGCGACAAAGCGGTGTTTCTGACCATCACCTGCCCGTCAAAATACC
ACGCCACAACAGAGAACGGTCATCCGAATCCCAAATGGAACGGGGCCACCATGCGCGACTCCAGCGATTACCTGGTTAAC
ACGTTTTTTGCGGCGGTCCGCAAGAAACTGAACCGCGACGGCCTGCGCTGGTATGGCATCCGCACGGTGGAGCCTCACCA
TGACGGCACCGTGCACTGGCATATGATGGTCTTTGCTCATCCGGAAGAAATCGACACCATTGTGTCCCACACCCGCGATA
TTGCCATTCAGGAAGATCGTCACGAGCTGGGTGATGATATTACCCCACGCTTTAAGGCGGAGTACGTCGACGGCTCAAAA
GGCACGCCAACCAGCTACATCGCCACCTACATCGGAAAGAACCTGGACAGCCGCGCCGTAGATGGCATCGACCCGAAAAC
GGGCAAGCCACGCGTTGACCACGAAACCGGAAAATCAATGGCCGAGAGCGTGGAACGCGCCATCGGCTGGGCGCGCCTTC
ACCGTGTCCGCCAGTTCCAGTTCTTTGGTATCCCCTCCCGTCAGGTGTGGCGTGAACTCCGCCGCCTTGCCAGCCAGATG
GCACGCAACCCGGAAGGCCCGCAACGGCTGAAGGATGACGCAATGGATGCGGTACTCGCTGCCGCTGATGCCGGATGTTT
TGCCACCTACATAGAGAAACAGGGCGGCGTACTTGTTCCACGCCAAGACTACCTGATTCGCACCGCCTACGACCTCGCAG
ATGAGCTGAACGATTACGGCGAACAGAGCGTACAGATTTACGGGATCTGGTCGCCGCTCATCGGGGAGTCTTCCCGCGTA
TGCACGCATCCGGATAACTGGAAGCTGGTAAGACGCAAACCGGAAGCGGAAGACAGCTCCCACGAAAATGGTTTTGACCT
TCAGGGCGGCCCCGCCGCCCCTTGGACTCGTGGCAATAACTGTCCCCGTGTACAGGAAACGGACAACAACGGGACAGAAC
AGCCGGAAGAACGGCCAGCACCGTGGCCGCAGCTTCCTGACGGCGTTGACGTGAATGAATGGATGCGCTCACTGAAACGG
CACGAACGCCGGGCGCTGATGCGTTCGCTGCGTGACAAACAGGCAAAAAACAGCAGTGATGAAATGCAGAACTGGACACA
GAGCCGCAAACAGCCACGGCCTTTGCCTGATAACCACGAGTTACTCGCTAAAGAATGGCGGGAGTCTGCTGAATCTCTCG
GCCTGCATATCGGTGAACAGCAGATGCAGCACCTGTTACGGGGCGGCAGTCTGTACGTTGACGGCAGCATCATTGCACCG
CAGGGATTTGAAATTGTACGCAAACCAGATACCCGCCCGGACAGCCGAATCACGCAACTCTGGCAGCGCCTGAGCCGTAA
TCACGGCGTAAGCAGCACGGAGATCCGCCATAACCCGGTCGCCAGCTATCTGGAACAGCTGGGGGCATCAGACCCCGAAG
CCGCCGCACACCTGGCATCCACACTTCAGCAGGACCAGAACACCATGAAAACCCCCGTTACCGTGCTTTCTGACATGCTG
CGCGCCATCCGTGACGCAGAGCACGCACAGAGAATCAGTGAAACCACTGAACGCGCCCACCGCAAAGCAGACCTGCTGCG
GGGTAGCCTGACCAGTGGAAACAAAAAACAGACAGAAACGGGACTCACAAATCCCGTAAATGAGCAAAAAACGTGCCGCG
ATATATGA

Protein sequence :

MTAEYIRDWQQPRHAVGREGTGIPAPESALSSWLDAYRVENERCQEMADAAFSATPLGNLINKSLDAQEKQDKTITLAGD
ARKQARGAVDEAMASLRLLPSYLRDPLIRHLSFLRKKQEADRQKGKKSWQAERYARGNLRKIFERLERTDHRWLTQGYRS
LAGRERLDDLLYLPQLNQHQIQTLATMTAAMFSSTFEKLCDGFGATDGELTMDVTLKAYQMLARMALHLHAMPPHYEALN
KSDPDTELLPGAILRLTCAEWWKRKLWLLRCEWREEQLRAACLVSRKTSPYLSQDALSEFRAQREKTRDFLKSFMLENED
GFTIDLETVYYAGVSNPVHRKAEMMATMKGLELLAEARGDKAVFLTITCPSKYHATTENGHPNPKWNGATMRDSSDYLVN
TFFAAVRKKLNRDGLRWYGIRTVEPHHDGTVHWHMMVFAHPEEIDTIVSHTRDIAIQEDRHELGDDITPRFKAEYVDGSK
GTPTSYIATYIGKNLDSRAVDGIDPKTGKPRVDHETGKSMAESVERAIGWARLHRVRQFQFFGIPSRQVWRELRRLASQM
ARNPEGPQRLKDDAMDAVLAAADAGCFATYIEKQGGVLVPRQDYLIRTAYDLADELNDYGEQSVQIYGIWSPLIGESSRV
CTHPDNWKLVRRKPEAEDSSHENGFDLQGGPAAPWTRGNNCPRVQETDNNGTEQPEERPAPWPQLPDGVDVNEWMRSLKR
HERRALMRSLRDKQAKNSSDEMQNWTQSRKQPRPLPDNHELLAKEWRESAESLGLHIGEQQMQHLLRGGSLYVDGSIIAP
QGFEIVRKPDTRPDSRITQLWQRLSRNHGVSSTEIRHNPVASYLEQLGASDPEAAAHLASTLQQDQNTMKTPVTVLSDML
RAIRDAEHAQRISETTERAHRKADLLRGSLTSGNKKQTETGLTNPVNEQKTCRDI

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
STY4635	NP_458715.1	conserved hypothetical protein	Not tested	SPI-7	Protein	4e-134	42
t4328	NP_807922.1	hypothetical protein	Not tested	SPI-7	Protein	2e-134	42