Gene Information

Name : UMNK88_1031 (UMNK88_1031)
Accession : YP_006132819.1
Strain : Escherichia coli UMNK88
Genome accession: NC_017641
Putative virulence/resistance : Unknown
Product : phage replication protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 1032268 - 1035033 bp
Length : 2766 bp
Strand : -
Note : -

DNA sequence :

ATGACGGCAGAGCACATCAGGGACTGGCAACAACCGCGCCACGCAGTGGGGCGTGAAGGAACGGGGATCCCCGCTCCTGA
ATCCGCGCTTTCCTCCTGGCTGGATGCCTACCGGGCAGAGAACGAGCGCCGCAAGGAAATGGCTGATGCGGCGTTCTCCG
CCACGCCGCTGGGCAACCTGATTAATAAAAGCCTGGACGCACAGGAAAAACAGGACAAAACCATCACACTGGCAGGAGAC
GCCAGAAAACAGGCACGCGGCGCAGTGGATGAAGCCATGGCCTCGCTGCGCCTGCTGCCGTCCTATCTGCGCGATCCGCT
TATTCGCCACCTCTCCTTCCTGCGCAAAAAACAGGAAGCCGATCGCCGGAAAGGCAAAAAGAGCTGGCAGGCGGAACGCT
ATGCACGCGGAACCCTGCGCAAAATATTCGAACGTCTGGACCGCACCGATCACCGCTGGCTGACACCGGGTTATCGCTCC
CTTGCCGGACGCGAACGCCTGGACGATTTGCTTTACCTGCCGCAGCTCAACAAACACCAGATACAGACGCTGGCCACCAT
GACGGCGGCGATGTTCAGCAGCACCTTCGAAAAACTCTGCGATGGCTTTGGCGCGACCGATGGCGAGCTGACCATGGATG
TAACGCTGAAGGCGTATCAGATGCTGGCCCGCATGGCGTTACACCTGCACGCCATGCCTCCACATTATGACGCACTGACA
ACAGACAAAGACCGGAGGAACGAACCAGACACGGAGCTGCTGCCGGGCGCAATCCTTCGCCTGACCTGTGCGGAATGGTG
GAAACGCAAACTGTGGCTGTTACGTTGCGAGTGGCGGGAAGAACAACTCCGCGCCGCCTGTCTGGTTTCCAGAAAAACAT
CGCCCTATCTGAGCCAGGACGCGTTAAGCGAGTTTCGCGCACAGCGCGAGAAAACACGCGATTTCCTGAAAAGTTTCATG
CTGGAAAATGAAGACGGGTTCACGATTGATCTCGAGACGGTGTATTACGCGGGAGTAAGTAACCCGGTTCACCGTAAGGC
AGAAATGATGGCCACCATGAAGGGACTGGAACTTCTGGCCGAAGCCCGTGGCGACAGAGCGGTGTTTCTGACCGTCACCT
GCCCGTCAAAATACCACGCAACAACGGAGAACGGTCATCCGAACCCCAAATGGAACGGGGCCACCATGCGCGACTCCAGC
GATTACCTGGTTAACACGTTTTTTGCGGCGGTCCGCAAAAAACTGAACCGCGACGGCCTGCGCTGGTATGGCATCCGCAC
GGTGGAGCCTCACCATGACGGCACTGTGCACTGGCATATGATGGTCTTTGCACATCCGGACGAGATTGAAACCATCGTGT
CCCACGTCTGCGATATTGCCATTCAGGAGGACCGCCACGAGCTGGGCGATGACATAACTCCGCGTTTTAAGGCGGAGTAT
GTCGACGGCTCAAAAGGCACACCAACCAGCTACATCGCCACCTACATCGGAAAGAACCTGGACAGCCGCGCCGTGGATGG
CATCGACCCGAAAACGGGCAAGCCACGCGTTGACCACGAAACCGGAAAATCAATGGCCGAGAGCGTGGAGCGCGCCATCG
GCTGGGCGCGCCTTCACCGGGTCCGTCAGTTCCAGTTCTTTGGCATCCCCTCCCGTCAGGTGTGGCGTGAACTGCGCCGC
CTTGCCAGCCAGATGGCACGCAATCCGGAAGGCCCGCAACGGCTGAAAGATGATGCAATGGATGCGGTACTCGCTGCCGC
CGATGCCGGGTGTTTTGCCACCTACATTGAAAAACAGGGTGGCGTGCTTGTTCCACGCAAGGACTACCTGATTCGCACCG
CCTACGACCTCGCAGATGAGCTGAACGATTACGGCGAACAGAGCGTACAGATTTACGGGATCTGGTCACCACTCATCGGG
GAATCCTCCCGTGTGTGCACGCATCCGGATAACTGGAAATTGGTAAGACGTAAACCAGAACCAGAAGACAACGCCCACGA
AAATGGTTTTGACCTTCAGGGCGGCCCTGCCGCCCCTTGGACTCGTGGCAATAACTGTCCCCGTGTACAGGAAACAGGCA
ACAGCGGGACAGAACAGTCGGAAGAACGGCCAGCACCGTGGCCGCAGCTTCCTGACGGCGTTGATGTGGATGAATGGATG
CGCTCACTGAAACGGCACGAACGCCGGGCGCTGATGCGTTCGCTGCGTGACAAACAGGCAAAAAACAACAGTGATGAAAT
GCAGAACTGGACACAGAGCCGCAAACAGCCGCGGCCTTTGCCTGATAACCACGAGTTACTCGCTAAAGAATGGCGGGAGT
CTGCCGAATCTCTCGGCCTGCATATCGGTGAACAACAGATGCTGCACCTGTTACGGGGCGGCAGTCTGTACGTTGACGGC
AGCATCATTGCGCCGCAGGGATATGAAATTGTATGTAAACCGGATACCCGACCGGACAGCCGAATCACGCAACTCTGGCA
GCGCCTGAGTCGTAATCACAGCGTAAACAGCACGGAAATCCGCCATAACCCGGTTTCCAGCTATCTGAAACAGCTCGGGG
CATCAGACCCAGAAGCCGCCGCACGCCTGGCATCCACAATTCAGCAGGACCAGAACACCATGAAAACTCCCGTTACCGTG
CTTTCTGACATGCTGCGCGCCATCCGTGACGCAGAGCACGCACAGAGAATCAATGAAACCACTGAACGCGCACGTCACAA
GGCGGGTCTGTTGCAGGGCAAAGGCAATAGCGAGAAGAAAAAATAA

Protein sequence :

MTAEHIRDWQQPRHAVGREGTGIPAPESALSSWLDAYRAENERRKEMADAAFSATPLGNLINKSLDAQEKQDKTITLAGD
ARKQARGAVDEAMASLRLLPSYLRDPLIRHLSFLRKKQEADRRKGKKSWQAERYARGTLRKIFERLDRTDHRWLTPGYRS
LAGRERLDDLLYLPQLNKHQIQTLATMTAAMFSSTFEKLCDGFGATDGELTMDVTLKAYQMLARMALHLHAMPPHYDALT
TDKDRRNEPDTELLPGAILRLTCAEWWKRKLWLLRCEWREEQLRAACLVSRKTSPYLSQDALSEFRAQREKTRDFLKSFM
LENEDGFTIDLETVYYAGVSNPVHRKAEMMATMKGLELLAEARGDRAVFLTVTCPSKYHATTENGHPNPKWNGATMRDSS
DYLVNTFFAAVRKKLNRDGLRWYGIRTVEPHHDGTVHWHMMVFAHPDEIETIVSHVCDIAIQEDRHELGDDITPRFKAEY
VDGSKGTPTSYIATYIGKNLDSRAVDGIDPKTGKPRVDHETGKSMAESVERAIGWARLHRVRQFQFFGIPSRQVWRELRR
LASQMARNPEGPQRLKDDAMDAVLAAADAGCFATYIEKQGGVLVPRKDYLIRTAYDLADELNDYGEQSVQIYGIWSPLIG
ESSRVCTHPDNWKLVRRKPEPEDNAHENGFDLQGGPAAPWTRGNNCPRVQETGNSGTEQSEERPAPWPQLPDGVDVDEWM
RSLKRHERRALMRSLRDKQAKNNSDEMQNWTQSRKQPRPLPDNHELLAKEWRESAESLGLHIGEQQMLHLLRGGSLYVDG
SIIAPQGYEIVCKPDTRPDSRITQLWQRLSRNHSVNSTEIRHNPVSSYLKQLGASDPEAAARLASTIQQDQNTMKTPVTV
LSDMLRAIRDAEHAQRINETTERARHKAGLLQGKGNSEKKK

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
STY4635	NP_458715.1	conserved hypothetical protein	Not tested	SPI-7	Protein	3e-134	42
t4328	NP_807922.1	hypothetical protein	Not tested	SPI-7	Protein	2e-134	42