Gene Information

Name : y2188 (y2188)
Accession : NP_669498.1
Strain : Yersinia pestis KIM
Genome accession: NC_004088
Putative virulence/resistance : Unknown
Product : phage tail protein
Function : -
COG functional category : S : Function unknown
COG ID : COG4733
EC number : -
Position : 2419491 - 2422694 bp
Length : 3204 bp
Strand : -
Note : residues 5 to 1043 of 1067 are 58.69 pct identical to residues 6 to 1044 of 1061 from GenPept : >gb|AAC19057.1| (AF064539) gp21 [Bacteriophage N15]

DNA sequence :
ATGGCACGTAAACCAATTAAAGGCCGCAAAGGTGGGGGCAGCAATGCCACAACGCCAGTTGAGTCACCGGACAGTATTCA
ATCGACGGCAAGAGCTAAAATACTCATTGCTTTGGGTGAGGGGGAGTTCGCCGGAGGTTTGGATGGAACCAATATCTATC
TGGACGGCACACCTATAAAGAACTCTGACGGTACTAGTAATTTCACTGGGGTTACTTGGGAGTATCGTCCCGGCACGCAG
GCTCAGGACTACATTCAAGGAATGCCAAATGTCGAGAATGAGATAACGGTTAACACAGAGCTTAAATCAGATACGCCATG
GGTGCGCTCCATCACAAATACCCAACTCTCGGCTACACGTGTTCGTCTTGGATGGCCCTCATTACAGCGTCAGGCGGACA
ATGGTGATGTTGGCGGTTATCGCATTGAGTACGCCGTCGATGTGGCAACGGATGGTGGCGCATATCAAACACTGCTTGAT
ACAGCCATTGATGGGAAAACAACAACTTTATATGAACGCTCGCACAGAATAAACCTACCCAAGGCCACAGCTGGTTGGCA
GGTTCGTACAAGGCGAAAAACAGCCAATGCCAACTCTGGCCGCATTGCCGACAAGATGAATGTCGAAGCTATTTCTGAAG
TCATCGATGCCAAGTTACGTTACCCAAATACCGCGCTTCTCTATATAGAATTCGACGCAACTCAATTTCAGAATATCCCT
ATTATCTCATGTGAGCCTAAAGGCCGGATTATCCGCGTACCTACTACATATGATCCAGTAACGCGTACCTACTCTGGTGT
GTGGGATGGTTCATTTAAATGGGCTCATACCAACAACCCAGCCTGGGTATTCTACAACATTGTATTAGCAGATCGCTTTG
GCCTTGGTCATCGGATTGAGGTCAGCCAGGTAGATAAGTGGGAGCTGTACCGAATTGGTCAATACTGCGATCAGCTTATT
CCTGATGGTCGGGGCGGTAGTGGTACTGAGCCTCGTTTTACCTGCGATGTGTATATTCAGTCTCAGGCCGAGGCATTTAC
TGTATTGCGTGATTTGGCCGCCATTTTTCGGGGCATGACCTATTGGGGAAATAATCAGCTTTGCACCCTGGCAGATATGC
CACGAGATGTGGACTATATATTTACCCGTGCCAGTGTGATTGACGGACGATTCACTTACGGTGGTGGTTCCGAGAAAAAG
CGCTATACAACCGCAATGGTGAGCTGGAGTGACCCCGCAAATAACTGTCAGGATGCAATCGAGGCAGTGTCAGATAACGA
CTTGGTTCGTCGCTACGGTGTCAATCAGCTTGATATGACGGCTATCGGCTGTATCCGGCAAACTGAGGCGAATAGGCGTG
GACGTTGGGCGCTACTGACAAACAGTAAAGACCGGACTGTTAATTTTAATGTAGGGTTAGACGGGGCCATTCCGTTGCCC
GGTCATATCATTGGTGTTGCGGATGATATGCTCTCTGGTCGGAAGATGGGCGGTCGCATTAGCTCAGTATCGGGCCGGAA
TATCACTCTTGACCGTGTTGCTGATGTGAAAGCAGGTGACCGGCTACTTGTTAACTTACCAAACGGTGTAGCTCAGGGCA
GAACGGTGCAAGTGGTCAACGGGAAAGTAATCACTGTCACAACGGCTTACAGTGAAGTGCCAGCAGCGGAAAGCGGTTGG
TCTGTTGATGCGGATGATTTAGCTATCCAGCAATATCGGGTTACTGGTATTTCTGACAATGACGACAATACATACAGTAT
CTCATCTGTTCAGCATGATCCGGACAAATATGAGCGAATTGATACGGGCGCTCGGATTGATGAAAGACCCATCAGCGTAA
TCCCGCCCGGCGTCCAGCCACCTCCGACAAATGTTGTTATTGATAGCTTCTCAGCACTTTCACAAGGGCTCGCAATAACC
ACCCTACGTGTTACGTGGGAACCAGCAGCCAGCGCGATAGCATACGAGGCTGAATGGCGACGTGATAACGGAAACTGGAT
ATCAGCACCGCGCACATCTGCTCAGGGATTTCAGGTTGAAGGTATTTATGCTGGACAATATCAGGCTCGCGTTCGTGCTA
TTAACCCCTCAGAAATATCCAGTATTTGGGCTAATGCTCAGGAAACCACATTAAACGGTAAAGAGGGAAATCCTCCAATG
CCAGTTGGATTTACAGCTACAGGCATTCTCTTTGGCATCACTCTCAATTGGGGATACCCTGAAGGAGCCGAAGATGCGTT
AAAAACAGAGATTGAATATAGCCTGTCTGCTGACGGCACCGATGCCATGCTGTTGAGTGATGTGCCGCATCCGCAACGGA
ACTACACTATGCAGGGGTTGAGAGCAGGGCAGGTGTTCTGGTTCCGTGCTCGGATAGTTGATAAATCCGGTAATCAGTCG
CCATGGATTGATTGGGTTCGTGGCATGTCCAGCACAGACACAAGCGCTATTCTCGAAGCGATTGGCGACGACTTTATCAA
TAACACAGTTGCGGGTCAGCAACTGATTAATGATGACTTCATGAATGCAGAGGGCATTCTCGAAACAGCGAAGGCCAATA
ACGCCAGCATCTGGCAGCAATGGGCTCAACACGGAGAGAATAAAGCCGGTGTTATCCACTTAACGACCACTGTTGCCGAT
GCTGAAAGAGCATTTGCTGAGTTTGAAACCCTTGTTACAGCAACATTTGAAGACCAGACAGCAGCGATAGACCAAAAAAT
GACAGCAGTTGTTGATGCCAACGGGGCTAGTGCTACTTATAGTTTAAGGGCCGGACTGAATTATAACGGCCAGTTTGTCA
GCGCAGGCATGGTAATTGGTGCAGAGTTTATTAATGGTGTAGCTAAATCCTCAATTGGTTTTACTGCCGATCAATTTATA
TTGCTCTCCGGTCCAACTGGTAATTTATTTTCGCCTTTTGCAGTGGTAAATGGTCAAGTGTTTATGAATGATGCATTTAT
TGCAAAGGCATCAATTGGGCGAGGAAAAATAACAGATACCCTTGACTCAGATAATTACGTGCAAGGAATATCCGGTCTAA
AACTGGATTTTAAAAATGGTAATGCTGAATTTAACAATGTAAATCTCAGGGGGAATATAACTATGGATAACACGATTAAT
GGTATTCGCACCATAGTAGATTATCGTGGGCAGAGGACATATCACGCAAATGGTCAGCCAGCGATAATATGCGGGTACTT
CTAA

Protein sequence :
MARKPIKGRKGGGSNATTPVESPDSIQSTARAKILIALGEGEFAGGLDGTNIYLDGTPIKNSDGTSNFTGVTWEYRPGTQ
AQDYIQGMPNVENEITVNTELKSDTPWVRSITNTQLSATRVRLGWPSLQRQADNGDVGGYRIEYAVDVATDGGAYQTLLD
TAIDGKTTTLYERSHRINLPKATAGWQVRTRRKTANANSGRIADKMNVEAISEVIDAKLRYPNTALLYIEFDATQFQNIP
IISCEPKGRIIRVPTTYDPVTRTYSGVWDGSFKWAHTNNPAWVFYNIVLADRFGLGHRIEVSQVDKWELYRIGQYCDQLI
PDGRGGSGTEPRFTCDVYIQSQAEAFTVLRDLAAIFRGMTYWGNNQLCTLADMPRDVDYIFTRASVIDGRFTYGGGSEKK
RYTTAMVSWSDPANNCQDAIEAVSDNDLVRRYGVNQLDMTAIGCIRQTEANRRGRWALLTNSKDRTVNFNVGLDGAIPLP
GHIIGVADDMLSGRKMGGRISSVSGRNITLDRVADVKAGDRLLVNLPNGVAQGRTVQVVNGKVITVTTAYSEVPAAESGW
SVDADDLAIQQYRVTGISDNDDNTYSISSVQHDPDKYERIDTGARIDERPISVIPPGVQPPPTNVVIDSFSALSQGLAIT
TLRVTWEPAASAIAYEAEWRRDNGNWISAPRTSAQGFQVEGIYAGQYQARVRAINPSEISSIWANAQETTLNGKEGNPPM
PVGFTATGILFGITLNWGYPEGAEDALKTEIEYSLSADGTDAMLLSDVPHPQRNYTMQGLRAGQVFWFRARIVDKSGNQS
PWIDWVRGMSSTDTSAILEAIGDDFINNTVAGQQLINDDFMNAEGILETAKANNASIWQQWAQHGENKAGVIHLTTTVAD
AERAFAEFETLVTATFEDQTAAIDQKMTAVVDANGASATYSLRAGLNYNGQFVSAGMVIGAEFINGVAKSSIGFTADQFI
LLSGPTGNLFSPFAVVNGQVFMNDAFIAKASIGRGKITDTLDSDNYVQGISGLKLDFKNGNAEFNNVNLRGNITMDNTIN
GIRTIVDYRGQRTYHANGQPAIICGYF

• Homologs from PAI DB

GeneGenBank Accn Product Virulance or Resistance PAI or REI Alignment Type E-val Identity
ESA_01044 YP_001437149.1 hypothetical protein Not tested Not named Protein 0.0 61