Gene Information

Name : HPSH112_06985 (HPSH112_06985)
Accession : YP_006228075.1
Strain : Helicobacter pylori Shi112
Genome accession: NC_017741
Putative virulence/resistance : Unknown
Product : hypothetical protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 1421545 - 1429404 bp
Length : 7860 bp
Strand : +
Note : COG0827 Adenine-specific DNA methylase

DNA sequence :

ATGCAAAAAAAGAAAGCTAAAAACCCACAACCGAATTTATTTAGCATCTTAGATAATGGCGATATTGCAACAAACAATCT
TGCTGAAGAATCAGACAAGGTCAATGAAACACAAGAGCCACTCCCTTATGTCGTAAAAACTCAAATCAATACAGCAAGAA
TGATTTCTAGAAATCCTATTGAATGGGCAAGGTATTTAAGCTTTGAAAGACGAGTGCATAAGGATAATAGTAGAGAAGAT
GTCAATTTCTTTGCTAATGGTGAGATAAAAGAAAGTTCTCGTGTTTATGAAGCGAATGAGAAAGGGTTTGAAAGGCGTAT
AACTAAAAAATACGATCTGATTGATAGAAATAAAGAATTTTTTTCAAAAGAAATTGACATTTTAACCTACAAAAACAGCT
TAGAAGAATTGAAAGAGCAAGGTTTAGAAATCCAATTGACCCACCACCATGAAACGCATAAGAAAACCTTAGAAAATGGC
AATGAAATCGCTAAAGAATACGACTATCTTAAAGATATTTATCACGAAGTAGAAAGAACAAAAACTGGTGAATTGGTAAG
AGGAATAATCCCTAGTATTTCTAGCGCTGAGTATTTTAAGCTCTATAACAAACTGCCTTTTGAATCCATAAACAATGAAA
ATACCAAACTGAATACTAATAACACTATTAAAAATACAATAGAGACTAATGCTTCTAACAATATTATTCAAAATAATGAT
AATAATAATCCAAATTTAAGCATTGCTGATTTAGAATTAGAGCAACAGAATTTAGGAGAACAAAATGGAAAAGAAAGAAC
AAATCGCGCAGATGAGCCGAATAGAACTAGAGCAGGAATTCCGCAAGAAATTCACCGCAGAAGCGAACATGGAGGACAGC
AAGAGGGAGTGGAGCGATCGAGTGATGAAGAACTTTTACACCAAGACTCTAGTTTATTTATTGAGCCTAGAGAGCAGGGA
GGAACAAGAGGAGTTTATAGATCTAGCGACCAACAGGCAGTTTCAGAAAAATCCCATAGAGAGAGAGATAAACTACATGA
ACATGTATCTAGAGGAGATGGAGTATCAGCAAGAGCAGATACAAGAGCAGATAGCAATGGAGCATCAAGTCAAGCAAGCC
GAATGGAAAATGGAGCAAGAAGCGAAGAAAAGGGGGATAATCCCAGCGATGAGAGAGGAGTATCACCCACACCGCAATCC
CCATCTCATCAACAAAATAGCTCCAGAGATTTGGGGCTTTCTCTCTCTAGAGAACAGCCAGGACAGACTGGACGCTTACG
CCTTTTTGATCATGGACAGATGGGCTCATTATTTCCCACAGACCATGAAAACCAAAGATCAAAGAACGATAATGAGCTTG
ATAGAAGCAGTAATAGAACAAACGAAAATGGAGACAAAAGCCCTAGACAGAATGGAAGCGCAAATCAAGAGAGCGCAAGG
AGTGAGCGATATGGAATTGCTCAAGGAAGCTCAAGTCAATCAGTATTACCACTTGCTCAAAGCCGATTACATCATGCAGG
ACTCAGCACACCAAATGGACTTGGAAACCTTGAAGAAGACAGGGATCAAGAGAGAGGACTTTTATCAAATTTAGACCATT
TAGAAAGCCTGCTTAACGCTATTAGAAACAACACCATAGCGAGTGAGCCTGACTTTAGAACTAGGCTCTTAGAAGCCATT
CAAAACAACGAGCCTTTAAAAGATAGCATTGTAGGGATGCAGCTCCTTAAAGACCCTACGACTAAAATCTTTTATGACAA
ATTCCAATTAAAAATCAGCCCTAAAAAAGTATTAGAGATTTTAGAAAATCGCATTAAAAAATCCATTGAAACAGCGAATG
AAACGCTAAACGCATTCAACGCGCTGGATAGTCAAGCCATTGATGGAAACGCTATTTCTAATAGTGTAGGATTAAATCCC
ACACAAGAGAGTGGGATAACAGACAATAGCGTAGAGTTAAATAACGCTCAAGAACAAACCGCGCAAGAGCAAGACACGCA
AGAAAACGCGCAAACCACGATAAAACAAGAAACACCAACCGCACCAGCCATCCCCCTTAATCCTAAAATAGATTTTAAAC
CGAGCGAAGAAGTTTTAATTAAGGGAGCTAAAACTCGCTACAAGGCTAACATAAAAGCCATTGAGCTTTTAAAAGAATTG
CAAGCCAAACAAGAGATCTTAAAAGGCGATTATTACGCCACTCAAGAAGAGCAAAAAATCCTAGCGCAATTTAGCGGATG
GGGTGGGTTAGAAAGCTACTTTAAAAAGGATCAACGCCCTGAAGAATTTAAGGAATTAAACGCCTTACTCACTAAAGATG
AATTCAGAAGAGCTTATTCAAGCACAAGAGACGCTTACTACACCCCTAAATTAGTTATTGATAGCATTTATCAGGGATTA
GATCAATTAGGGTTTAATAACGACAACCATCAAAAAGAAATCTTTGAACCCAGTTTAGGCACAGGCAAATTCATCGCTCA
TGCGCCAAGCGATAAGAATTACCGCTTTATGGGAACAGAATTAGATCCTATTAGCGCTAATATTTCTAAATTCCTTTACC
CTAATCAAGTCATCAACAACACCGCTTTAGAAAACCACCAATTCTATCAAGAATACGATGCGTTTGTGGGCAATCCTCCT
TATGGCAGTCATAAAATCTATAGCTCCAATGACAAAGAATTGAGTAACGAGAGCGTTCATAATTACTTTTTAGGGAAAGC
TATCAAAGAATTGAAAGATGATGGCATAGGAGCGTTTGTGGTGAGTTCTTGGTTTATGGATGGTAAAAACCCTAAAATGA
GAGAACACATCGCGCAAAACACCACTTTTTTAGGAGCGATAAGATTGCCTAATAGCGTGTTTAAAGCAACAGGCGCTGAA
GTGAGTAGCGACATTGTGTTTTTTAAAAAAGGCGTTGATGGAGCAACCAATCAAAGCTTCACTAAAGCTATGCCTTATTA
TGACAAGATCATTGATAGCTTGGATAATGACACCCTTTTTGCCTTGCAAAACAACCGCTTTGATAGTTTTACTCCTAGCG
ATCAACTTAAGATTGTCAATGCGATTGCAAGCCATTTTGGTTTCAAACAAGAAAAATTGCAACGCTGGTATGAAAAAATA
GACACCGCTAACTTTGGCTACAGAGAACAAGACTATAAGATCATCAAAGGCTTCATTGATAAAGTTGGCGAGAATAATAT
CAATCTCAACGAACAAACCTTAAATGAATACTTTATCCACCACCCTGAAAACATTCTAGGGCATTTGAGTTTGGAAAAAA
CCCGCTATAGCTTTGAAATAAATGGCGAACAAATTTACAAATACGAGTTGCAAGCTTTAGAGGATAAAAGCTTAGACTTA
TCCCAAGCTCTTCATCAAGCGATAGAAAAATTGCCTAAAGATGTCTATCAATACCATAAGACTACCTTTAAAACAGACGC
TCTCATTATTGATGCAAATAACGAACGCTATCAAGAAGTTCAAAAGCTTATCAAAAATTTAGAAAGGGGGGAATTAGTCA
AGTGGGATAATCTTTATTTCCAACTAGAACAAAATAATGAAAGGGGCATTTTTTTAAAACCCACTAAAATCAACTCTAAA
GTCCAAGATTCACGACTAAAAGCCTATTTTAAAATTAAAGACGCTTTGAATGATTTAACGAGTGCAGAATTAAGCCCCTT
AAGCTCTGATTTGGAGCTAGAAAGTAAAAGAGTTAGGCTCAATCTTGTTTATGATGAATTTGTCAAGAAATTTGGCTATC
TCAATGAGAATAAAAATCGTAAGGATATCAAACAAGATTTGTATGGCGCTAAAGTCTTAGGATTAGAAAAAGACTTTGAA
AAAGAAATCACCCCTAGAAGCGCCAAAATGCAAAACATAGAGCCAAGGCAAGCTCAAGCTAAAAAAGCTCAAATCTTTTT
TGAAAGGACTTTAAACCCTAAAAAAGAACTTATTATCACTAACGCCAAAGAGGCATTAATTGCAAGCATCAATCAAAAAG
GGGGTTTAAATTTGCATTTCATTAGAGATCATTTCGCAACCCAAAGCTTAGAAACCACGATTAAAGAACTTTTAGAGCAA
AAACTTATTTATAAAGACCACAAGGATAATGGCGACTATGTTTTAGCGAACGATTATTTGAGCGGCAATGTGAAAAGAAA
ACTCAAAGAAGTTAAAGAAGCCATCAATCAAGGCGTGGAGGGATTAGAGGCTAATGTGAAAGATCTAGAGCTGATTATCC
CTAAAGATTTGAAAGCCACTGAAATCATGGCTAATATCAACAGCCCTTGGATACCCACTCAGTATTTAGAAGAGTTTTTA
ATAGAATTAGCCGCTAACCATTATGAAAAGCAATACGGCGATAAAATGACAGATTACCAACTAGGCAATCTCAAAGAAGG
CATCAAAGTAGAACACCTAAGCGGTGCTTATGAAGTTTTGGTTAGAAACAATGAATTAAACGAGCTTTATGGTATTAGGC
ATAAAGACAAACCGCATTCTTATAAAGCGCCTTTTGAAAGCCTTTTAATAAAAGTCTTAAACAACAAGGATTTGAGCGTT
AAATACGCCCAAGTTGATCCTAATGACCCTAAAAAAGAAATCTTTATCACTGATGAAGAGCAAAGCAATCTCGCTAGACA
AAAAGCAGAAGAATTGAAAGAAGCTTTTAAAGACTGGATTTATAAGGATTATACAAGAAGAACCCATTTAGAGCAAATCT
ATAATGACACTTTCAACAATTCTGTTTTAAAAACCTATGATGGCTCGCAATTAGAACTAGAGGGCTTTAACCACCATATC
AGCTTGCGCCCCCACCAAAAGAACGCTATTTTTAGAACCATCCAAGACAGGGCGGTGTGTTTAGACCATCAGGTTGGAGC
AGGCAAGACTTTGTGCGCTATAGCCAGTTGCATGGAACAAAAACGCATGGGGTTAGTGAATAAAACGCTCATTGCCGTGC
CTAACCATTTAACCAAGCAATGGGGCGATGAATTTTATAAGGCTTACCCTAACGCTAATGTGTTAGTTGTTGATAGCAAG
GACATCACTGAAAAAGAAAGAGAGCTTTTATTCAATCAAATCGCTAACAACAATTATGACGCTGTGATTATCGCGCACAC
CCATTTGGAATTATTGTCTAACCCTAGAGGAATCATAGAAGAATTGAAAGAAGAAGAACTAGTGAATGCCGAAAAAAACT
TTGAAAGGCAAGAACTGGCTTATAAAAATAACCCTAGAGAAACTAAAAAACCCAATGAAAGAGCCTTTAAAAGCAAGCTG
GATAAAATCCGTGCTAAATACGATGCGATTTTAGAAAAACAAGGCTCTCATATTGATATTAGTCAAATGGGGATTGACAA
TTTGATTGTGGATGAAGCCCACTTATTCAAAAATCTAGCCTTTGAAACTTCTATGGAAAAAATTGCAGGGCTTGGTAACC
AACAAGGCTCTAATCGCGCCAGAGATTTGTTGATTAAAACGCGCTACTTGCATCAAAACAATAAGAAAATCATGTTTTTA
ACCGGCACGCCTATAGCTAATTCCTTGAGTGAAATGTATCACTTGCAACGCTACCTGACCCCTGATGTGTTGGAAGAAAG
AGGGTTAGAATTCTTTGATGATTGGGCTAAGACTTATGGGGAAGTGGTGAATGATTTTGAATTAGACACTTCCGCTCAAA
GTTATAAAATGGTTAATCGCTTTTCTAAATTTAGCGATGTGCAAGGCTTAAGCACCATGTATAGAGCTTTTGCGGATATT
GTCTCCAATGATGATATTTTAAAGCATAACCCCCACTTTGTGCCTAAAGTGTATGGGGATAAACCTATCAATGTGGTGGT
GAAAAGAAGCCAAGAAGTGGCTCAATTTATTGGCGTGGCTGATGAAAATGGCAAATATAATGAAGGCTCTATCATTGATA
GGATGCAAAAATGCGAGGGCAAGAAAAGCAAAAAAGGGCAAGACAATATCCTTTCTTGCACCACAGACGCTAGAAAAGTG
GCTCTGGATTACCGCTTGATTGACCCTAACGCTAAAGTAGAAAAAGAATTTTCTAAAAGCTATGCTATGGCAAAAAATAT
CTATGAGAATTATTTAGAAACTAATGCCACTAAAGGCACACAACTTGGTTTCATAGGTCTATCCACACCCAAAACCCATA
GCCAAAAAGTGAGTTTAGAAGCGCTAGATAACGCTCATGAGATAGAAAATAAAAATCCCCTAGATGAAGCTCAAGAACTT
TTAGAGAGCTTGTCTAGTTATGATGAAAATGGCAATCTTATCGCTCCTAGCAAGAAAGAATTAGAGAACGAGCTCAAAGA
GAAAGAGGCTAAAAGCGTCAATTTAGATGAAGAGCTAGCTAAAGGCTGTAAGTTTGATGTTTATAGCGATGTTTTAAGGC
ATTTAGTCCAAATGGGTATCCCACAAAATGAAATCGCTTTCATCCATGACGCTAAAACCGAAGAGCAAAAACAGGATTTG
TTTAAAAAGATTAATCGTGGCGGAGTCAGGGTATTATTGGGCAGTCCCGCTAAAATGGGCGTAGGCACTAATGTGCAAGA
AAGATTAGTCGCTATGCATGAATTAGATTGCCCATGGAGACCTGATGAATTGTTGCAAATGGAAGGGCGTGGGATAAGAC
AAGGCAATATTTTGCACCAAAACGATCCTGAAAATTTTAGAATGAAAATCTATCGCTACGCCACTGAAAAAACTTATGAT
AGCCGTATGTGGCAAATCATAGAGACTAAATCTAAAGGCATAGAGCAATTTAGAAACGCGCACAAATTAGGCTTGAATGA
ATTAGAAGACTTTAACATGGGGAGTTCTAATGCGAGTGAGATGAAAGCAGAAGCAACAGGTAATCCCTTAATTATTGAAG
AAGTCAAATTGAGAGCTGAAATCAAAAACGAAGAAGCAAAATACAAAGCTTTCAATAAAGAAAATTACTTCAATGAAGAG
AATTTGAAAAACAACTCCTCTAAATTGGATTATCTTAAACAGGAATTGAAAGATTTAGAAACGCTTCAAAGCTCTGTAAT
GATCCCCACTCATACAGAGATCAAGCTCTATGATTTGAAAAATGAAGAGAGTAAGGATTATGAGCTTATCAAAGTTAAAG
AAGTAGAGCCTTTAAAAGAAAACGCCTCTATGAGTGAAGAATTAACGCACAAAAAACTCAAAGAACAAAACAAGCAAATA
GCCGAACAAAATAAAGAAAAGCTAGATGCTATTAAAAAGCAATTTGCAAGCAATTTGAACGACTTGTTTTTCAATGAGGA
AAGAGATTGTAAGCTTTTAGAATACAAGGGCTTTGTGGTGAATGCTTATAAAACTAAGTATCAAGTGGAGTTTAGTTTAA
ACCCTAAAGACAATCCAAATATTGCCTATAGCCCTAGCAATATGGTTTATAAAAACGATACTGCCAACATGTTTAGCTCT
TATAATTTCTGCGGCGAGATTAAATTTGATGGGTTTTTAAAAAGATTGGATAACGCTATCACTAAACTCCCTGAAAAAAT
CAAGGAATTAGAAAACTCCATTAAAATCACTCAAGAAAATATCGCTAAATACACAAGATTAGTGGAACAAAAACCTCCTT
ACCCACGACTAGAATACTTGCAAGCTTTAAAATGGGATCATAAAACTCTAATAGATGATTTAGCTAAAATGAGCAAAGAC
AGAGATTATAAGCCTGTGTTCAACCCTAAATCTCAAGAAGTCTTAGAGAAAATGAACGCTGAAAAAAGAGCGAGTTTAGA
GAATGAGGGTGTAACAGAAGAGATAAAAGAACAAGCCAAAGAAGAAGTGCATAGACCAATGAAAAAAGCATCTAGTGGTG
ATTACGACATGGGGATGTGA

Protein sequence :

MQKKKAKNPQPNLFSILDNGDIATNNLAEESDKVNETQEPLPYVVKTQINTARMISRNPIEWARYLSFERRVHKDNSRED
VNFFANGEIKESSRVYEANEKGFERRITKKYDLIDRNKEFFSKEIDILTYKNSLEELKEQGLEIQLTHHHETHKKTLENG
NEIAKEYDYLKDIYHEVERTKTGELVRGIIPSISSAEYFKLYNKLPFESINNENTKLNTNNTIKNTIETNASNNIIQNND
NNNPNLSIADLELEQQNLGEQNGKERTNRADEPNRTRAGIPQEIHRRSEHGGQQEGVERSSDEELLHQDSSLFIEPREQG
GTRGVYRSSDQQAVSEKSHRERDKLHEHVSRGDGVSARADTRADSNGASSQASRMENGARSEEKGDNPSDERGVSPTPQS
PSHQQNSSRDLGLSLSREQPGQTGRLRLFDHGQMGSLFPTDHENQRSKNDNELDRSSNRTNENGDKSPRQNGSANQESAR
SERYGIAQGSSSQSVLPLAQSRLHHAGLSTPNGLGNLEEDRDQERGLLSNLDHLESLLNAIRNNTIASEPDFRTRLLEAI
QNNEPLKDSIVGMQLLKDPTTKIFYDKFQLKISPKKVLEILENRIKKSIETANETLNAFNALDSQAIDGNAISNSVGLNP
TQESGITDNSVELNNAQEQTAQEQDTQENAQTTIKQETPTAPAIPLNPKIDFKPSEEVLIKGAKTRYKANIKAIELLKEL
QAKQEILKGDYYATQEEQKILAQFSGWGGLESYFKKDQRPEEFKELNALLTKDEFRRAYSSTRDAYYTPKLVIDSIYQGL
DQLGFNNDNHQKEIFEPSLGTGKFIAHAPSDKNYRFMGTELDPISANISKFLYPNQVINNTALENHQFYQEYDAFVGNPP
YGSHKIYSSNDKELSNESVHNYFLGKAIKELKDDGIGAFVVSSWFMDGKNPKMREHIAQNTTFLGAIRLPNSVFKATGAE
VSSDIVFFKKGVDGATNQSFTKAMPYYDKIIDSLDNDTLFALQNNRFDSFTPSDQLKIVNAIASHFGFKQEKLQRWYEKI
DTANFGYREQDYKIIKGFIDKVGENNINLNEQTLNEYFIHHPENILGHLSLEKTRYSFEINGEQIYKYELQALEDKSLDL
SQALHQAIEKLPKDVYQYHKTTFKTDALIIDANNERYQEVQKLIKNLERGELVKWDNLYFQLEQNNERGIFLKPTKINSK
VQDSRLKAYFKIKDALNDLTSAELSPLSSDLELESKRVRLNLVYDEFVKKFGYLNENKNRKDIKQDLYGAKVLGLEKDFE
KEITPRSAKMQNIEPRQAQAKKAQIFFERTLNPKKELIITNAKEALIASINQKGGLNLHFIRDHFATQSLETTIKELLEQ
KLIYKDHKDNGDYVLANDYLSGNVKRKLKEVKEAINQGVEGLEANVKDLELIIPKDLKATEIMANINSPWIPTQYLEEFL
IELAANHYEKQYGDKMTDYQLGNLKEGIKVEHLSGAYEVLVRNNELNELYGIRHKDKPHSYKAPFESLLIKVLNNKDLSV
KYAQVDPNDPKKEIFITDEEQSNLARQKAEELKEAFKDWIYKDYTRRTHLEQIYNDTFNNSVLKTYDGSQLELEGFNHHI
SLRPHQKNAIFRTIQDRAVCLDHQVGAGKTLCAIASCMEQKRMGLVNKTLIAVPNHLTKQWGDEFYKAYPNANVLVVDSK
DITEKERELLFNQIANNNYDAVIIAHTHLELLSNPRGIIEELKEEELVNAEKNFERQELAYKNNPRETKKPNERAFKSKL
DKIRAKYDAILEKQGSHIDISQMGIDNLIVDEAHLFKNLAFETSMEKIAGLGNQQGSNRARDLLIKTRYLHQNNKKIMFL
TGTPIANSLSEMYHLQRYLTPDVLEERGLEFFDDWAKTYGEVVNDFELDTSAQSYKMVNRFSKFSDVQGLSTMYRAFADI
VSNDDILKHNPHFVPKVYGDKPINVVVKRSQEVAQFIGVADENGKYNEGSIIDRMQKCEGKKSKKGQDNILSCTTDARKV
ALDYRLIDPNAKVEKEFSKSYAMAKNIYENYLETNATKGTQLGFIGLSTPKTHSQKVSLEALDNAHEIENKNPLDEAQEL
LESLSSYDENGNLIAPSKKELENELKEKEAKSVNLDEELAKGCKFDVYSDVLRHLVQMGIPQNEIAFIHDAKTEEQKQDL
FKKINRGGVRVLLGSPAKMGVGTNVQERLVAMHELDCPWRPDELLQMEGRGIRQGNILHQNDPENFRMKIYRYATEKTYD
SRMWQIIETKSKGIEQFRNAHKLGLNELEDFNMGSSNASEMKAEATGNPLIIEEVKLRAEIKNEEAKYKAFNKENYFNEE
NLKNNSSKLDYLKQELKDLETLQSSVMIPTHTEIKLYDLKNEESKDYELIKVKEVEPLKENASMSEELTHKKLKEQNKQI
AEQNKEKLDAIKKQFASNLNDLFFNEERDCKLLEYKGFVVNAYKTKYQVEFSLNPKDNPNIAYSPSNMVYKNDTANMFSS
YNFCGEIKFDGFLKRLDNAITKLPEKIKELENSIKITQENIAKYTRLVEQKPPYPRLEYLQALKWDHKTLIDDLAKMSKD
RDYKPVFNPKSQEVLEKMNAEKRASLENEGVTEEIKEQAKEEVHRPMKKASSGDYDMGM

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
HPP12_0447	YP_002301083.1	DNA methylase	Not tested	cag PAI	Protein	0.0	93