Gene Information

Name : HPSH112_01305 (HPSH112_01305)
Accession : YP_006226981.1
Strain : Helicobacter pylori Shi112
Genome accession: NC_017741
Putative virulence/resistance : Unknown
Product : hypothetical protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 252981 - 260810 bp
Length : 7830 bp
Strand : +
Note : COG0827 Adenine-specific DNA methylase

DNA sequence :

ATGATTTCTAGAAATCCTATTGAATGGGCAAGGTATTTAAGCTTTGAAAGACGAGTGCATAAGGATAATAGTAGAGAAGA
TGTCAATTTCTTTGCTAATGGTGAGATAAAAGAAAGTTCTCGTGTTTATGAAGCGAATGAGAAAGGGTTTGAAAGGCGTA
TAACTAAAAAATACGATCTGATTGATAGAAATAAAGAATTTTTTTCAAAAGAAATTGACATTTTAACCTACAAAAACAGC
TTAGAAGAATTGAAAGAGCAAGGTTTAGAAATCCAATTGACCCACCACCATGAAACGCATAAGAAAACCTTAGAAAATGG
CAATGAAATCGCTAAAGAATACGACTATCTTAAAGATATTTATCACGAAGTAGAAAGAACAAAAACTGGTGAATTGGTAA
GAGGAATAATCCCTAGTATTTCTAGCGCTGAGTATTTTAAGCTCTATAACAAACTGCCTTTTGAATCCATAAACAATGAA
AATACCAAACTGAATACTAATAACACTATTAAAAATACAATAGAGACTAATGCTTCTAACAATATTATTCAAAATAATGA
TAATAATAATCCAAATTTAAGCATTGCTGATTTAGAATTAGAGCAACAGAATTTAGGAGAACAAAATGGAAAAGAAAGAA
CAAATCGCGCAGATGAGCCGAATAGAACTAGAGCAGGAATTCCGCAAGAAATTCACCGCAGAAGCGAACATGGAGGACAG
CAAGAGGGAGTGGAGCGATCGAGTGATGAAGAACTTTTACACCAAGACTCTAGTTTATTTATTGAGCCTAGAGAGCAGGG
AGGAACAAGAGGAGTTTATAGATCTAGCGACCAACAGGCAGTTTCAGAAAAATCCCATAGAGAGAGAGATAAACTACATG
AACATGTATCTAGAGGAGATGGAGTATCAGCAAGAGCAGATACAAGAGCAGATAGCAATGGAGCATCAAGTCAAGCAAGC
CGAATGGAAAATGGAGCAAGAAGCGAAGAAAAGGGGGATAATCCCAGCGATGAGAGAGGAGTATCACCCACACCGCAATC
CCCATCTCATCAACAAAATAGCTCCAGAGATTTGGGGCTTTCTCTCTCTAGAGAACAGCCAGGACAGACTGGACGCTTAC
GCCTTTTTGATCATGGACAGATGGGCTCATTATTTCCCACAGACCATGAAAACCAAAGATCAAAGAACGATAATGAGCTT
GATAGAAGCAGTAATAGAACAAACGAAAATGGAGACAAAAGCCCTAGACAGAATGGAAGCGCAAATCAAGAGAGCGCAAG
GAGTGAGCGATATGGAATTGCTCAAGGAAGCTCAAGTCAATCAGTATTACCACTTGCTCAAAGCCGATTACATCATGCAG
GACTCAGCACACCAAATGGACTTGGAAACCTTGAAGAAGACAGGGATCAAGAGAGAGGACTTTTATCAAATTTAGACCAT
TTAGAAAGCCTGCTTAACGCTATTAGAAACAACACCATAGCGAGTGAGCCTGACTTTAGAACTAGGCTCTTAGAAGCCAT
TCAAAACAACGAGCCTTTAAAAGATAGCATTGTAGGGATGCAGCTCCTTAAAGACCCTACGACTAAAATCTTTTATGACA
AATTCCAATTAAAAATCAGCCCTAAAAAAGTATTAGAGATTTTAGAAAATCGCATTAAAAAATCCATTGAAACAGCGAAT
GAAACGCTAAACGCATTCAACGCGCTGGATAGTCAAGCCATTGATGGAAACGCTATTTCTAATAGTGTAGGATTAAATCC
CACACAAGAGAGTGGGATAACAGACAATAGCGTAGAGTTAAATAACGCTCAAGAACAAACCGCGCAAGAGCAAGACACGC
AAGAAAACGCGCAAACCACGATAAAACAAGAAACACCAACCGCACCAGCCATCCCCCTTAATCCTAAAATAGATTTTAAA
CCGAGCGAAGAAGTTTTAATTAAGGGAGCTAAAACTCGCTACAAGGCTAACATAAAAGCCATTGAGCTTTTAAAAGAATT
GCAAGCCAAACAAGAGATCTTAAAAGGCGATTATTACGCCACTCAAGAAGAGCAAAAAATCCTAGCGCAATTTAGCGGAT
GGGGTGGGTTAGAAAGCTACTTTAAAAAGGATCAACGCCCTGAAGAATTTAAGGAATTAAACGCCTTACTCACTAAAGAT
GAATTCAGAAGAGCTTATTCAAGCACAAGAGACGCTTACTACACCCCTAAATTAGTTATTGATAGCATTTATCAGGGATT
AGATCAATTAGGGTTTAATAACGACAACCATCAAAAAGAAATCTTTGAACCCAGTTTAGGCACAGGCAAATTCATCGCTC
ATGCGCCAAGCGATAAGAATTACCGCTTTATGGGAACAGAATTAGATCCTATTAGCGCTAATATTTCTAAATTCCTTTAC
CCTAATCAAGTCATCAACAACACCGCTTTAGAAAACCACCAATTCTATCAAGAATACGATGCGTTTGTGGGCAATCCTCC
TTATGGCAGTCATAAAATCTATAGCTCCAATGACAAAGAATTGAGTAACGAGAGCGTTCATAATTACTTTTTAGGGAAAG
CTATCAAAGAATTGAAAGATGATGGCATAGGAGCGTTTGTGGTGAGTTCTTGGTTTATGGATGGTAAAAACCCTAAAATG
AGAGAACACATCGCGCAAAACACCACTTTTTTAGGAGCGATAAGATTGCCTAATAGCGTGTTTAAAGCAACAGGCGCTGA
AGTGAGTAGCGACATTGTGTTTTTTAAAAAAGGCGTTGATGGAGCAACCAATCAAAGCTTCACTAAAGCTATGCCTTATT
ATGACAAGATCATTGATAGCTTGGATAATGACACCCTTTTTGCCTTGCAAAACAACCGCTTTGATAGTTTTACTCCTAGC
GATCAACTTAAGATTGTCAATGCGATTGCAAGCCATTTTGGTTTCAAACAAGAAAAATTGCAACGCTGGTATGAAAAAAT
AGACACCGCTAACTTTGGCTACAGAGAACAAGACTATAAGATCATCAAAGGCTTCATTGATAAAGTTGGCGAGAATAATA
TCAATCTCAACGAACAAACCTTAAATGAATACTTTATCCACCACCCTGAAAACATTCTAGGGCATTTGAGTTTGGAAAAA
ACCCGCTATAGCTTTGAAATAAATGGCGAACAAATTTACAAATACGAGTTGCAAGCTTTAGAGGATAAAAGCTTAGACTT
ATCCCAAGCTCTTCATCAAGCGATAGAAAAATTGCCTAAAGATGTCTATCAATACCATAAGACTACCTTTAAAACAGACG
CTCTCATTATTGATGCAAATAACGAACGCTATCAAGAAGTTCAAAAGCTTATCAAAAATTTAGAAAGGGGGGAATTAGTC
AAGTGGGATAATCTTTATTTCCAACTAGAACAAAATAATGAAAGGGGCATTTTTTTAAAACCCACTAAAATCAACTCTAA
AGTCCAAGATTCACGACTAAAAGCCTATTTTAAAATTAAAGACGCTTTGAATGATTTAACGAGTGCAGAATTAAGCCCCT
TAAGCTCTGATTTGGAGCTAGAAAGTAAAAGAGTTAGGCTCAATCTTGTTTATGATGAATTTGTCAAGAAATTTGGCTAT
CTCAATGAGAATAAAAATCGTAAGGATATCAAACAAGATTTGTATGGCGCTAAAGTCTTAGGATTAGAAAAAGACTTTGA
AAAAGAAATCACCCCTAGAAGCGCCAAAATGCAAAACATAGAGCCAAGGCAAGCTCAAGCTAAAAAAGCTCAAATCTTTT
TTGAAAGGACTTTAAACCCTAAAAAAGAACTTATTATCACTAACGCCAAAGAGGCATTAATTGCAAGCATCAATCAAAAA
GGGGGTTTAAATTTGCATTTCATTAGAGATCATTTCGCAACCCAAAGCTTAGAAACCACGATTAAAGAACTTTTAGAGCA
AAAACTTATTTATAAAGACCACAAGGATAATGGCGACTATGTTTTAGCGAACGATTATTTGAGCGGCAATGTGAAAAGAA
AACTCAAAGAAGTTAAAGAAGCCATCAATCAAGGCGTGGAGGGATTAGAGGCTAATGTGAAAGATCTAGAGCTGATTATC
CCTAAAGATTTGAAAGCCACTGAAATCATGGCTAATATCAACAGCCCTTGGATACCCACTCAGTATTTAGAAGAGTTTTT
AATAGAATTAGCCGCTAACCATTATGAAAAGCAATACGGCGATAAAATGACAGATTACCAACTAGGCAATCTCAAAGAAG
GCATCAAAGTAGAACACCTAAGCGGTGCTTATGAAGTTTTGGTTAGAAACAATGAATTAAACGAGCTTTATGGTATTAGG
CATAAAGACAAACCGCATTCTTATAAAGCGCCTTTTGAAAGCCTTTTAATAAAAGTCTTAAACAACAAGGATTTGAGCGT
TAAATACGCCCAAGTTGATCCTAATGACCCTAAAAAAGAAATCTTTATCACTGATGAAGAGCAAAGCAATCTCGCTAGAC
AAAAAGCAGAAGAATTGAAAGAAGCTTTTAAAGACTGGATTTATAAGGATTATACAAGAAGAACCCATTTAGAGCAAATC
TATAATGACACTTTCAACAATTCTGTTTTAAAAACCTATGATGGCTCGCAATTAGAACTAGAGGGCTTTAACCACCATAT
CAGCTTGCGCCCCCACCAAAAGAACGCTATTTTTAGAACCATCCAAGACAGGGCGGTGTGTTTAGACCATCAGGTTGGAG
CAGGCAAGACTTTGTGCGCTATAGCCAGTTGCATGGAACAAAAACGCATGGGGTTAGTGAATAAAACGCTCATTGCCGTG
CCTAACCATTTAACCAAGCAATGGGGCGATGAATTTTATAAGGCTTACCCTAACGCTAATGTGTTAGTTGTTGATAGCAA
GGACATCACTGAAAAAGAAAGAGAGCTTTTATTCAATCAAATCGCTAACAACAATTATGACGCTGTGATTATCGCGCACA
CCCATTTGGAATTATTGTCTAACCCTAGAGGAATCATAGAAGAATTGAAAGAAGAAGAACTAGTGAATGCCGAAAAAAAC
TTTGAAAGGCAAGAACTGGCTTATAAAAATAACCCTAGAGAAACTAAAAAACCCAATGAAAGAGCCTTTAAAAGCAAGCT
GGATAAAATCCGTGCTAAATACGATGCGATTTTAGAAAAACAAGGCTCTCATATTGATATTAGTCAAATGGGGATTGACA
ATTTGATTGTGGATGAAGCCCACTTATTCAAAAATCTAGCCTTTGAAACTTCTATGGAAAAAATTGCAGGGCTTGGTAAC
CAACAAGGCTCTAATCGCGCCAGAGATTTGTTGATTAAAACGCGCTACTTGCATCAAAACAATAAGAAAATCATGTTTTT
AACCGGCACGCCTATAGCTAATTCCTTGAGTGAAATGTATCACTTGCAACGCTACCTGACCCCTGATGTGTTGGAAGAAA
GAGGGTTAGAATTCTTTGATGATTGGGCTAAGACTTATGGGGAAGTGGTGAATGATTTTGAATTAGACACTTCCGCTCAA
AGTTATAAAATGGTTAATCGCTTTTCTAAATTTAGCGATGTGCAAGGCTTAAGCACCATGTATAGAGCTTTTGCGGATAT
TGTCTCCAATGATGATATTTTAAAGCATAACCCCCACTTTGTGCCTAAAGTGTATGGGGATAAACCTATCAATGTGGTGG
TGAAAAGAAGCCAAGAAGTGGCTCAATTTATTGGCGTGGCTGATGAAAATGGCAAATATAATGAAGGCTCTATCATTGAT
AGGATGCAAAAATGCGAGGGCAAGAAAAGCAAAAAAGGGCAAGACAATATCCTTTCTTGCACCACAGACGCTAGAAAAGT
GGCTCTGGATTACCGCTTGATTGACCCTAACGCTAAAGTAGAAAAAGAATTTTCTAAAAGCTATGCTATGGCAAAAAATA
TCTATGAGAATTATTTAGAAACTAATGCCACTAAAGGCACACAACTTGGTTTCATAGGTCTATCCACACCCAAAACCCAT
AGCCAAAAAGTGAGTTTAGAAGCGCTAGATAACGCTCATGAGATAGAAAATAAAAATCCCCTAGATGAAGCTCAAGAACT
TTTAGAGAGCTTGTCTAGTTATGATGAAAATGGCAATCTTATCGCTCCTAGCAAGAAAGAATTAGAGAACGAGCTCAAAG
AGAAAGAGGCTAAAAGCGTCAATTTAGATGAAGAGCTAGCTAAAGGCTGTAAGTTTGATGTTTATAGCGATGTTTTAAGG
CATTTAGTCCAAATGGGTATCCCACAAAATGAAATCGCTTTCATCCATGACGCTAAAACCGAAGAGCAAAAACAGGATTT
GTTTAAAAAGATTAATCGTGGCGGAGTCAGGGTATTATTGGGCAGTCCCGCTAAAATGGGCGTAGGCACTAATGTGCAAG
AAAGATTAGTCGCTATGCATGAATTAGATTGCCCATGGAGACCTGATGAATTGTTGCAAATGGAAGGGCGTGGGATAAGA
CAAGGCAATATTTTGCACCAAAACGATCCTGAAAATTTTAGAATGAAAATCTATCGCTACGCCACTGAAAAAACTTATGA
TAGCCGTATGTGGCAAATCATAGAGACTAAATCTAAAGGCATAGAGCAATTTAGAAACGCGCACAAATTAGGCTTGAATG
AATTAGAAGACTTTAACATGGGGAGTTCTAATGCGAGTGAGATGAAAGCAGAAGCAACAGGTAATCCCTTAATTATTGAA
GAAGTCAAATTGAGAGCTGAAATCAAAAACGAAGAAGCAAAATACAAAGCTTTCAATAAAGAAAATTACTTCAATGAAGA
GAATTTGAAAAACAACTCCTCTAAATTGGATTATCTTAAACAGGAATTGAAAGATTTAGAAACGCTTCAAAGCTCTGTAA
TGATCCCCACTCATACAGAGATCAAGCTCTATGATTTGAAAAATGAAGAGAGTAAGGATTATGAGCTTATCAAAGTTAAA
GAAGTAGAGCCTTTAAAAGAAAACGCCTCTATGAGTGAAGAATTAACGCACAAAAAACTCAAAGAACAAAACAAGCAAAT
AGCCGAACAAAATAAAGAAAAGCTAGATGCTATTAAAAAGCAATTTGCAAGCAATTTGAACGACTTGTTTTTCAATGAGG
AAAGAGATTGTAAGCTTTTAGAATACAAGGGCTTTGTGGTGAATGCTTATAAAACTAAGTATCAAGTGGAGTTTAGTTTA
AACCCTAAAGACAATCCAAATATTGCCTATAGCCCTAGCAATATGGTTTATAAAAACGATACTGCCAACATGTTTAGCTC
TTATAATTTCTGCGGCGAGATTAAATTTGATGGGTTTTTAAAAAGATTGGATAACGCTATCACTAAACTCCCTGAAAAAA
TCAAGGAATTAGAAAACTCCATTAAAATCACTCAAGAAAATATCGCTAAATACACAAGATTAGTGGAACAAAAACCTCCT
TACCCACGACTAGAATACTTGCAAGCTTTAAAATGGGATCATAAAACTCTAATAGATGATTTAGCTAAAATGAGCAAAGA
CAGAGATTATAAGCCTGTGTTCAACCCTAAATCTCAAGAAGTCTTAGAGAAAATGAACGCTGAAAAAAGAGCGAGTTTAG
AGAATGAGGGTAAAGAAATGACTGAAATTAAAAACAGCAATAAAGAGCAAGAGATTAAGAGAGATATAAAGAGCGATGAT
GAAGTAAGACAACATATAGAGCAAGTGATTGAGAAAGAAATAGAAAAAGGCACTGAAAATATTTCTTCTAGTGAGCTTAT
AACCACTAACAATATTGATTACTACGAGAACGAAGAAGTAGAAATCATTAAATCAAGGGGTAGAAGATGA

Protein sequence :

MISRNPIEWARYLSFERRVHKDNSREDVNFFANGEIKESSRVYEANEKGFERRITKKYDLIDRNKEFFSKEIDILTYKNS
LEELKEQGLEIQLTHHHETHKKTLENGNEIAKEYDYLKDIYHEVERTKTGELVRGIIPSISSAEYFKLYNKLPFESINNE
NTKLNTNNTIKNTIETNASNNIIQNNDNNNPNLSIADLELEQQNLGEQNGKERTNRADEPNRTRAGIPQEIHRRSEHGGQ
QEGVERSSDEELLHQDSSLFIEPREQGGTRGVYRSSDQQAVSEKSHRERDKLHEHVSRGDGVSARADTRADSNGASSQAS
RMENGARSEEKGDNPSDERGVSPTPQSPSHQQNSSRDLGLSLSREQPGQTGRLRLFDHGQMGSLFPTDHENQRSKNDNEL
DRSSNRTNENGDKSPRQNGSANQESARSERYGIAQGSSSQSVLPLAQSRLHHAGLSTPNGLGNLEEDRDQERGLLSNLDH
LESLLNAIRNNTIASEPDFRTRLLEAIQNNEPLKDSIVGMQLLKDPTTKIFYDKFQLKISPKKVLEILENRIKKSIETAN
ETLNAFNALDSQAIDGNAISNSVGLNPTQESGITDNSVELNNAQEQTAQEQDTQENAQTTIKQETPTAPAIPLNPKIDFK
PSEEVLIKGAKTRYKANIKAIELLKELQAKQEILKGDYYATQEEQKILAQFSGWGGLESYFKKDQRPEEFKELNALLTKD
EFRRAYSSTRDAYYTPKLVIDSIYQGLDQLGFNNDNHQKEIFEPSLGTGKFIAHAPSDKNYRFMGTELDPISANISKFLY
PNQVINNTALENHQFYQEYDAFVGNPPYGSHKIYSSNDKELSNESVHNYFLGKAIKELKDDGIGAFVVSSWFMDGKNPKM
REHIAQNTTFLGAIRLPNSVFKATGAEVSSDIVFFKKGVDGATNQSFTKAMPYYDKIIDSLDNDTLFALQNNRFDSFTPS
DQLKIVNAIASHFGFKQEKLQRWYEKIDTANFGYREQDYKIIKGFIDKVGENNINLNEQTLNEYFIHHPENILGHLSLEK
TRYSFEINGEQIYKYELQALEDKSLDLSQALHQAIEKLPKDVYQYHKTTFKTDALIIDANNERYQEVQKLIKNLERGELV
KWDNLYFQLEQNNERGIFLKPTKINSKVQDSRLKAYFKIKDALNDLTSAELSPLSSDLELESKRVRLNLVYDEFVKKFGY
LNENKNRKDIKQDLYGAKVLGLEKDFEKEITPRSAKMQNIEPRQAQAKKAQIFFERTLNPKKELIITNAKEALIASINQK
GGLNLHFIRDHFATQSLETTIKELLEQKLIYKDHKDNGDYVLANDYLSGNVKRKLKEVKEAINQGVEGLEANVKDLELII
PKDLKATEIMANINSPWIPTQYLEEFLIELAANHYEKQYGDKMTDYQLGNLKEGIKVEHLSGAYEVLVRNNELNELYGIR
HKDKPHSYKAPFESLLIKVLNNKDLSVKYAQVDPNDPKKEIFITDEEQSNLARQKAEELKEAFKDWIYKDYTRRTHLEQI
YNDTFNNSVLKTYDGSQLELEGFNHHISLRPHQKNAIFRTIQDRAVCLDHQVGAGKTLCAIASCMEQKRMGLVNKTLIAV
PNHLTKQWGDEFYKAYPNANVLVVDSKDITEKERELLFNQIANNNYDAVIIAHTHLELLSNPRGIIEELKEEELVNAEKN
FERQELAYKNNPRETKKPNERAFKSKLDKIRAKYDAILEKQGSHIDISQMGIDNLIVDEAHLFKNLAFETSMEKIAGLGN
QQGSNRARDLLIKTRYLHQNNKKIMFLTGTPIANSLSEMYHLQRYLTPDVLEERGLEFFDDWAKTYGEVVNDFELDTSAQ
SYKMVNRFSKFSDVQGLSTMYRAFADIVSNDDILKHNPHFVPKVYGDKPINVVVKRSQEVAQFIGVADENGKYNEGSIID
RMQKCEGKKSKKGQDNILSCTTDARKVALDYRLIDPNAKVEKEFSKSYAMAKNIYENYLETNATKGTQLGFIGLSTPKTH
SQKVSLEALDNAHEIENKNPLDEAQELLESLSSYDENGNLIAPSKKELENELKEKEAKSVNLDEELAKGCKFDVYSDVLR
HLVQMGIPQNEIAFIHDAKTEEQKQDLFKKINRGGVRVLLGSPAKMGVGTNVQERLVAMHELDCPWRPDELLQMEGRGIR
QGNILHQNDPENFRMKIYRYATEKTYDSRMWQIIETKSKGIEQFRNAHKLGLNELEDFNMGSSNASEMKAEATGNPLIIE
EVKLRAEIKNEEAKYKAFNKENYFNEENLKNNSSKLDYLKQELKDLETLQSSVMIPTHTEIKLYDLKNEESKDYELIKVK
EVEPLKENASMSEELTHKKLKEQNKQIAEQNKEKLDAIKKQFASNLNDLFFNEERDCKLLEYKGFVVNAYKTKYQVEFSL
NPKDNPNIAYSPSNMVYKNDTANMFSSYNFCGEIKFDGFLKRLDNAITKLPEKIKELENSIKITQENIAKYTRLVEQKPP
YPRLEYLQALKWDHKTLIDDLAKMSKDRDYKPVFNPKSQEVLEKMNAEKRASLENEGKEMTEIKNSNKEQEIKRDIKSDD
EVRQHIEQVIEKEIEKGTENISSSELITTNNIDYYENEEVEIIKSRGRR

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
HPP12_0447	YP_002301083.1	DNA methylase	Not tested	cag PAI	Protein	0.0	93