Gene Information

Name : cagA (HPOK310_0786)
Accession : YP_007538420.1
Strain : Helicobacter pylori OK310
Genome accession: NC_020509
Putative virulence/resistance : Virulence
Product : cag pathogenicity island protein
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 820856 - 824506 bp
Length : 3651 bp
Strand : -
Note : -

DNA sequence :

ATGACTAACGAAACCATTGATCAAACAATAACACCAGATCAAACAGATTTTGTTCCGCAACGATTTATCAATAATCTTCA
AGTAGCTTTTATCAAAGTTGATAGTGCTGTCGCTTCATTTGATCCCGATCAAAAACCAATCGTTGATAAGAATGATAGGG
ATAACAGGCAAGCTTTTGAGAAAATCTCGCAACTAAGGGAAGAATACGCCAATAAAGCGATCAAAAATCCTACCAAAAAG
AATCAGTATTTTTCAGACTTTATCAATAAGAGCAATGATTTGATCAACAAAGACAATCTTATTGCTGTAGATTCTTCCGT
AGAGAGCTTTCGGAAATTTGGGGATCAGCGTTACCAAATTTTTACGAGTTGGGTGTCCCTTCAAAAAGATCCGTCTAAAA
TCAACACCCAAAAAATCCGAGATTTTATGGAAAATATCATACAACCCCCTATCTCTGATGATAAGGAAAAAGCGGAGTTT
TTGAGGTCTGCCAAACAATCTTTTGCAGGAATTATCATAGGGAACCAAATCCGATCGGATCAAAAATTCATGGGCGTGTT
TGATGAATCTTTGAAAGAGAGGCAAGAAGCAGAAAAAAATGCAGAGCCTGCTGGTGGGGATTGGCTTGATATTTTTTTAT
CATTTGTGTTTAACAAAAAACAATCTTCCGATCTCAAAGAAACGCTCGATCAAGAACCAGTTCCTCATGTCCAACCAGAT
ATAGCCACTACCACCACCGACATACAAGGCTTACCGCCTGAATCTAGGGATTTGCTTGATGAAAGGGGTAATTTTTCTAA
ATTCACTCTTGGTGATATGGAAATGTTAGATGTTGAGGGTGTCGCTGACATTGATCCTAATTACAAGTTCAACCAATTAT
TGATTCACAATAACGCTCTGTCTTCTGTGTTAATGGGGAGTCATAATGGCGTAGAACCTGAAAAAGTTTCATTATTGTAT
GGGGGCAATGGTGGTCCTGAAGCTAGGCATGATTGGAACGCCACCGTTGGTTATAAAAACCAACAAGGCAGTAATGTGGC
CACACTCATTAATGTGCATATGAAAAACGGCAGTGGGTTAGTCATAGCAGGTGGTGAGAAAGGGGTTAACAACCCTAGTT
TTTATCTCTACAAAGAAGACCAGCTCACAGGCTTGAAACAAGCATTGAGTCAAAAAGAGATCCAAAACAAAGTGGATTTC
ATGGAATTTCTTGCAAAAAACAACGCTAGATTAGATAACTTGAGCGAGAAAGAGAAAGAAAAATTCCAAACTGAGATTGA
AGATTTCCAAAAAAACCCTAAGGCTTATTTAGACGCCCTAGGGAATGATCATATTGCTTTTGTTTCTAAAAAAGACAAAA
AACATTTAGCTTTAGTTACTGAGTTTGGTAATGGGGAATTGAGCTACACTCTCAAAGATTATGGGAAAAAACAAGATAAA
GCTTTAGATAGGGAGACAAAAACCACTCTTCAAGGTAACCTAAAACATGATGGCGTGATGTTTGTTAATTATTCTAATTT
CAAATACACCAACGCCTCCAAGAGTCCTGATAAGGGTGTGGGTGCTACGAATGGCGTTTCCCATTTGGAAGCAAATTTTA
GCAAGGTAGCTGTCTTTAATTTGCCTAATTTAAATAATCTCGCTATCACTAGTTATATGAGGCGAGACTTAGAAGGTAAA
CTGTCGGCTAAAGGATTGTCCCTACAAGAAGCTAATAAGCTCATCAAAGACTTTTTGAACAGCAACAAAGAATTGGTTGA
AAAAGCTTTAAACTTCAATAAAACTGTAGCTGAAGCTAAAAACACAGGCAATTATGACGAAGTGAAAAAAGCTCAGAAAG
ATCTTGAAAAATCTATAAGGAAACGAGAGCATTTAGAGAAAGAAGTAACGAAAAAAATGGAGAACAGAAACGGCAACAAA
AATAGAATGGAAGCAAAAGCTCAAGCTAACAGCCAAAAAGATAAGATTTTTGCAATTATCAATGAAGAGGCTGGTAAGGA
AGCAAGAGGGGCCGCTTGCGTTCAGAATCTTAAAAGCATCAGAATGGAATTGTCTGATAAGCTTGAAAACATCAACAAGA
ATTTGAAAGACCTTGATAAATCTTTTGATGAATTCAAAAATGGCAAAAATAAGGATTTCAGCAAGACAGAAGAAACGCTA
AAAGCCCTTAAAGACTCGGTGAAAGATTTAGGTATCAATCCAGAATGGATTTCAAAAGTTGAAAACCTTAATACAGCTTT
GAATGAATTCAAAAATGGAAAAAATAAGGATTTCAGCAAGGTAATACAAGCAAAAAGCGACCTTGAAAATTCCATTAAAG
ATGTGATCATCAATCAAAAGATAACGGATAAAGTTGACAATCTCAATCAAGCTGTATCAATAGCTAAGGCAACAGGCGAT
TTCAGTGGGGTAGAGCAAGCACTAGCCGATCTCAAGAATTTCTCAAAAGGACAATTGACTCAACAAGCTCAAAAAAATGA
AGATTTCAATACTGGAAAAAATTCTGAACTATACCAATCCGTTAAGAATGGTGTAAATGGAACCCTAGTCGGTAATGGGT
TATCTAAAGCAGAAGCCACAACTCTTTCTAAAAACTTTTCGGACATCAAGAAAGAGTTGAATGCAAAACTTGGAAATTTC
AATAACAATAATAATGATGGACTCAAAAATAGCATAGAACCCATTTATGCTAAAGTTAATAAAAAGAAAGCAGGACAAGC
AGCTAGCCCTGAAGAGTCCATTTATACTCAAGTTGCTAAAAAGGTAAATGCAAAAATTGACCAACTCAATCAAGCAGCAA
GTGGTTTCGGTAATGTAGGGCAAGCGGGATTCCCTTTGAAAAGGCATACTAAAGTTGATGATCTCAGTAAGGTAGGGCTT
TCAGCTAACCATGAACCCATTTACGCTACGATTGATGATCTCGGCGGACCTTTCCCTTTGAAAAGGCATACTAAAGTTGA
TGATCTCAGTAAGGTAGGGCTTTCAGCTAACCATGAACCCATTTACGCTACGATTGATGATCTCGGCGGACCTTTCCCTT
TGACAAGGCATACTAAAGTTGATGATCTCAGTAAGGTAGGGCTTTCAAGGGAGCAAGAATTGACTCAGAAAATTGACAAT
CTCAACCAGGCGCTATCAGAAGCTGAAGCATGTCATTTTGGCAACCTAGAGCAAATGATAGACAAGCTCAAAGATTCTAC
AAAAAAGAATGTTATGAATCTATATGTTGAAAGTGCAAAAAAAGTGCCTACTAGTTTGTCAGCGAAATTGGACAATTACG
CTACTAACAGCCACACACGCATTAATAGCAATGTCAAAAATGGAACAATCAATGAAAAAGAGACTAGCATGTTAATGCGA
AAAAACCCTGAGTGGCTTAAGCTCGTGAATGATAAGATAGTTGCGCATAATGTGGGAAGTGCTCCTTTGTCAGCGTATGA
TAAAATTGGATTCAACCAAAAGAATATGAAAGATTATTCTGATTCGTTCAAGTTTTCCACCAGGTTGAGCAATGCCGTAA
AAGACATTAAGTCTGACTTTGTGCAATTTTTAACCAATATATTTTCTATGGGATCTTACAGCTTGATGAAAGCAAGTGTG
GAACATGGAGTCAAAAATACTAATACAAAAGGTGGTTTCCAAAAATCTTAA

Protein sequence :

MTNETIDQTITPDQTDFVPQRFINNLQVAFIKVDSAVASFDPDQKPIVDKNDRDNRQAFEKISQLREEYANKAIKNPTKK
NQYFSDFINKSNDLINKDNLIAVDSSVESFRKFGDQRYQIFTSWVSLQKDPSKINTQKIRDFMENIIQPPISDDKEKAEF
LRSAKQSFAGIIIGNQIRSDQKFMGVFDESLKERQEAEKNAEPAGGDWLDIFLSFVFNKKQSSDLKETLDQEPVPHVQPD
IATTTTDIQGLPPESRDLLDERGNFSKFTLGDMEMLDVEGVADIDPNYKFNQLLIHNNALSSVLMGSHNGVEPEKVSLLY
GGNGGPEARHDWNATVGYKNQQGSNVATLINVHMKNGSGLVIAGGEKGVNNPSFYLYKEDQLTGLKQALSQKEIQNKVDF
MEFLAKNNARLDNLSEKEKEKFQTEIEDFQKNPKAYLDALGNDHIAFVSKKDKKHLALVTEFGNGELSYTLKDYGKKQDK
ALDRETKTTLQGNLKHDGVMFVNYSNFKYTNASKSPDKGVGATNGVSHLEANFSKVAVFNLPNLNNLAITSYMRRDLEGK
LSAKGLSLQEANKLIKDFLNSNKELVEKALNFNKTVAEAKNTGNYDEVKKAQKDLEKSIRKREHLEKEVTKKMENRNGNK
NRMEAKAQANSQKDKIFAIINEEAGKEARGAACVQNLKSIRMELSDKLENINKNLKDLDKSFDEFKNGKNKDFSKTEETL
KALKDSVKDLGINPEWISKVENLNTALNEFKNGKNKDFSKVIQAKSDLENSIKDVIINQKITDKVDNLNQAVSIAKATGD
FSGVEQALADLKNFSKGQLTQQAQKNEDFNTGKNSELYQSVKNGVNGTLVGNGLSKAEATTLSKNFSDIKKELNAKLGNF
NNNNNDGLKNSIEPIYAKVNKKKAGQAASPEESIYTQVAKKVNAKIDQLNQAASGFGNVGQAGFPLKRHTKVDDLSKVGL
SANHEPIYATIDDLGGPFPLKRHTKVDDLSKVGLSANHEPIYATIDDLGGPFPLTRHTKVDDLSKVGLSREQELTQKIDN
LNQALSEAEACHFGNLEQMIDKLKDSTKKNVMNLYVESAKKVPTSLSAKLDNYATNSHTRINSNVKNGTINEKETSMLMR
KNPEWLKLVNDKIVAHNVGSAPLSAYDKIGFNQKNMKDYSDSFKFSTRLSNAVKDIKSDFVQFLTNIFSMGSYSLMKASV
EHGVKNTNTKGGFQKS

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
cagA	BAD51756.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	92
cagA	BAD51753.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	92
cagA	BAD51766.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	90
cagA	BAD51759.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	89
cagA	AAR03939.1	CagA	Virulence	cag PAI	Protein	0.0	89
cagA	BAC10432.1	CagA	Virulence	cag PAI	Protein	0.0	88
HP0547	BAD13990.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	88
cagA	BAD51750.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	87
cagA	BAD51751.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	87
cagA	BAD51760.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	87
cagA	BAD51758.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	87
cagA	AGC69806.1	cag pathogenicity island protein A	Virulence	cag PAI	Protein	0.0	87
cagA	YP_003728762.1	cytotoxin-associated protein A	Virulence	cag PAI	Protein	0.0	87
cagA	BAD51764.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	87
cagA	BAC10430.1	CagA	Virulence	cag PAI	Protein	0.0	87
cagA	BAD51761.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	86
cagA	BAC10424.1	CagA	Virulence	cag PAI	Protein	0.0	86
cagA	BAD51752.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	85
cagA	BAC10428.1	CagA	Virulence	cag PAI	Protein	0.0	85
HP0547	BAD13908.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	85
cagA	AAC44706.1	CagA	Virulence	cag PAI	Protein	0.0	85
cagA	NP_223213.1	cag island protein, cytotoxicity associated immunodominant antigen	Virulence	cag PAI	Protein	0.0	84
cagA	AAR03881.1	CagA	Virulence	cag PAI	Protein	0.0	84
HP0547	BAD13935.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	84
cagA	BAD51747.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	84
cagA	BAC10429.1	CagA	Virulence	cag PAI	Protein	0.0	84
cagA	BAD51754.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	83
cagA	AAR03909.1	CagA	Virulence	cag PAI	Protein	0.0	83
cagA	AAR03970.1	CagA	Virulence	cag PAI	Protein	0.0	83
HP0547	NP_207343.1	cag pathogenicity island protein (cag26)	Virulence	cag PAI	Protein	0.0	83
HP0547	BAD13963.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	82
cagA	BAD51755.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	82
cagA	BAD51744.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	82
cagA	BAC10420.1	CagA	Virulence	cag PAI	Protein	0.0	82
cagA	BAC10435.1	CagA	Virulence	cag PAI	Protein	0.0	82
HP0547	BAD14072.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	82
cagA	BAC10431.1	CagA	Virulence	cag PAI	Protein	0.0	82
cagA	YP_005775747.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	82
cagA	BAC10426.1	CagA	Virulence	cag PAI	Protein	0.0	82
cagA	YP_005777288.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	82
cagA	YP_005774524.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	82
cagA	BAC10419.1	CagA	Virulence	cag PAI	Protein	0.0	82
cagA	BAD51749.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	82
cagA	BAD51762.1	cytotoxin associated protein A	Virulence	cag PAI	Protein	0.0	82
cagA	AAF17598.1	CagA	Virulence	cag PAI	Protein	0.0	82
cagA	BAC10421.1	CagA	Virulence	cag PAI	Protein	0.0	81
HP0547	BAD13799.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	81
cagA	YP_005779046.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	81
HP0547	BAD13880.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	81
cagA	AAF17597.1	CagA	Virulence	cag PAI	Protein	0.0	81
HP0547	BAD14018.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	81
cagA	BAC10433.1	CagA	Virulence	cag PAI	Protein	0.0	81
HP0547	BAD14045.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	81
cagA	BAC10427.1	CagA	Virulence	cag PAI	Protein	0.0	80
HP0547	BAD13853.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	80
cagA	BAC10423.1	CagA	Virulence	cag PAI	Protein	0.0	80
cagA	BAC10422.1	CagA	Virulence	cag PAI	Protein	0.0	70
HP0547	BAD13826.1	cag pathogenicity island protein	Virulence	cag PAI	Protein	0.0	70

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
cagA	YP_007538420.1	cag pathogenicity island protein	VFG0306	Protein	0.0	83