Gene Information

Name : CPF_1123 (CPF_1123)
Accession : YP_695569.1
Strain : Clostridium perfringens ATCC 13124
Genome accession: NC_008261
Putative virulence/resistance : Unknown
Product : cell wall-associated serine proteinase
Function : -
COG functional category : O : Posttranslational modification, protein turnover, chaperones
COG ID : COG1404
EC number : 3.4.21.96
Position : 1281873 - 1286585 bp
Length : 4713 bp
Strand : +
Note : identified by similarity to GB:AAK27981.1; match to protein family HMM PF00082; match to protein family HMM PF02225; match to protein family HMM PF06280; match to protein family HMM TIGR01167

DNA sequence :

ATGAAGGAACAGAAAAAACAGATGAAGAGGTTTTTATCCTCAACGCTCAATGGTTTGGTGGTATTGGCTCTTATAATGCC
TAGTAGTGTAGGAACTAATGTAATGGCAGAGGAAATTCAAAATGGGACAAGCCATACAGTAAGAAATTTAGAGAATATTG
CTAGGGATGAACTTTATTTTAAGTATCAAAATCCAAATGAAGTAGTAAGAGTTATAGTTGAACTTGAAAAGCCAGCAGCT
ATAGAGGAAGCTAAGGCTGAAGGTGAGAAAAAACCATCTGAAGCAAAAATTCAAGAAGTAAAAGAAGAACAAAAAGATGC
TAAGGATGAAGCAGAAGAAATTACAGGAGAAAAGATAAATAAAAGCTTTGGAACCTTAATAAATGGATTCAGTATCGATA
CAAAAGTAAAAGATATAGAGGAATTAAAGAAAATCGATGGTGTAAAAAGCGTAAAAGTTGTAAAGACTTATTATCCAGCT
ATGAATTCTGCTAAAGATTTAACACAGGCAGTAGAAACTTGGAAAGAGTTAGGCTTAAAAGGTGAAGGAATGGTTGTTTC
TATTATAGATTCAGGAATAGATCCAAATCATAAAGACATGAAAATAACAGATTCATCAAAAGCTAAGCTTAAAAAAGAAA
ATTTAAAAGATGGACCAGGAAAATATTTTACAGAAAAAATTCCATATGGATATAATTTTGCTGATGAAAATGAAAATATT
ATAGATACACATCCAAAAGTAGATATGCATGGAATGCATGTAGCAGGAATAGTTGCTGCCAATGGAAGTGATGAAGAGGT
TGCTAAAAATGAGGCAATAAAAGGAGTAGCACCAGAAGCACAATTACTAGCTATGAAAGTTTTTTCAAATAATCCTAATA
GACAAGGGGCTGCTGAGGATGATATAGTAGCAGCTATTGAAGAGTCTGTTAATCAAGGAGCAGACATAATAAATATGAGT
TTAGGATCTTCTGCTGGATTTCAAAAAGAAGATGATCCAGAACAAATAGCAGTTAAAAAGGCTGTGGATGCTGGGGTAGT
CGTTGTCGTGGCTGCTGGAAATTCACAATATTCAACGGCTCCATACAAGGTTCCAGATATAAAGGATACTGGTTTAGTAG
GAGCTCCTGGAACTGCAAAGGATGCACTTACAGTAGCAAACTATCATAATAGTAAGATGTTATTACCAACAATAAGCTTT
GAAGAAAATGGGGAAGCAGTTAATATACCATTTATGTTATCAGGAGAAGAAAATAGTCTTAATTTAGATAAAGACTTTAA
TTTAGTAGATTGTGGACTTGGAAAGGTACAAGATTTTAAAGGAAAAGATTTAAAGGGAAAAGTTGCCTTAATAAAAAGAG
GGGAAATTACTTTTATAGATAAAAATTTAAATGCACAGGTAGCTGGTGCTGAAGGGGTAATAATATACAATGGAGATGGT
GATGAGTCATTTATAAATATGGCAACAGATCCAAAGGTTAAAATTCCATCAGTATTTGTTAAAAACTCAGACGGGGAAAA
ATTTAAAAATGCTATTAATAAAAGTTTAAAAATAAAGTTTACAAACAATAAAATATTAGTTGCAAGTAGTGATGCTGGTG
ATTTTGTTGAATCATCATCATGGGGACCTACTCCAAGCTTAGACTTTAAACCACAAATATCTGCACCAGGTGGAAATATA
TATTCAACTATAAATGATAATAAATATGGTATTAAGACTGGTACATCAATGGCAGCGCCACATGTTGCTGGAGGAGAAAC
ATTAATAGTTGAAGGGCTTAAAAAGGAAAATCCAAATCTTAAGGGAAGAGATTTAGTAGAATTAGCAAAAAATACAGCAA
TAAGTACTTCTAAGATAGAGATGGATAAAAATAATCCTAAGATACCTTATTCACCTAGAAGACAAGGAGCTGGTCTTATG
CAAATAGAGGAAGCTCTTAAAAATAAGGTTGTAGTATTAGATGAAAATAATAATTCTACTGTGGCATTAAAGCAAATAGG
AAATGAGAAAGAATTTACATTAACATTAAAAAATTATGGAGATAAAGAAGCTGAGTATGATGTTGAAAATTTAGGTGGAG
TTTTAACAGAAACTAGTGATACTTTAAAGACTATGTCTCATGATGTAAGGATTGAGGGGGCAAATCTTAAGTTTGATAAA
AATAAAGTTATTGTTCCAGCTAAGGGTACAGAAACTTTAAAAGTGAAATTAACAATACCTAAAGCCATTTCAGAGGATAG
ATTTGTTGAAGGATTTATTAAACTTACAGGAAAAGATGTTCCATCATTATCAGTTCCTTTCATAGGATATTATGGAGACT
GGGGAAAAGATCAAATAATAGAAGCTATGAATTGGGATAGTAACAATCAAAAGTTCATAGTTCCATCAGAAGTATTAACA
AATTTAAATGGAGCAATTGGGTACAAGCTAGGTTTAGGAGCAAAGGATGAAAAGGGAAATCTTAAAGTAGATCCTAGTAA
AATAGCAATATCTCCAGATGGAAATGGAAATGGTGATATCATAGCTCCATATTTATATTATTTAAGAAATGCTAAGGTAA
CTGAATTAGAATTATTAGATAAAGATAAAAAATCCTTAGGAGTTATAGGACATGAAGACTATATAAGAAAAGAGGAATAT
AGTGAACCAAGTGGAAGTGGAAAAGCTCCAAACTTATTTGAGAACTTAACTTGGGATGGAAAGCTATATAACCAAAGTAC
AGGAGAAAAGGAAGTTGTACCAGAAGGACAATATTATTTAAATATAAAATCAAAAGTTGATTATGATAATGCTAAAGATC
AAGAGGTAGTTGTTCCAGTACAAGTTGACCTTACTGCACCTAATATTGAAATAACTTCAGGAGACAAAGTATTAGGCAAT
AAGGATGATAATGAAGTAGATTATAAATTAGAATGGACTGCTAAGGACAATGTTTCTATTATACCAGATATAGCTACAGT
ATATGTAAATGGTAAAAGTGTAAGAGCTAATATAAGTGAAAATAATGGCACTTATAGTTGTGACATAAAGTTAAAAAACA
ATGCTTTAAATGAAGTTAAGGTAGCTATGAATGATACAGCATTTAACTTAGGTGAAGTATCTAAGAATATAAAGGTTGAA
TCTTCAGATCCATTAATAAAATTTGAAGGTAACTTTGGAACTGCTACTTTAAGTGTTGATAATTCTTTAGAATATCTAGT
AAAGGGAGTAGTTTTAGGTCCAGTAAAAGAATTTAAGTTAAATAATGAAGATGTTAAGGTAAATGAAGATGGAACTTTTA
TACATAAAGTTTCTTTAAAAGAAGGTATGAATAAAGTTAATATTTATGCTAAAGATGAAAATGGAAATGTATTATATAAT
TATGCTAGTAATATATTATGTGATACTAAAGCTCCTATAATAAACTTATTATCTCCAAAGGTAGAATCAGATGGTATAGT
TATAACTAATGAAGATAAAGTAAATATAAAAGGTACTGTTGAGGATAACACATTAGGATATAAGTTCTATAAAAATGATA
CTATTCAATTAGAAGTTGAAGAGAGAGCTAAGCCAGGAAATGATAGTACAAGAAGAGAGTTTTCATATGAAGTTCCTGTA
AAAGATGGAGATGTTATAGTATTAAAGGCCGTTGATGTATTAGGTCATGAAACTCTTAGAAAGCTTACTGTTAAGGTTGA
TAAAAATGCTCCAGAAGTGACAATTGGAGGAGTATCAGATCAAGGAATATACAATAGTGATGTAGCTCCAAAGGTAGTTT
CTAATGAAGATGTAGAAATTAGTTACTTATTAAATGGAAAAGATTATGATGGAAAAACTCCTATTTCAGAGGATGGAAAC
TATGAGTTAATTGTAAGGGCTAAAGATAAAGCTGGAAATAAAACAGAAGTAAAAACTAACTTTACTATAGATAAAACACC
AGCAAATATTTCTGTTAATAATATTGAAGAGGGAAAAGTATATAATGAAGAAATTATTCCTGAAATAGCTAGTAATGAGG
AAGCTACTTTTAAATATACTTTAAACGGAAAAGAATATGATGGTAAGTCTAGTATAAAAGAAGATGGTGACTATGTTTTA
AATATACAAGCAACAGATAAAGCTGGAAATGTATCAAATAAAGAAGTTAAGTTTTCTATAGATAGAACACCTGCTAATAT
ATTTGTAACTGGAGTTGAAGAGGGTAAAGTTTATAATGAACCTGTTACTCCAATAATTGAGATTGATGATAAGGATGCAA
CTTTAAAATATACTTTAAATGGAAAAGAATATGACGGAAAATCAAGAATAGATGAAGATGGTAAGTATATCTTAAAGGTT
GAAGCTTTAGATAAAGCAGGAAACCCATCAGAAAAAGTTATTAACTTTACTATAGACAGAAGTTCCTTAAAAAATTCAGA
AAAGGATGATCCAAATAACAATAAGAAATATAATGAACCTATTGATGAGGAAATAGTACAAAAGCCTGAAGCTAAAACTG
ATTCAAAAGAGGAATTAAAGGCTAATAAGCTTAAAGAAGAGAATAAAGTTAGTGAAGAAAATAAAAGTAATGAAGAGAAC
TCAGTTAAAGATGAAAAACTTCTTAAGAAAGAAGGAACATTGCCAACAACAGGACAAGTTCTTGGAGGATCTATGATATC
TTTATTAGGAGCTATAATGGCTTCAGTTGGAGCTGTTTTCTTAAAAAGAAAAAATAAAAACAAGGAAGAATAG

Protein sequence :

MKEQKKQMKRFLSSTLNGLVVLALIMPSSVGTNVMAEEIQNGTSHTVRNLENIARDELYFKYQNPNEVVRVIVELEKPAA
IEEAKAEGEKKPSEAKIQEVKEEQKDAKDEAEEITGEKINKSFGTLINGFSIDTKVKDIEELKKIDGVKSVKVVKTYYPA
MNSAKDLTQAVETWKELGLKGEGMVVSIIDSGIDPNHKDMKITDSSKAKLKKENLKDGPGKYFTEKIPYGYNFADENENI
IDTHPKVDMHGMHVAGIVAANGSDEEVAKNEAIKGVAPEAQLLAMKVFSNNPNRQGAAEDDIVAAIEESVNQGADIINMS
LGSSAGFQKEDDPEQIAVKKAVDAGVVVVVAAGNSQYSTAPYKVPDIKDTGLVGAPGTAKDALTVANYHNSKMLLPTISF
EENGEAVNIPFMLSGEENSLNLDKDFNLVDCGLGKVQDFKGKDLKGKVALIKRGEITFIDKNLNAQVAGAEGVIIYNGDG
DESFINMATDPKVKIPSVFVKNSDGEKFKNAINKSLKIKFTNNKILVASSDAGDFVESSSWGPTPSLDFKPQISAPGGNI
YSTINDNKYGIKTGTSMAAPHVAGGETLIVEGLKKENPNLKGRDLVELAKNTAISTSKIEMDKNNPKIPYSPRRQGAGLM
QIEEALKNKVVVLDENNNSTVALKQIGNEKEFTLTLKNYGDKEAEYDVENLGGVLTETSDTLKTMSHDVRIEGANLKFDK
NKVIVPAKGTETLKVKLTIPKAISEDRFVEGFIKLTGKDVPSLSVPFIGYYGDWGKDQIIEAMNWDSNNQKFIVPSEVLT
NLNGAIGYKLGLGAKDEKGNLKVDPSKIAISPDGNGNGDIIAPYLYYLRNAKVTELELLDKDKKSLGVIGHEDYIRKEEY
SEPSGSGKAPNLFENLTWDGKLYNQSTGEKEVVPEGQYYLNIKSKVDYDNAKDQEVVVPVQVDLTAPNIEITSGDKVLGN
KDDNEVDYKLEWTAKDNVSIIPDIATVYVNGKSVRANISENNGTYSCDIKLKNNALNEVKVAMNDTAFNLGEVSKNIKVE
SSDPLIKFEGNFGTATLSVDNSLEYLVKGVVLGPVKEFKLNNEDVKVNEDGTFIHKVSLKEGMNKVNIYAKDENGNVLYN
YASNILCDTKAPIINLLSPKVESDGIVITNEDKVNIKGTVEDNTLGYKFYKNDTIQLEVEERAKPGNDSTRREFSYEVPV
KDGDVIVLKAVDVLGHETLRKLTVKVDKNAPEVTIGGVSDQGIYNSDVAPKVVSNEDVEISYLLNGKDYDGKTPISEDGN
YELIVRAKDKAGNKTEVKTNFTIDKTPANISVNNIEEGKVYNEEIIPEIASNEEATFKYTLNGKEYDGKSSIKEDGDYVL
NIQATDKAGNVSNKEVKFSIDRTPANIFVTGVEEGKVYNEPVTPIIEIDDKDATLKYTLNGKEYDGKSRIDEDGKYILKV
EALDKAGNPSEKVINFTIDRSSLKNSEKDDPNNNKKYNEPIDEEIVQKPEAKTDSKEELKANKLKEENKVSEENKSNEEN
SVKDEKLLKKEGTLPTTGQVLGGSMISLLGAIMASVGAVFLKRKNKNKEE

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
prtP	YP_698291.1	cell wall-associated serine proteinase, lactocepin precursor	Not tested	Not named	Protein	0.0	99