Gene Information

Name : irp2 (YE2617)
Accession : YP_001006815.1
Strain : Yersinia enterocolitica 8081
Genome accession: NC_008800
Putative virulence/resistance : Virulence
Product : yersiniabactin biosynthetic protein
Function : -
COG functional category : Q : Secondary metabolites biosynthesis, transport and catabolism
COG ID : COG1020
EC number : -
Position : 2820259 - 2826366 bp
Length : 6108 bp
Strand : +
Note : -

DNA sequence :

ATGATTTCTGGCGCACCATCTAAGGATTCGCTGTTACCGGACAACCGCCACGCGGCTGATTACCAACAATTACGCGAGCG
GCTTATACAGGAACTGAATTTAACGCCGCAGCAGTTACATGACGAAAGCAACCTGATCCAGGCCGGCCTGGATTCAATAA
GATTGATGAGATGGTTACACTGGTTTCGTAAAAATGGCTACCGCCTTACCCTTCGCGAGCTGTATGCCGCCCCCACGCTG
GCGGCATGGAACCAGTTAATGCTCAGCCGGTCGCCGGAGAACGCGGAAGAAGAAACGCTGCCCGACGAATCATCCTGGCC
GAACATGACCGAAAGTACCCCCTTCCCATTGACGCCGGTACAGCACGCCTACCTGACGGGCCGCATGCCGGGGCAGACGC
TTGGCGGCGTGGGTTGCCACCTGTATCAGGAGTTTGAAGGCCATTGTCTGACGGCGTCGCAACTGGAGCAGGCCATCACG
ACCTTGCTGCAACGCCACCCAATGCTGCATATCGCCTTTCGCCCCGACGGGCAGCAGGTCTGGCTACCGCAACCTTACTG
GAACGGCGTCACCGTTCATGATTTACGCCATAACGACGCTGAAAGCCGCCAGGCCTATCTGGACGCACTGCGCCAGCGCC
TCAGCCACCGTCTTTTACGCGTGGAGATCGGCGAAACATTTGATTTTCAGCTGACGCTCTTGCCGGACAATCGCCACCGC
CTCCATGTCAATATTGACCTGCTGATTATGGATGCCTCCAGCTTTACGCTTTTCTTCGATGAGCTTAACGCCCTGCTGGC
CGGAGAATCGCTGTCGGCTATCGACACCCGCTATGATTTCCGCTCGTATTTGCTGCACCAGCAGAAGATCAATCAACCAC
TGAGAGACGACGCACGCGCTTACTGGCTGGCGAAAGCATCGACGCTTCCCCCCGCGCCCGTCTTGCCGCTGGTCTGCGAA
CCCGCCACGCTACGTGAAGTCCGTAATACCCGGCGCCGCATGATTGTCCCAGCAACACGCTGGCACGCCTTTAGCAACCG
GGCCGGCGAATATGGCGTGACGCCAACAATGGCGCTGGCGACCTGTTTTTCTGCCGTGCTGGCTCGCTGGGGCGGCCTGA
CGCGTCTGCTGCTTAACATCACCTTATTCGACCGCCAGCCGCTGCACCCAGCGGTTGGCGCGATGCTTGCCGACTTCACC
AATATTCTTCTGCTGGATACCGCCTGCGATGGCGATACCGTCAGCAACCTGGCGCGTAAAAACCAGCTCACGTTTACGGA
GGACTGGGAGCATCGCCACTGGTCCGGCGTCGAATTACTCCGTGAACTCAAACGCCAGCAGCGCTACCCCCACGGCGCCC
CGGTGGTATTTACCAGCAATCTGGGGCGTTCCCTCTACAGCAGCCGCGCAGAATCGCCGTTGGGCGAGCCGGAATGGGGC
ATCTCGCAAACGCCGCAGGTCTGGATAGATCATCTGGCGTTCGAGCATCACGGCGAGGTCTGGCTGCAATGGGACAGCAA
CGACGCGCTGTTCCCTCCGGCGTTAGTCGAAACATTGTTCGACGCCTACTGCCAGTTGATTAACCAACTCTGCGATGACG
AAAGCGCCTGGCAAAAGCCGTTCGCAGATATGATGCCCGCCAGCCAGCGCGCGATACGCGAACGGGTCAACGCCACCGGC
GCCCCCATTCCCGAAGGCTTGCTGCATGAAGGCATTTTCCGTATCGCTCTGCAACAGCCGCAGGCGCTGGCGGTAACGGA
CATGCGTTATCAGTGGAATTATCATGAGCTGACAGACTATGCCCGCCGTTGCGCAGGCAGGTTAGTCGAGTGCGGGGTTC
AGCCCGGCGATAATGTGGCTATCACGATGTCGAAAGGCGCAGGACAACTTGTTGCGGTTCTGGCCGTCCTGCTGGCCGGG
GCAGTTTACGTTCCGGTTTCGTTGGACCAGCCTGCCGCACGGCGCGAGAAAATCTACGCTGACGCCAGCGTCCGGCTGGT
GCTCATTTGCCAGCACGACGCCAGCGCCGGGTCAGACGATATTCCCGTCCTTGCCTGGCAGCAGGCCATTGAGGCGGAGC
CGATCGTCAACCCGGTGGTACGCGCCCCCACGCAACCGGCCTACATTATCTACACTTCCGGCTCTACCGGCACGCCGAAA
GGGGTAGTCATTTCTCACCGGGGAGCGCTCAACACCTGTTGCGATATCAATACCCGCTATCAGGTTGGCCCGCATGACAG
GGTGCTGGCCCTCTCCGCCCTGCATTTTGATTTATCGGTTTACGACATTTTTGGCGTACTGCGTGCGGGCGGCGCGCTGG
TGATGGTGATGGAAAATCAACGGCGCGATCCTCACGCATGGTGTGAGCTGATCCAGCGCCATCAGGTCACGCTCTGGAAC
AGCGTCCCGGCGCTGTTCGATATGCTGCTGACCTGGTGTGAAGGTTTCGCCGACGCCACGCCGGAAAACCTGCGCGCAGT
GATGCTTTCCGGCGACTGGATCGGACTTGACCTCCCCGCCCGTTATCGGGCCTTCCGGCCACAAGGACAATTTATCGCGA
TGGGCGGCGCCACCGAGGCGTCTATCTGGTCTAACGCCTGCGAAATTCACGACGTCCCTGCCCACTGGCGTTCCATCCCT
TACGGTTTTCCGCTAACCAACCAACGCTACCGGGTGGTGGATGAACGGGGCCGGGACTGCCCTGACTGGGTGTCGGGTGA
ATTATGGATTGGCGGCATCGGGGTCGCGGAAGGCTATTTCAACGATTCCCTGCGCAGCGAGCAGCAATTTTTGACGCTCC
CGGACGAGCGCTGGTATCGCACCGGCGATCTCGGCTGCTACTGGCCAGACGGCACAATCGAGTTCCTCGGTCGTCGCGAC
AAGCAGGTCAAAGTCGGAGGATATCGCATCGAGCTGGGCGAAATCGAAAGCGCGCTCAGCCAGTTGGCGGGGGTGAAACA
AGCAACCGTTCTGGCGATCGGCGAAAAAGAAAAAACGCTGGCGGCATACGTGGTTCCTCAGAGCGAGGCTTTTTGCGTTA
CCGATCATCGGAACCCGGCATTGCCGAAGGCGTGGCACACGCTTGCGGGAACGTTGCCCTGTTGCGCCATCTCGCCAGAG
ATCTCCGCAGAACAGGTAGCCGATTTCCTTCAGCATCGCCTGTTAAAACTGAAGCCGGGTCACACCGCTGGCGCCGATCC
TATCCCCCTGATGAATTCACTCGCTATCCAGCCGCGCTGGCAGGCCGTGGTGGAACGCTGGTTAGCATTTCTGGTGACGC
AACGGCGACTGAAGCCCGCTGCTGAAGGTTATCAGGTCTGCGCTGGTGAAGAACGCGAGGATGAGCACCCGCACTTCAGC
GGACATGATTTAACGTTATCGCAAATTCTTCGCGGTGCCCGTAACGAACTGTCGTTACTGAACGACGCGCAGTGGTCGCC
GGAAAGCCTGGCCTTTAACCATCCGGCCAGCGCCCCGTATATTCAGGAACTGGCGACAATTTGCCAACAGCTTGCACAGC
GCTTACAGCGCCCGGTACGCCTGCTTGAGGTGGGAACCCGCACCGGCCGCGCCGCAGAATCGCTGTTGGCACAGCTCAAC
GCCGGACAGATTGAGTATGTCGGGCTTGAGCAGAGCCAGGAGATGCTACTGAGCGCCCGGCAGAGGCTCGCCTCCTGGCC
TGGTGCCCGTCTGTCCCCCTGGAATGCAGACACGCTGGCGGCGCACGCTCACTCGGGGGACATTATCTGGCTTAATAACG
CCCTGCATCGTCTGCTGCCGGAAGATCCCGGGCTCCTTGCGACATTACAACAGCTTGCCGTTCCCGGCGCGCTGCTCTAC
GTGATGGAGTTTCGCCAGTTAACGCCGTCCGCCCTGCTCAGCACGCTCCTGTTAACCAATGGGCAGCCGGAGGCCTTGCT
GCATAACAGCGCCGACTGGGCGGCATTATTTAGCGCGGCCGCCTTCAACTGTCAGCATAGCGATGAGGTCGCGGGGTTAC
AACGCTTCCTCGTACAATGTCCTGACAGGCAGGTGCGCCGCGATCCCCGTCAACTTCAGGCCGCCCTCGCCGGGCGTCTG
CCGGGGTGGATGGTGCCGCAACGGATCGTCTTCCTCGACGCCTTACCGCTGACGGCTAACGGGAAAATTGACTACCAGGC
GCTGAAGCGTCGTCATACCCCTAAAGCGGAAAACCAGGCCGAAGCGGATTTACCCCAGGGCGACATTGAAAAACAGGTTG
CCGCCCTCTGGCAGCAACTCTTATCGACTGGCAATGTCACCAGAGAAACCGACTTCTTCCAGCAAGGCGGCGATAGCCTG
CTGGCGACCCGTCTGACCGGGCAACTTCATCAGGCAGGTTATGAAGCGCAATTAAGCGACCTGTTTAATCATCCCCGGCT
GGCGGATTTTGCCGCCACGCTGCGTAAAATCGACGTCCCGGTCGAACAACCATTCGTCCACTCTCCTGAAGAACGCTACC
AGCCCTTTGCGCTTACCGACGTGCAGCAGGCTTACCTGGTGGGGCGTCAGCCGGGCTTTACCCTGGGCGGCGTCGGCTCA
CATTTCTTTGTTGAATTTGAAATTGCCGATCTGGACCTCACCCGGCTGGAGACGGTCTGGAACCGATTAATCGCCCGCCA
CGATATGCTACGCGCCGTCGTGCTTGATGGACAGCAACAGGTGCTCGAACAGACGCCCCCCTGGGTGATACCCACACACA
CCCTTCATACGCCTGAAGAGGCGTTGCGGGTACGCGAAAAACTGGCGCATCAGGTACTCAACCCCGAAGTGTGGCCGGTA
TTCGATCTCCAGGTCGGATACGTGGACGGGATGCCCGCCCGCCTGTGGCTGTGTCTGGATAACCTGTTGCTTGACGGCCT
GAGCATGCAGATCCTGCTGGCGGAGCTGGAGCACGGCTACCGCTACCCGCAACAGCTGCTTCCGCCGCTGCCCGTCACCT
TCAGGGATTATCTGCAACAGCCCTCGCTACAGTCGCCCAATCCAGATTCTCTGGCATGGTGGCAGGCGCAGCTTGATGAT
ATTCCTCCGGCGCCAGCGTTGCCGCTGCGCTGCTTGCCTCAGGAGGTTGAAACACCGCGCTTCGCCCGCCTGAACGGCGC
GCTGGACAGCACGCGCTGGCATCGGCTGAAAAAACGGGCGGCTGACGCCCATCTCACCCCGTCGGCCGTGCTGTTGTCGG
TGTGGTCAACGGTTCTCTCTGCATGGAGTGCGCAGCCTGAGTTCACGCTTAACCTTACGCTTTTCGACAGGCGACCGCTG
CACCCGCAAATCAACCAGATTCTGGGCGATTTCACTTCGCTGATGTTGCTGAGCTGGCACCCCGGCGAAAGCTGGCTGCA
CAGCGCGCAGTCACTACAGCAGCGGCTGAGCCAGAACCTCAACCACCGCGATGTGTCAGCCATCCGCGTGATGCGTCAAC
TGGCGCAACGGCAAAACGTGCCTGCCGTTCCGATGCCCGTCGTCTTTACCAGCGCGCTGGGCTTTGAGCAGGATAACTTC
CTCGCCCGGCGTAATCTGCTCAAGCCGGTCTGGGGCATCTCCCAGACGCCGCAGGTCTGGCTCGATCACCAGGTTTATGA
ATCCGAAGGCGAACTGCGCTTTAACTGGGATTTTGTCGCCGCGCTGTTTCCTGCCGGGCAGGTGGAGCGCCAGTTTGAAC
AGTATTGCGCATTGCTAAACCGAATGGCCGAGGATGAAAGCAGCTGGCAACTGCCGCTCGCCGCGCTGGTGCCTCCCGTA
AAACACGCAGGGCAATGCGCAGAGCGCCCACCGCGCGTATGCCCTGAGCACTCTCAGCCACACATTGCGGCGGACGAGAG
CACCGTCAGCCTGATTTGCGACGCCTTCCGCGAGGTGGTTGGCGAGTCTGTCACACCCGCAGAAAACTTCTTTGAGGCGG
GTGCAACATCGCTGAATCTGGTGCAACTGCACGTTTTGTTACAACGTCACGAATTTTCCACCCTGACGTTGCTTGACCTC
TTCACCCACCCTTCTCCTGTTGCCCTGGCCGATTATCTGGCCGGCGTCGCCACGGTGGAGAAAACAAAACGTCCTCGCCC
TGTTCGCCGTCGTCAGCGGCGGATATAG

Protein sequence :

MISGAPSKDSLLPDNRHAADYQQLRERLIQELNLTPQQLHDESNLIQAGLDSIRLMRWLHWFRKNGYRLTLRELYAAPTL
AAWNQLMLSRSPENAEEETLPDESSWPNMTESTPFPLTPVQHAYLTGRMPGQTLGGVGCHLYQEFEGHCLTASQLEQAIT
TLLQRHPMLHIAFRPDGQQVWLPQPYWNGVTVHDLRHNDAESRQAYLDALRQRLSHRLLRVEIGETFDFQLTLLPDNRHR
LHVNIDLLIMDASSFTLFFDELNALLAGESLSAIDTRYDFRSYLLHQQKINQPLRDDARAYWLAKASTLPPAPVLPLVCE
PATLREVRNTRRRMIVPATRWHAFSNRAGEYGVTPTMALATCFSAVLARWGGLTRLLLNITLFDRQPLHPAVGAMLADFT
NILLLDTACDGDTVSNLARKNQLTFTEDWEHRHWSGVELLRELKRQQRYPHGAPVVFTSNLGRSLYSSRAESPLGEPEWG
ISQTPQVWIDHLAFEHHGEVWLQWDSNDALFPPALVETLFDAYCQLINQLCDDESAWQKPFADMMPASQRAIRERVNATG
APIPEGLLHEGIFRIALQQPQALAVTDMRYQWNYHELTDYARRCAGRLVECGVQPGDNVAITMSKGAGQLVAVLAVLLAG
AVYVPVSLDQPAARREKIYADASVRLVLICQHDASAGSDDIPVLAWQQAIEAEPIVNPVVRAPTQPAYIIYTSGSTGTPK
GVVISHRGALNTCCDINTRYQVGPHDRVLALSALHFDLSVYDIFGVLRAGGALVMVMENQRRDPHAWCELIQRHQVTLWN
SVPALFDMLLTWCEGFADATPENLRAVMLSGDWIGLDLPARYRAFRPQGQFIAMGGATEASIWSNACEIHDVPAHWRSIP
YGFPLTNQRYRVVDERGRDCPDWVSGELWIGGIGVAEGYFNDSLRSEQQFLTLPDERWYRTGDLGCYWPDGTIEFLGRRD
KQVKVGGYRIELGEIESALSQLAGVKQATVLAIGEKEKTLAAYVVPQSEAFCVTDHRNPALPKAWHTLAGTLPCCAISPE
ISAEQVADFLQHRLLKLKPGHTAGADPIPLMNSLAIQPRWQAVVERWLAFLVTQRRLKPAAEGYQVCAGEEREDEHPHFS
GHDLTLSQILRGARNELSLLNDAQWSPESLAFNHPASAPYIQELATICQQLAQRLQRPVRLLEVGTRTGRAAESLLAQLN
AGQIEYVGLEQSQEMLLSARQRLASWPGARLSPWNADTLAAHAHSGDIIWLNNALHRLLPEDPGLLATLQQLAVPGALLY
VMEFRQLTPSALLSTLLLTNGQPEALLHNSADWAALFSAAAFNCQHSDEVAGLQRFLVQCPDRQVRRDPRQLQAALAGRL
PGWMVPQRIVFLDALPLTANGKIDYQALKRRHTPKAENQAEADLPQGDIEKQVAALWQQLLSTGNVTRETDFFQQGGDSL
LATRLTGQLHQAGYEAQLSDLFNHPRLADFAATLRKIDVPVEQPFVHSPEERYQPFALTDVQQAYLVGRQPGFTLGGVGS
HFFVEFEIADLDLTRLETVWNRLIARHDMLRAVVLDGQQQVLEQTPPWVIPTHTLHTPEEALRVREKLAHQVLNPEVWPV
FDLQVGYVDGMPARLWLCLDNLLLDGLSMQILLAELEHGYRYPQQLLPPLPVTFRDYLQQPSLQSPNPDSLAWWQAQLDD
IPPAPALPLRCLPQEVETPRFARLNGALDSTRWHRLKKRAADAHLTPSAVLLSVWSTVLSAWSAQPEFTLNLTLFDRRPL
HPQINQILGDFTSLMLLSWHPGESWLHSAQSLQQRLSQNLNHRDVSAIRVMRQLAQRQNVPAVPMPVVFTSALGFEQDNF
LARRNLLKPVWGISQTPQVWLDHQVYESEGELRFNWDFVAALFPAGQVERQFEQYCALLNRMAEDESSWQLPLAALVPPV
KHAGQCAERPPRVCPEHSQPHIAADESTVSLICDAFREVVGESVTPAENFFEAGATSLNLVQLHVLLQRHEFSTLTLLDL
FTHPSPVALADYLAGVATVEKTKRPRPVRRRQRRI

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
irp2	YP_001006815.1	yersiniabactin biosynthetic protein	Virulence	HPI	Protein	0.0	100
irp2	YP_002346902.1	yersiniabactin biosynthetic protein	Virulence	HPI	Protein	0.0	99
irp2	NP_669706.1	HMWP2 nonribosomal peptide synthetase	Virulence	HPI	Protein	0.0	99
irp2	YP_070124.1	yersiniabactin biosynthetic protein	Virulence	HPI	Protein	0.0	99
irp2	NP_993007.1	yersiniabactin biosynthetic protein	Virulence	HPI	Protein	0.0	99
irp2	CAA21390.1	-	Virulence	HPI	Protein	0.0	99
irp2	YP_853075.1	yersiniabactin biosynthetic protein	Virulence	PAI IV APEC-O1	Protein	0.0	99
PMI2599	YP_002152317.1	non-ribosomal peptide synthase	Not tested	Not named	Protein	0.0	41