Gene Information

Name : irp1 (PSPPH_2899)
Accession : YP_275081.1
Strain : Pseudomonas syringae 1448A
Genome accession: NC_005773
Putative virulence/resistance : Virulence
Product : yersiniabactin polyketide/non-ribosomal peptide synthetase
Function : -
COG functional category : Q : Secondary metabolites biosynthesis, transport and catabolism
COG ID : COG3321
EC number : -
Position : 3358046 - 3367582 bp
Length : 9537 bp
Strand : +
Note : identified by similarity to GB:AAO56104.1; match to protein family HMM PF00109; match to protein family HMM PF00550; match to protein family HMM PF00668; match to protein family HMM PF00698; match to protein family HMM PF00975; match to protein family HMM

DNA sequence :

ATGCCCACCCTTGAAGAAACCTATGGCACCAGCGAGCCCATCGCGGTCATCGGCCTGGCTTGCCGTTTTCCCGAGGCCCG
CGACAGCGCCCAGTACTGGCAAAACTTGCTGGCCGGTCGCGAGTGCAGCCGCCACTTCAGCCGCGAAGAACTACTGGCCG
CAGGACTGACCGCGGAACTGATCGATAACCCGGATTTCGTCAATATCGCCGCAGTGGTTGACGACCCGGACCGCTTCGAT
GCTGCGCTGTTCGGTTACTCGCGTCAGGAGGCAGAATCCATCGACCCGCAGCAGCGGCTGTTCCTGCAAACCGTCTGGCA
CGCACTGGAACACGCCGGTTTCGCGCCTCGTGAGGTAGCGCATAAAACCGGTGTGTTCGCCTCGGGACGCATGAGCACTT
ATCCGGGCCGGGATAACATTCGCGTCACCGAAGTGGCGCAGGTCAAGGGCCTGCAAGCGCTGATGGGCAACGACAAGGAT
TACCTGGCCAGCCGCGCCGCCTACAAGCTCAACCTGCGCGGCCCGGCCATGAGCGTGCAGACCGCCTGCTCCAGTTCACT
GGTGGCGGTGCATATGGCCTGCGAAAGCCTGCGCAGCGGCGAATGCGAGATGGCCGTGGCAGGCGGCGTAGCTGTGTCGT
TCCCGCAACAGGCTGGTTACCTGCACCAACCGGGGATGATTTTCTCGCCAGACGGCCGCTGTCGCCCGTTTGACGCCGGT
GCTCAGGGCACTTTTGCCGGCAATGGCGTCGGTGCAGTGACCCTGCGGCGCCTGGAAGATGCCTTGCGCGACGGCGACCC
GGTGCTGGCCGTGTTGCGTGGCAGCGCGATCAATAACGACGGTCATCACAAGGTCGGCTATACCGCGCCCTCGATGGTCG
GTCAGCGTGAAGTCATTGAAGACGCCCTGCTGCTGGCCGACATTGATTGCACCAGCATCGGTATGCTCGAAGCGCATGGC
ACGGGCACGCCACTGGGCGACCCGATCGAGGTTCAGGCACTACGCGCCAGCTTCGCGCAACGCACGGATATCGGTGACTG
TGCGCTGGGCTCGGTGAAAGGCAACCTTGGCCATCTGGATACCGCCGCAGGCATCGCCAGCCTGATCAAGACCGTTCTGG
CGGTCAGCCACGGGCGCATTCCGCCGAGCATAAATGTCGAGCGAGTCAACCCGGCGCTGCAACTGGAGCACAGCCCGTTT
TACGTCCCGACCCAAGATCAGCCGTGGCCCGCAGGACCGCGCCGCGCCGGTGTATCGTCATTCGGCATTGGTGGCACCAA
CTGCCACATGATTGTCGAAGCCCTGCCCGACGCATTGCGCACGCCAGGACCGGCAGCGCAGGCGAGTGCCCTGCTGATCA
GCGCGGCCAGCCAGCACTCATTGCGGCAACTGGCGGGCCTTTACGCCGAACGCCTGCACGCTGCAAACATTACAGACACT
GGCGCCGACCTTGCGTACACGGCGCTGCACGCCCGACAACTCGACCTGCCGTTTCGCCTGGCGGTGCCGTTGCACGAAGA
AACCGCCCCGGCGCTGCAAGCGTTCGCCCAAGGCGGCAGCGATGCCTTGCTTTACGAAGGACAGGCAAGCCAGGGCGCGC
AGGTATGGCTATGTAGTGGCCAAGGCAGTCAGTGGGCCGGAATGGGTAAAAGCCTTTACGGTCAGTCGAAAGCCTTCAGC
GAAAGTCTGGACCGCAGCTTTGCAGCCTGCGCCGGCCACCTGCAACCCTCGCTGCAGTCGGTCATGTTCGGCGAGCATGA
AGGGCTGATCGACCGTATGGATTACGCGCAGCCTGCCATCGTTGCCTTCGAAGTGGCCATGGCGGCTCACTGGCGCGAGG
CAGGTCTCACCCCTGACCTGTTGATCGGCCATTCGGTGGGTGAGTTCGCCGCGGTGGTCATCGCCGGGATATATCGGCTG
GAAGACATCCTGCCGCTGGTGATCCTCCGTGGCCGGCTGATGAATCAGTGTGCAGCGCAAGGTGCGATGCTGGCGGTGTT
CTGCGATGCGGCAACGCTGCAACCTTTGGCGTTTGAACATGGCGTGGAAATCGCCGTGTACAACGCCGAACAGCATCTGG
TGGCCTCAGGTGACCGTGACGCAATCAACACACTTGCGCAAGCGCTGCAAGAGCGACAGCTGCGGCACAATCGCCTGAGC
GTGGCCGGTGCAGCGCACTCACGCTTGCTGGAGCCAATTCTCGATGAATTCCAGCAAGCCAGCAAGGCGCTGCGTGCGGC
GCCACCGAAAATACCGCTGATCTCGACCCTGACCGGTCACCCCCTGAGCCAGGCGGAACTTGAACACGATGATTACTGGC
GCAGGCATCTGCGCAAGCCGGTGCGCTATCACCAGGCACTGACTCACGCATTGCAAACGGGCGTGAACATCGCGCTGGAA
CTGGGTGCCGATGCACCACTGACCGGGATCGGCACGCGTCTGGAGCAGACCGGTGTGCACTGGATCGCCAGCGCCCGCCG
CCACAAGCCAGCAGCCGCCGTCTTGCAGGACAGCCTGCTGCGCCTGTTTGCCGCCGGTGCCAGCTTGCCCTGGCGGACCC
TGCTGCCCTCGGTCGGCAAGCGCATCCATGCCCCGCTGTATGTTTTCGACGAGCAGCGCTACTGGTGCGATGCCCCACAG
CAGCCAGTCACACAGACGCAGGATCTGTTGCTCGAGGCCGGTCGCAAGGTCGCGTTGCAGGAAGGCGCCCATCTGGACCT
GCCGCGTCTGCAGCGTCTGTATCAATGTGTGACCCAACTGCATGCGATCTATGTCGACCAGATGGTTCGCCAGTGCGTAC
AAGACAACATCGACCAAGGCGTCGAGCCGCTGAGCATTCTGCGTAGCGGCCGGTTGTTGCCGCGCCATCGGCAACTGCTG
GTGCGCCTGCTCAATGCCTGTGTCGAGGATGGCTATTACACCCTTGAACACGGCCGTTACCGCAGCGCCCGGCCCATCCC
CTACGAGCAACGCCCGGCGTTGCTGGCGCAACTGCGCAGTTGCTGCGAAGGGCTGGACGTGATCGCCGACACCGTCGAGC
GGGCGGGCGAGCAACTCTTCGCCATGATGAATGGCACTGTGGAGCCGGTGTCGGTGATCTTCCCGGAAAGCGCCTCCAGC
GGCGTTGAGATGCTATACCAGCAATTCAGCTTCGGGCGCTATTTCAATCAGATCGCAGCAGGCGTGATCAATGGTCTGAT
CCGCGAACATCAGCACGCCGGACGCGGGCCGCTGCGGATTCTGGAAGTCGGTGGAGGGACCGGTGGCACCACCGCCTGGC
TGCTGCCGGAACTGAGCAACGTCACCGATGTACGTTACTGCTTCACGGATATTTCAGCGCTGTTCAGCCGCCGCGCTGAA
GAAAAGTTCAGCGCGTACGACTTTGTCGAGTACGCGCAGTTCGACCTGCAAAAACCAGCCAGCGAACAAGGCTTTCAAAC
CGGGCACTACGACCTGATCGTCGCCGCCAACGTGATCCATGCCACCCAGCATGTAGGCCAGACCCTGCAAAACCTGCGCC
CGCTGCTCAAGCCGGGCGGCGCTCTTTTGATGCGTGAAATCACCCGTCCGATGCGCCTGTTCGATTTTGTTTTCGGCCCG
TTGGTGTTGCCGCTGCATGACGAGCAGGCGCGTGGTGGTGAACTATTCCTGTCCACCGAACACTGGCAGCGACAATGCCT
GGAAAGCGGGTTTGAACGCCTCGACTGGCTGCCCGACGATGGCAGCGCCACCGCCGGTATCAGCGAACACATCCTGCTGG
CACGCACTCAGGCCGCTAACGCTGCGCCAACCCCGCTCAGTATTGATCACGACAGTGGCAGCGCGGTATTGGGCAGGCAA
CCGGGCGAGCACCTTTACCAACCTGACTGGACAGATTGCGCAGGCCAGCCGCTGCGCTGGCAGAAGCGCTTGCAGCAAGC
ATGCGAGCAACTGGCGGCGCGCCATGGAGATATTCGGCACCCGCCCGTGTTCACCCGCGATGTGCCGTTACCTCAAACCC
TGACCGGTCTGGCCCTGCATTGGAGCGCCGAGCCATTTGGAATAGCCTGCGTCGAGCTAAAACAATGCGATGCTCAAGGA
CAATGGCATCTGCTCGGCAGTGCCGATAGCCGGTCTGAGCGCCGCGCCACATTGCCAGCAGTGAGCACTGCATCCGGCAC
CCATTACGATTGGCAATGGACTGCTGTGAAAGCGCAGGATGCACCCTTGGCGAAGCTGCGCGTCGAACCGGCTAATGTGC
GGGCGGCGCTGGCCGCCGTTGGCGTGGAGCATGACCCGCAGGCTTCGGCGTGCCTGCTGATTGTGCAAGACGGCACGCTG
GCGGATGTCGCCAGCCAGGTGCTTGATGCATTGAAAGCCAACACCGGGCAGCCTCTGCTGGTGGTGACCCGCAACGCCTG
GTCACTGGTTGCCGATAACGCTGTAAGTCCCGAGCATCGAGCACTGTGGGGGTTGCTGCGGGTTGCCTGTGCCGAGCAGC
CACAACGCGCCCTGGCAGTCATTGACCTTGACGGCGGCAAGCAGGGCGCCAGCGTTGACTGGCAAGCCCTGTTAGCGGGC
TTGAGCGCTGCACAAAGCGGTGAACGCTGGATTGCCGTGCGCGAGGGCGTAGCGCAGGTACAGACGCTCAGCGTGCAGCC
TCACCACAGCGCCAGCCTGCCTGCACAACGCTTCAAGGACAGCGGCTGGCATATCGTAACCGGCGCATTCGGCGGTCTGG
GTCGTCTGAGCAGCCATTGGCTGGCCGATCAGGGCGCGTCGCGCATCGCCCTGATGGCACCACGCTGCCCGCCCGAGGGC
GATCAATGGATCGATACCCTGCAACGGCAATATGGTTGTGAAATACGCTGGATGGCCTGCGATATCAGCGATCAGGCGGT
GCTGGCGGCCTGCCTCGACACACTGCGCGCCGATGGCGGCCTGAGTGGTGCGATTCACTGCGCCGGGCTGCTGGACGACA
CTCCGCTGAGCAATCTCGACGCCGCGCGCATGCAACCGTTGCTGCAGGTCAAATGCTCGGCAGCTCACCAGTTGCAAACG
GCGCTCGCTGATCAGGGTCGCTACCTGCTCCTGTATTCCTCGGCCGCCGCCAGTCTCGGCGCAGCGGGTCAAGGGGCTCA
TGCGCTGGCCAGTGCCTATCTGGATGGACTGGCCGAATCGCGAGTCGACACCCGTCTGCACACGGTCAGTATTGCGTGGG
GTGCCTGGGGTGAAACCGGACGCGCCGCCGACGCTCAATTGCATGCCCGATTGGCACAAGGCGGCATGGGCACGCTGGCC
ACCGGCGAAGGCCTGTGGCATCTGGAACAAGCGGTCATGCGCGGTACGCCTTGGTATCTGGCGATGCGCGTAGACACTGA
GCGCATTGACCCGAGCCGTCGCCTGCTGACGCAGCATATCCAGCAACCCGAGACCCGTGCGCCCGTAAAAAGCGCTTCCC
GGACCGGCGCCCTCCCCGCTCCCGCCATGACCGGTGATCAGCAGGTCGATCAGCAGGCGCTCAGCCAGTGGCTGAGTGCT
TCGATCTGCCGCCAGTTGCGCCTGAGCCCTGACGCTGCACCCGCGCAGAATCAGGACCTGATGCAACTGGGCCTCGATTC
GTTACTGTTCCTTGAGCTGAGCAGCGACATCCAGCGCCAATTGGGCATCCGTCTGGATGCCGAGCAAGCCTATCGCGACC
TGAGCATTCGCGGCCTGAGCGCACTGTTATTGTCCAGCGCAGGTAAAACGCCGGTTGCCGCCAGTGACAACCTGATCGTG
CCACAGCCCGATGGCCGCTTCGAGCCTTTCCCGCTGACGCCGATCCAGCACGCCTACTGGCTGGGCCGTACCGACCTGAT
CGATTACGGCGGCGTGGCCTGCCACGTGCTGTTCGAATGGGACAAGGCGTATGCCGATTTTGACCTGACCCGTTTCGAGC
ACGCCTGGAACGCGCTGATCACCCGCCATGACATGCTGCGCATGGTGATCGACAGCGACGGCCGTCAACGCATTCTGCAA
GACACGCCCTGGTATCGCCTGCCACGCAACGACCTGCGCGAACTCTCCCCGGATCAGCAGCAACAACGCTTGCAAGACAT
TCGTGAAGATATGTCCTATCGCGTCTTGCCCACCGATTGCTGGCCGCTGTTCGAAGTGACGGTCAGTGAGCTCGACGCCG
GGCACTGCCGCCTGCACATGAACCTCGACCTGCTGCTGTTCGACGTGCAGAGTTTCAAGGTGATGATGGACGATCTGGCC
ACTGCCTACGCCGGCCAGACACTCAAGCCGCTGGAGCTGACCTTCCGCGACTACGTGATGGCTGACCTGGCGCAGCGCGA
CAGCCTGCAATGGCGACAAGCCTGGCGCTACTGGCAGGACACGCTGGAACAGTTGCCTGGCGCCCCGCAGTTGCCACTGG
CGGACAGCCCGCCCAAGGGCCAGCCACGTTTCCGGACCGTTCAGGGCAAGCTCGGCGCGACGCAATGGGACCGTTTTAAG
GCGCACTGTCAGCGCCTGGCCGTGACACCCTCTGCCGCGCTGCTGGCATTGTTCGCACAGACGCTGGAAAGCGTCAGCCG
TACCCCGGAATTCACCCTCAACCTGACCTACTTCAACCGTCGGCCCCTGCACCCGCAGGTTCAGCAACTGATCGGTGACT
TCACGTCAGTGTTATTGATCGATTTCCAGCTGGGACACGGTGAAAGCCCGGGGCAGGTCATGACCAGCACACAGGCGAGG
CTCTGGCAACGCCTGGCACACACCGCCGTGAACGGCGTGGAATTGATGCGCGAACTCGGTCGCCGTCAGGGACAGACGCG
TCAACCCGCCATGCCGGTGGTGTTCACCAGCATGCTCGGCATGTCGCTGGACGGCAAAGCCATCGATCAGGCTATGACCT
CCACTCTCGGCGATCCGGTTCACGTCTTCACTCAAACCCCGCAAGTCTGGCTGGACCATCAGGTGATGGAAATCGACGGT
GAGCTGGTATTCAGTTGGTATTGCATGGAAGACGTGCTCGCCGACGGCCTGATCGACAGCCTGTTTCAGACCTATTGCGA
CCTGTTACAAACGCTGGCCGACCAACCGCAAGGCTTCGACAGTCGTCCCGGGTTGCCCCGCCACGACTGGACGGTGAATC
TGGACGGCGAGCAATTCGACCCGCAACGGCTTGAAGCGCAACTACGTCGTGCACCGGGCGTGCAGACCGCACGTATCAGG
GTTGATTGCGACAGTCGCACCCTGCTAGGCGAGTTGGTCGCCCAGCCGCCTAATGCCGTCGATGACACCCCCTGCGCAGC
TCAGCCCCTGCCCCTGCCCCTGCCCCTGAGCGATTTGCCGCAACTGAGCGACGCGCAACGTCAGGAAGTCGACCTGACCT
GGCAGGCGCTGGAAAGCCTTGCTCGCGAAGGCATTCTGAACACGCTGCAAAAACACGGGTTGTTCAGCGAAGCCGGGCAG
CGCCATGACCTGGCGCATGTGATGACAAGACTGGGAGCGTTGCCGCAATTTGCGGGCCTGCTGCGCCAGTGGCTGGCGAT
GCTTTGTCAGCAAGGCCACTTACAACAGGACGGCCAGCATTATCTGACCCTGCCCGCTCAGCCTGTTCAAGCCACTGGCG
AAACGCTTCCTGTCGCCGAGTGGAGCCAGACGCTGGGCACGTATCTGGAAGCCTGTATCGAACAGCACGCAGAACTGCTG
CGCGGTGATTGTTCGCCGCTGAGCCTGTTGTTCGGCAATAGCGACGCCGTCGTCAAGGCCCTCTACAGCAACAACCCGGT
GCTGCACTGCTTGAACAGCGCACTGGCACAGACTGCCAAAGCCCTGGCAGGCACGCGGCGCGACCTGCGAGTGCTGGAGG
TCGGTGCCGGCACCGGTGCGACAACCCGACATCTGTTGCCGATGCTTGAAGGCCACCTGAGTGAGTACCGCTTCACGGAT
GTTTCCAGCCTGTTCCTCACTCAGGCTCAAGACAACTTCGTGGCCTGGCCGCAGCTGACCTGCTCGATTCTCGACGTCAA
CCAGCCGGTGGATTTCAGACAGCACCCGGCGCAGGGCTACGACCTGATTGTGGCGGTCAACGTGATGCACGACGCCGCGC
ATGTCACACGTTCACTGAAGCGTCTGCACCGTTTGTTGCGCAGCGGCGGCCATCTATTGCTGCTGGAGGCCACCGAACGT
GACAGCGCGCTGCAACTGGCGAGCATCGGTTTCATCGAAGGGCTGAGCAACTTTGAAGACGAGCGCAGCGAAGACGACAA
AGCCATGCTTGATCTGCCGCGCTGGCGCACTGCCGTGCAGGCGTCGGGCTTCAGTTGGGTCATGAACTGGCCGCAAGAAG
CTGACCACAGCATGCGTCAGCACTTCATGCTCGCTCGGGCCGAAGGTATCAGCCACCTGGACGTGGCTGCAGTGGCTGAA
CAGCTGGAACCACACTCGACGCAATGGCCTCTGGCATTGCGTCAGGTGGAGCAATTGTTTACTGCGCCTGCGGCCAGACA
AACCCCGCAACAGACCAGCGAATCCGCCCCGCTAAAGGAGGTTGATCCGGCATTGCTGGATGCCGTTTCGCAACTCTGGC
GGGAACTGCTCGGGCAAGACATCAACGCCGACAGCGACTTTTTCCTCAGCGGCGGCGACAGCCTGATTGCGACGCGCATG
ATTGCCCGTCTGAACCGTATGGGGCATTCCGGCAGCAGCCTGCGCAACCTGTTCGATAACCCACGGTTGAGTGATTTTTG
CTCCACCCTGCTTGATCAAAACGTGCAGACCGATGACAACCCGCTGGCGCTGGCCAGAGGGCGTAACGAGCTATCGCTGT
TCGTGTTCCATGCCTCGGATGGCGAGGTGAGCGCCTATCTGCCACTGGCAAAGGCGCTGGACATGCAGGTGTTCGGACTG
CAAGCCGCGAATACGTCGGGCACTGATTCGCTGAAAGCGCTGGCCGCCCGGTATCTGCACGCAGTTCGTCGGCAACAGCG
CAACGGGCCCTATGTGCTGCTGGGCTGGTCGTACGGCAGCTTTTTGGCAGAAGAAACGGCGCGCCTGCTACAGCGCCAGG
GTGAGCGGGTTCGCTTGATACTTCTTGATCCGGTGTGCCGCGCGGACTTCCGGTTCGATGATCGTCCGGGGCTGTTGCGC
CTTATGGCTCAGGGTGCGAAACGCATCGCTCTGCCTGACGACCTGGAAGCGTTGCCGCCTGCCGAACAATTGAGCGTGTT
CATGAGCAGTGCCACGCAGGCCGGTGTGCTGAAAACCCCGCCCCGACCACAGCAGGCCGAACAGTGGCTGCAACGCATCG
AACATCTGATGACGCTGCTGACGCGACACTCGCAACCACGACAACTGGACCTGCCCTGCCTGTGGCTGAGCGCCGAAGGC
CGTCCGCAGCATTGGCTGCCCGCCGAGCAGGACTGGCAGGAGTGGACCGCGAGGGCACATCGCGAATCGATGCCCTGCGA
TCACTGGCAACTGCTGCTAGACACGGATCAGGTCCAACGTACTGCCGCGGCGATCAGCGCCTGGCTGGCCGCCACCAACA
AGGAGAGTCATCCATGA

Protein sequence :

MPTLEETYGTSEPIAVIGLACRFPEARDSAQYWQNLLAGRECSRHFSREELLAAGLTAELIDNPDFVNIAAVVDDPDRFD
AALFGYSRQEAESIDPQQRLFLQTVWHALEHAGFAPREVAHKTGVFASGRMSTYPGRDNIRVTEVAQVKGLQALMGNDKD
YLASRAAYKLNLRGPAMSVQTACSSSLVAVHMACESLRSGECEMAVAGGVAVSFPQQAGYLHQPGMIFSPDGRCRPFDAG
AQGTFAGNGVGAVTLRRLEDALRDGDPVLAVLRGSAINNDGHHKVGYTAPSMVGQREVIEDALLLADIDCTSIGMLEAHG
TGTPLGDPIEVQALRASFAQRTDIGDCALGSVKGNLGHLDTAAGIASLIKTVLAVSHGRIPPSINVERVNPALQLEHSPF
YVPTQDQPWPAGPRRAGVSSFGIGGTNCHMIVEALPDALRTPGPAAQASALLISAASQHSLRQLAGLYAERLHAANITDT
GADLAYTALHARQLDLPFRLAVPLHEETAPALQAFAQGGSDALLYEGQASQGAQVWLCSGQGSQWAGMGKSLYGQSKAFS
ESLDRSFAACAGHLQPSLQSVMFGEHEGLIDRMDYAQPAIVAFEVAMAAHWREAGLTPDLLIGHSVGEFAAVVIAGIYRL
EDILPLVILRGRLMNQCAAQGAMLAVFCDAATLQPLAFEHGVEIAVYNAEQHLVASGDRDAINTLAQALQERQLRHNRLS
VAGAAHSRLLEPILDEFQQASKALRAAPPKIPLISTLTGHPLSQAELEHDDYWRRHLRKPVRYHQALTHALQTGVNIALE
LGADAPLTGIGTRLEQTGVHWIASARRHKPAAAVLQDSLLRLFAAGASLPWRTLLPSVGKRIHAPLYVFDEQRYWCDAPQ
QPVTQTQDLLLEAGRKVALQEGAHLDLPRLQRLYQCVTQLHAIYVDQMVRQCVQDNIDQGVEPLSILRSGRLLPRHRQLL
VRLLNACVEDGYYTLEHGRYRSARPIPYEQRPALLAQLRSCCEGLDVIADTVERAGEQLFAMMNGTVEPVSVIFPESASS
GVEMLYQQFSFGRYFNQIAAGVINGLIREHQHAGRGPLRILEVGGGTGGTTAWLLPELSNVTDVRYCFTDISALFSRRAE
EKFSAYDFVEYAQFDLQKPASEQGFQTGHYDLIVAANVIHATQHVGQTLQNLRPLLKPGGALLMREITRPMRLFDFVFGP
LVLPLHDEQARGGELFLSTEHWQRQCLESGFERLDWLPDDGSATAGISEHILLARTQAANAAPTPLSIDHDSGSAVLGRQ
PGEHLYQPDWTDCAGQPLRWQKRLQQACEQLAARHGDIRHPPVFTRDVPLPQTLTGLALHWSAEPFGIACVELKQCDAQG
QWHLLGSADSRSERRATLPAVSTASGTHYDWQWTAVKAQDAPLAKLRVEPANVRAALAAVGVEHDPQASACLLIVQDGTL
ADVASQVLDALKANTGQPLLVVTRNAWSLVADNAVSPEHRALWGLLRVACAEQPQRALAVIDLDGGKQGASVDWQALLAG
LSAAQSGERWIAVREGVAQVQTLSVQPHHSASLPAQRFKDSGWHIVTGAFGGLGRLSSHWLADQGASRIALMAPRCPPEG
DQWIDTLQRQYGCEIRWMACDISDQAVLAACLDTLRADGGLSGAIHCAGLLDDTPLSNLDAARMQPLLQVKCSAAHQLQT
ALADQGRYLLLYSSAAASLGAAGQGAHALASAYLDGLAESRVDTRLHTVSIAWGAWGETGRAADAQLHARLAQGGMGTLA
TGEGLWHLEQAVMRGTPWYLAMRVDTERIDPSRRLLTQHIQQPETRAPVKSASRTGALPAPAMTGDQQVDQQALSQWLSA
SICRQLRLSPDAAPAQNQDLMQLGLDSLLFLELSSDIQRQLGIRLDAEQAYRDLSIRGLSALLLSSAGKTPVAASDNLIV
PQPDGRFEPFPLTPIQHAYWLGRTDLIDYGGVACHVLFEWDKAYADFDLTRFEHAWNALITRHDMLRMVIDSDGRQRILQ
DTPWYRLPRNDLRELSPDQQQQRLQDIREDMSYRVLPTDCWPLFEVTVSELDAGHCRLHMNLDLLLFDVQSFKVMMDDLA
TAYAGQTLKPLELTFRDYVMADLAQRDSLQWRQAWRYWQDTLEQLPGAPQLPLADSPPKGQPRFRTVQGKLGATQWDRFK
AHCQRLAVTPSAALLALFAQTLESVSRTPEFTLNLTYFNRRPLHPQVQQLIGDFTSVLLIDFQLGHGESPGQVMTSTQAR
LWQRLAHTAVNGVELMRELGRRQGQTRQPAMPVVFTSMLGMSLDGKAIDQAMTSTLGDPVHVFTQTPQVWLDHQVMEIDG
ELVFSWYCMEDVLADGLIDSLFQTYCDLLQTLADQPQGFDSRPGLPRHDWTVNLDGEQFDPQRLEAQLRRAPGVQTARIR
VDCDSRTLLGELVAQPPNAVDDTPCAAQPLPLPLPLSDLPQLSDAQRQEVDLTWQALESLAREGILNTLQKHGLFSEAGQ
RHDLAHVMTRLGALPQFAGLLRQWLAMLCQQGHLQQDGQHYLTLPAQPVQATGETLPVAEWSQTLGTYLEACIEQHAELL
RGDCSPLSLLFGNSDAVVKALYSNNPVLHCLNSALAQTAKALAGTRRDLRVLEVGAGTGATTRHLLPMLEGHLSEYRFTD
VSSLFLTQAQDNFVAWPQLTCSILDVNQPVDFRQHPAQGYDLIVAVNVMHDAAHVTRSLKRLHRLLRSGGHLLLLEATER
DSALQLASIGFIEGLSNFEDERSEDDKAMLDLPRWRTAVQASGFSWVMNWPQEADHSMRQHFMLARAEGISHLDVAAVAE
QLEPHSTQWPLALRQVEQLFTAPAARQTPQQTSESAPLKEVDPALLDAVSQLWRELLGQDINADSDFFLSGGDSLIATRM
IARLNRMGHSGSSLRNLFDNPRLSDFCSTLLDQNVQTDDNPLALARGRNELSLFVFHASDGEVSAYLPLAKALDMQVFGL
QAANTSGTDSLKALAARYLHAVRRQQRNGPYVLLGWSYGSFLAEETARLLQRQGERVRLILLDPVCRADFRFDDRPGLLR
LMAQGAKRIALPDDLEALPPAEQLSVFMSSATQAGVLKTPPRPQQAEQWLQRIEHLMTLLTRHSQPRQLDLPCLWLSAEG
RPQHWLPAEQDWQEWTARAHRESMPCDHWQLLLDTDQVQRTAAAISAWLAATNKESHP

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
irp1	NP_993006.1	yersiniabactin biosynthetic protein	Virulence	HPI	Protein	0.0	53
irp1	YP_002346901.1	yersiniabactin biosynthetic protein	Virulence	HPI	Protein	0.0	53
irp1	NP_669707.1	HMWP1 nonribosomal peptide/polyketide synthase	Virulence	HPI	Protein	0.0	53
irp1	YP_070123.1	yersiniabactin biosynthetic protein	Virulence	HPI	Protein	0.0	53
irp1	CAA21391.1	-	Virulence	HPI	Protein	0.0	53
irp1	YP_853076.1	yersiniabactin biosynthetic protein	Virulence	PAI IV APEC-O1	Protein	0.0	53
irp1	YP_001006816.1	yersiniabactin biosynthetic protein	Virulence	HPI	Protein	0.0	52
irp1	CAA73127.1	HMWP1 protein	Virulence	HPI	Protein	0.0	52