Gene Information

Name : STMUK_4475 (STMUK_4475)
Accession : YP_005254914.1
Strain : Salmonella enterica UK-1
Genome accession: NC_016863
Putative virulence/resistance : Virulence
Product : putative DNA helicase
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 4692401 - 4695916 bp
Length : 3516 bp
Strand : +
Note : similar to Escherichia coli putative frameshift suppressor (AAC77264.1); superfamily I

DNA sequence :

ATGGATGACAATGCTTTAGGGTTTGCCTCATACTGGCGCAATTCGCTGGCAGATGCTGAGTCAGGAAAGGGCAGTTTTGA
ACGCAAAGACGCCAAAAATTTCACCCACTGGCATGGGATAGCGGCGGGACGTCTTGACGAAACGATCGTTGGTAAATTTT
TTGAGGGAGAAAAAGACGACGTCGAAACAGTCGATGTCATCTTGCGGCCAAAGGTTTATTTCCGGTTACTGCAGCGTGGA
AAGGACCATTCCGCTGGTGCGCCTGATATTGTTACCCCGATAGTGACGCCAGCCCTATTGAGCCGTGAAGGTTTTTTATA
TCCGACGCCAGCGACCTCCATTCCCAGAGACCTGCTTGAACCTTTGCCAAAAGGGGCATTTTCAATTGGTGAGATTGAGC
AGTACGACAAATACAAAACGACACATACGTCATTCTCTATCAACTTTGATGACCGCGTTGATAAGACCGCCGAAACAGAT
GAAGAACGAGAAGCACGATATGCAGCCTGGCAGCAGGATTGGCGTCAATATCTGGATGATTCAGAAAGGCTGCTGAAGAA
CGTTGTCGGCGACTGGATTAAAAATCCTGAGCAATATGAACTCGCTGAGCACGGTTATATTGTTAAAACGGCGCAATCTG
GCGGCGCCAGTTTCCATATCCTTTCACTTTATGATCACCTGCTTGTTTGCAAAAAGGATGTGCCGCTCTTCAATCGTTTC
GCCTCGCGAGAGGTTCATGCTGCAGAGTCATTACTTCCTCCGGAAGCAAAATTCAGCGACAGGATTGGACACTCCGGGGA
TAAGTTTCCGCTGGCAAAGGCTCAGCGCGATGCCTTAAGCCATTTTCTGGATGCGAGGCATGGCGATATCCTTGCCGTTA
ATGGTCCCCCGGGAACCGGAAAAACCACGCTGGTGCTTTCTATCATCGCCACGCAGTGGGCCCGAGCGGCTCTCGAAAAA
GCGGAACCTCCGGTTATTATCGCGACTTCAACGAATAACCAAGCTGTAACGAACATTATCGAGGCGTTCGGGAAAGATTT
TTCCCAAGGCACTGGTGCAATGGCCGGACGATGGTTGCCGGAGCTGAAAAGCTTCGGCGCTTATTTTCCCTCAAGCACTC
GTAAAGCCGAGGCCGCCAAAAAATATCAAACTGAAGATTTCTTCAACCAGGTTGAGTCAAAAGAGTATGTAGAGGATGCA
CTGCTGTTTTATCTGGAGAAAGCTAAGGCAGCCTTTCCTGAAAAAGAGTGTTCATCCCCTGAAAAGGTTATTGAACTCCT
GCATGGTCAGTTGGCAGCAAAATCCGAGCAACTGGTAAGACTGAACGCAACATGGCAAACGTTAAGCCAGGTTCGGGCAA
CGCGAGAGCTTATTGATAACGACATTGAGCAATATCTCGATAATTTAAATAAATTACTCTCCGGGCAAGAACAAAAAGTT
ACTCAACTAAAAAGTGCTAAAGCGGAATGGAAAAAATATCGGGCCAGTGAATCACTGATCTATCCATTATTTTCATGGCT
ACCAGTGGTTCGCAGTAAGCGGCAGTACCAAATACAACTGTTTCTCGAAGATAAATTAGGTGCGCTGATTGCGGGAAATC
AATGGTCGGATCCTGAAACCATCGAACGTAATATCGATAGGTTGCTTAATTCCGCCGAGCGCGAGCAAACAACCTACCGG
CAGCAGATTGACTCCGCGCATGAAATCGTTCTTAAAGAACAGCAGGCGGCTCAGGAATGGCAGAGGCTGGCACTTGATTT
AGGGCATGAGGGCGACGAGGAACTGAGCTTCTCACAGGCAGATGAGCTGGCTGATACGCAGATTCGCTTCCCTGCATTCT
TACTGACGACCCACTACTGGGAAGGTCGTTGGTTGATGGATATGGCCGGCATTGATGATCTGCAGAAAGAAAAGGGCAAG
AAAGGTGCTAAAGGGGTAACAGCTCGCTGGCAACGCCGAATGAAACTTACCCCATGCGTGGTCATGACCTGCTATATGCT
GCCCGGCAATATGCAGATAAGTGAACATAAAGGGCAGCGTAAATTCGAGAAAAGCTATTTATATGACTTCGCCGATTTAC
TCATTGTCGATGAAGCTGGGCAGGTGCTTCCTGAAGTGGCTGCTGCCTCGTTTGCCTTAGCTAAAAAGGCATTAGTGATT
GGTGATACGGAACAGATCCCGCCAATATGGAGTATTACTCCTGCTATTGATATAGGTAACATGCTGGCGGAAAAAATTCT
GTCAGGCAGTACGCAAGAGGAGATTACTGAGAAATATACGGCAATCGCAGAGCTTGGTAAAAGCGCCGCATCTGGCAGCG
TCATGAAAATAGCGCAGTGTGCCTCACGCTATCAATATGATCCCGAACTGGCTCGTGGAATGTACTTATATGAACACCGC
CGGTGCTTCGATAATATTATTGGATACTGCAATACGCTCTGCTATCACGGTAAGTTGTTGCCTAAAAGAGGGTGTGAAGA
GAGCAATTTAATGCCAGCAATGGGTTATCTCCATATTGATGGTAAAGGAGAGCTGGCAAGTAGCGGAAGTCGATATAATT
TGCTGGAGGCTGAAACGATAGCGGCCTGGCTGACAGATAACCAGCAAAGTATTGAAGCGCATTATGGTAAATCGCTTCAT
GAAGTTGTCGGTATCGTGACGCCTTTTAGTGCGCAGGTACCGACCATCAAACAGGCGCTGGATAAACAAGGCATCAGCGC
AGGCACCAATGAAACGTCGCTCACGGTGGGCACAGTCCATTCTCTTCAGGGCGCTGAAAGAGCGATTGTTATATTCTCGC
CAGTCTATTCAAAGCATGAAGACGGCGCGTTTATTGATAGCGATAACAGCATGCTGAATGTTGCTGTCTCCCGAGCTAAG
GACAGTTTCCTGGTCTTCGGCGATATGGACCTGTTTGAGATTCAGCCAGCCTCATCTCCGCGGGGATTACTGGCAAAATA
TCTCTTTGAGTCAGAGAAGAATGCGCTCACTTTTGATTATAAAGAGCGTAAGGATTTAAAAACTGCCGAGACCAAAATCT
ACACACTCCATGGTGTGGAGCAGCATGATAATTTCCTGAATCAGACGTTTGAAAATACCGATAAACACATCACGATAGTT
TCTCCATGGCTAACCTGGCAAAAACTGGAGCAAACCGGTTTTCTTGATTCCATGATTACGGCGTGTTCACGTGGTATTAA
CGTCACGGTAGTCACTGACAGAAGCTACAACACTGAACATAATGATTTTGAGAAGCGAAAAGAGAAGCAGCAGAACCTTA
AAGCGGCGCTGGAGAAACTGAACGCCCTTGGTATTGCGACAAAACTGGTCAATCGTGTTCATAGCAAAATTGTTATTGGT
GATGATGGTTTGCTGTGCGTGGGATCGTTCAACTGGTTTAGCGCGACACGTGAAGCGCGATATGAACGATACGATACATC
GATGGTTTATTGCGGTGATAACCTGAAGGGTGAGATTGAGGCTATTTATAATAGTCTTGATAGGCGTCAGGTTTAG

Protein sequence :

MDDNALGFASYWRNSLADAESGKGSFERKDAKNFTHWHGIAAGRLDETIVGKFFEGEKDDVETVDVILRPKVYFRLLQRG
KDHSAGAPDIVTPIVTPALLSREGFLYPTPATSIPRDLLEPLPKGAFSIGEIEQYDKYKTTHTSFSINFDDRVDKTAETD
EEREARYAAWQQDWRQYLDDSERLLKNVVGDWIKNPEQYELAEHGYIVKTAQSGGASFHILSLYDHLLVCKKDVPLFNRF
ASREVHAAESLLPPEAKFSDRIGHSGDKFPLAKAQRDALSHFLDARHGDILAVNGPPGTGKTTLVLSIIATQWARAALEK
AEPPVIIATSTNNQAVTNIIEAFGKDFSQGTGAMAGRWLPELKSFGAYFPSSTRKAEAAKKYQTEDFFNQVESKEYVEDA
LLFYLEKAKAAFPEKECSSPEKVIELLHGQLAAKSEQLVRLNATWQTLSQVRATRELIDNDIEQYLDNLNKLLSGQEQKV
TQLKSAKAEWKKYRASESLIYPLFSWLPVVRSKRQYQIQLFLEDKLGALIAGNQWSDPETIERNIDRLLNSAEREQTTYR
QQIDSAHEIVLKEQQAAQEWQRLALDLGHEGDEELSFSQADELADTQIRFPAFLLTTHYWEGRWLMDMAGIDDLQKEKGK
KGAKGVTARWQRRMKLTPCVVMTCYMLPGNMQISEHKGQRKFEKSYLYDFADLLIVDEAGQVLPEVAAASFALAKKALVI
GDTEQIPPIWSITPAIDIGNMLAEKILSGSTQEEITEKYTAIAELGKSAASGSVMKIAQCASRYQYDPELARGMYLYEHR
RCFDNIIGYCNTLCYHGKLLPKRGCEESNLMPAMGYLHIDGKGELASSGSRYNLLEAETIAAWLTDNQQSIEAHYGKSLH
EVVGIVTPFSAQVPTIKQALDKQGISAGTNETSLTVGTVHSLQGAERAIVIFSPVYSKHEDGAFIDSDNSMLNVAVSRAK
DSFLVFGDMDLFEIQPASSPRGLLAKYLFESEKNALTFDYKERKDLKTAETKIYTLHGVEQHDNFLNQTFENTDKHITIV
SPWLTWQKLEQTGFLDSMITACSRGINVTVVTDRSYNTEHNDFEKRKEKQQNLKAALEKLNALGIATKLVNRVHSKIVIG
DDGLLCVGSFNWFSATREARYERYDTSMVYCGDNLKGEIEAIYNSLDRRQV

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
ORF_2	AAZ04413.1	superfamily I DNA helicase	Not tested	PAI I APEC-O1	Protein	0.0	96
APECO1_3532	YP_854230.1	superfamily I DNA helicase	Not tested	PAI I APEC-O1	Protein	0.0	96
SF2965	NP_708739.1	superfamily I DNA helicase	Not tested	SHI-1	Protein	0.0	95
unnamed	CAD42018.1	hypothetical protein	Not tested	PAI II 536	Protein	0.0	95
S3169	NP_838460.1	superfamily I DNA helicase	Not tested	SHI-1	Protein	0.0	95

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
STMUK_4475	YP_005254914.1	putative DNA helicase	VFG0627	Protein	0.0	95
STMUK_4475	YP_005254914.1	putative DNA helicase	VFG1537	Protein	0.0	95