Gene Information

Name : SSON53_18245 (SSON53_18245)
Accession : YP_005458153.1
Strain : Shigella sonnei 53G
Genome accession: NC_016822
Putative virulence/resistance : Virulence
Product : superfamily I DNA helicase
Function : -
COG functional category : -
COG ID : -
EC number : -
Position : 3422873 - 3426388 bp
Length : 3516 bp
Strand : +
Note : COG1112 Superfamily I DNA and RNA helicases and helicase subunits

DNA sequence :

ATGGATGAAAATGCTTTAGGGTTTACCTCATACTGGCGCAACTCGCTTGCGGATGCTGAGTCAGGAAAGGGCAGTTTTGA
ACGGAAAGACGCCAAAAATTTCACTCACTGGCATGGGATAGCGGCGGGACGTCTTGACGAAGCGATTGTCAGTAAATTTT
TTAAGGGAGAAAAAGACGATGTCGAAACGGTCGATGTCATCTTGCGCCCAAAAGTTTATTTCCGGTTACTGCAGCATGGT
AAGGACCGTTCTGCAGGTGCGCCTGATATTGTTACCCCGATAGTGACGCCAGCCTTGCTAAGCCGTGAGGGTTTTTTATA
TCCGACGCCAGCGACCTCCATTCCCAGAGACCTGCTTGAACCTTTGCCAAAAGGAGCATTTTCGATTGGTGAGATTGGGC
AGTATGACAAATACAAGACGACCCATACCACGTTCTCTATCAACTTTGATGACAGCGTTGATAAGACTGCCGAAACGGAT
GAAGAACGGGAAGCACGATATGCCGCCTTGCAGCAGGAGTGGCGTCAATATCTGTATGACTCAGAGAGGCTACTGAAGAG
CGTTGCCGGCGACTGGATTGAAAAACCTGAGCAATATGAACTCGCTGAGCACGGTTATATTGTTAAAACGGCTCAATCTG
GCGGTGCCAGTTCCCATATCCTTTCTCTTTATGATCACCTGATTGTTTGCAATAAGGATGTGCCGCTCTTCAATCGCTTC
GCCTCGCGAGAGGTTCATGCTGCAGAGTCTTTGCTGGCCCCAGGAGCAAAATTCAGCGACAGGCTTGGACACTCCGGAGA
TAAGTTTCCGCTGGCAAAGGCTCAGCGCGATGCCTTAAGCCATTTTCTGGATGCAAGACATGGCGATATCCTTGCTGTTA
ATGGCCCTCCGGGAACCGGAAAAACCACGCTGGTGCTTTCTATCATCGCCACGCAGTGGGCCAGAGCGGCTCTCGAAAAA
TCTGAGCCTCCGGTTATTATCGCGACTTCAACGAATAACCAGGCTGTAACGAACATTATTGAGGCATTCGGGAAAGACTT
TTCGCAAGGTTCAGGTGCGATGGCCGGGCGATGGTTGCCAGAGCTGAAAAGCTTCGGTGCTTATTTTCCCTCAAGCAGTC
GTAAAGCTGAGGCAGCCAAAAAATATCAAACTGAAGATTTCTTCAACCAGGTTGAGTCAAAAGAGTATGTAGAGGATGCA
CTGCTGTTTTATCTGGAAAAGGCTAAGGCAGCCTTTCCTGGAAAAGAGTGTTCATCCCCTGAAAAGGTCATTGAACTCCT
GCATGGTCAGTTGGCAGCAAAATCTGAGCAACTGATAAGACTGAACGCAACATGGCAAACGTTAAGCCAGATTCGGGCTG
CGCGTGAGCTTATTGCTAATGATATTGAGCAATATCTCGATAATTTAAATAAATTACTTTCCGGACAAGAACAAAAAGTC
ACTCTACTGAAGAGTGCTAAAACGGAATGGAAAAAATATCGCGCCGGTGAATCACTGATCTATTCATTATTTTCCTGGCT
CCCGGCGGTTCGCAATAAGCGACAGTACCAAATACAGCTGTTTCTCGAAGATAAATTAGGCGCGCTGATTGCAGGAAATC
AGTGGTCTGATCCTGAAACTATCGAACGTAATATTGATGGGCTGCTCAATTCCGCTGAGCGCGAGCAAACAACATACCGG
CAGCAGATTGACTCCGCCCATGAAATCGTTCTTAAAGAACAGCAGGCGGTTCAGGAGTGGCAGAGGCTGGCATTTGATTT
AGGGTATGAGGGCGACGAGGAACTGAGCTTCTCACAGGCCGATGAACTGGCTGATACGCAGATTCGCTTCCCTGCATTTT
TACTGACGACTCACTACTGGGAAGGTCGTTGGCTGATGGATATGGCCAGCATTGATGATCTGCAGGACGAGAAGAAGAAA
AAAGGTGCTAAAGGGGTAACCGCCCGTTGGCAACGTCGAATGAAACTCACGCCATGTGTGGTAATGACATGCTATATGCT
GCCCGGTAATATGCAGATAAGTGAGCACAAAGGACAACGTAAATTCGAGAAAAGTTATTTGTATGATTTTGCCGATTTAC
TCATTGTCGATGAAGCCGGGCAGGTGCTTCCTGAAGTGGCTGCTGCCTCGTTTGCATTAGCTAAGAAGGCATTAGTGATT
GGCGATACGGAGCAGATCCCGCCAATATGGAGTATTGCTCCTGCGATTGATGTCGGTAACATGCTGGCGGAAAAAATTCT
GTCTGGCAGTACGCAAGAAGAGATTACCGAGAAATATACGGCAATCGCAGACCTTGGTAAAAGTGCCGCATCTGGCAGCG
TTATGAAAATAGCGCAGTTTGCTTCGCGCTATCAATATGATCCCGAACTGGCTCGTGGTATGTACCTATATGAACACCGC
CGGTGCTACGACAATATTATTGGATACTGTAATACGCTCTGCTATCACGGTAAGTTGTTGCCTAAAAGAGGGCGTGAAGA
GAGCAATTTAATGCCCGCAATGGGGTATCTCCATATTGATGGTAAAGGAGAGCTGGCAAGTAGTGGAAGTCGATATAATT
TGCTTGAGGCTGAAACGATAGCGGTCTGGTTGGCAGAGAACCAGCAAAATATTGAAGCGCATTACGGTAAATCGCTTCAT
GAAGTTGTCGGTATTGTGACGCCTTTTAGCGCTCAGGTATCCACTATCAAACAGGTGCTGGGCAAACAAGGTATCAGTAC
AGGCACGAATGAAAAGTCGCTCACAGTGGGCACCGTGCACTCTCTTCAGGGAGCGGAAAGAGCGATTGTGATATTCTCGC
CAGTCTATTCAAAACATGAAGACGGCGGGTTTATTGATAGCGATAACAGCATGCTGAATGTTGCAGTCTCCCGTGCGAAG
GACAGTTTTCTGGTCTTCGGCGATATGGACCTGTTTGAGGTCCAGCCAGCCTCATCGCCACGGGGATTACTGGCAAAATA
CCTCTTTGAGTCAGAGAAGAATGCGCTCTCTTTTGATTATAAAGAGCGTAAGGATTTAAAAACCGCCGGGACCAAAATCT
ACACACTTCATGGTGTGGAGCAACATGATAATTTCCTGAATCAGACATTTGAAAATACCAGTAAACACATCACGATAATT
TCTCCATGGCTGACCTGGCAAAGGCTGGAGCAAACCGGTTTTCTTGATTCCATGATTGCGGCGTGTTCACGTGGAATTAA
CGTCACGATAGTCACTGACAGAAGCTACAACACTGAACATAATGATTTTGAGAAGCGAAAAGAGAAGCAGCAGAACTTTA
AAGCGGCGCTGGAGAAACTGAATGCGCTGGGTATTGCTACAAAGCTGGTAAACCGTGTTCATAGCAAAATTGTTATTGGT
GATGATGGTTTGCTGTGTGTGGGATCGTTCAACTGGTTTAGTGCGACACGGGAAGCGCGATATGAACGATACGATACATC
AATGGTTTATTGCGGTGATAACCTGAAGGGTGAGATTGAGGCTATTTATAATAGTCTTGAGAGGCGTCAGGTTTAG

Protein sequence :

MDENALGFTSYWRNSLADAESGKGSFERKDAKNFTHWHGIAAGRLDEAIVSKFFKGEKDDVETVDVILRPKVYFRLLQHG
KDRSAGAPDIVTPIVTPALLSREGFLYPTPATSIPRDLLEPLPKGAFSIGEIGQYDKYKTTHTTFSINFDDSVDKTAETD
EEREARYAALQQEWRQYLYDSERLLKSVAGDWIEKPEQYELAEHGYIVKTAQSGGASSHILSLYDHLIVCNKDVPLFNRF
ASREVHAAESLLAPGAKFSDRLGHSGDKFPLAKAQRDALSHFLDARHGDILAVNGPPGTGKTTLVLSIIATQWARAALEK
SEPPVIIATSTNNQAVTNIIEAFGKDFSQGSGAMAGRWLPELKSFGAYFPSSSRKAEAAKKYQTEDFFNQVESKEYVEDA
LLFYLEKAKAAFPGKECSSPEKVIELLHGQLAAKSEQLIRLNATWQTLSQIRAARELIANDIEQYLDNLNKLLSGQEQKV
TLLKSAKTEWKKYRAGESLIYSLFSWLPAVRNKRQYQIQLFLEDKLGALIAGNQWSDPETIERNIDGLLNSAEREQTTYR
QQIDSAHEIVLKEQQAVQEWQRLAFDLGYEGDEELSFSQADELADTQIRFPAFLLTTHYWEGRWLMDMASIDDLQDEKKK
KGAKGVTARWQRRMKLTPCVVMTCYMLPGNMQISEHKGQRKFEKSYLYDFADLLIVDEAGQVLPEVAAASFALAKKALVI
GDTEQIPPIWSIAPAIDVGNMLAEKILSGSTQEEITEKYTAIADLGKSAASGSVMKIAQFASRYQYDPELARGMYLYEHR
RCYDNIIGYCNTLCYHGKLLPKRGREESNLMPAMGYLHIDGKGELASSGSRYNLLEAETIAVWLAENQQNIEAHYGKSLH
EVVGIVTPFSAQVSTIKQVLGKQGISTGTNEKSLTVGTVHSLQGAERAIVIFSPVYSKHEDGGFIDSDNSMLNVAVSRAK
DSFLVFGDMDLFEVQPASSPRGLLAKYLFESEKNALSFDYKERKDLKTAGTKIYTLHGVEQHDNFLNQTFENTSKHITII
SPWLTWQRLEQTGFLDSMIAACSRGINVTIVTDRSYNTEHNDFEKRKEKQQNFKAALEKLNALGIATKLVNRVHSKIVIG
DDGLLCVGSFNWFSATREARYERYDTSMVYCGDNLKGEIEAIYNSLERRQV

• Homologs from PAI DB

Gene	GenBank Accn	Product	Virulance or Resistance	PAI or REI	Alignment Type	E-val	Identity
S3169	NP_838460.1	superfamily I DNA helicase	Not tested	SHI-1	Protein	0.0	99
SF2965	NP_708739.1	superfamily I DNA helicase	Not tested	SHI-1	Protein	0.0	99
unnamed	CAD42018.1	hypothetical protein	Not tested	PAI II 536	Protein	0.0	98
ORF_2	AAZ04413.1	superfamily I DNA helicase	Not tested	PAI I APEC-O1	Protein	0.0	98
APECO1_3532	YP_854230.1	superfamily I DNA helicase	Not tested	PAI I APEC-O1	Protein	0.0	98

• Homologs from VFDB (virulence genes)

Gene	GenBank Accn	Product	ID of source DB	Alignment Type	E-val	Identity
SSON53_18245	YP_005458153.1	superfamily I DNA helicase	VFG0627	Protein	0.0	99
SSON53_18245	YP_005458153.1	superfamily I DNA helicase	VFG1537	Protein	0.0	98