我是靠谱客的博主 背后康乃馨,这篇文章主要介绍IDA-自定义字符串编码类型,现在分享给大家,希望可以做个参考。

0x00 前言

最近在使用IDA时,发现有些字符串的标记是text不是db,并且undefine之后,按’A’键转换不成text格式的字符串,甚至根本不是完整的字符串。这个text到底是什么,改如何转换此类字符串呢?

0x01 unicode编码类型

其实很容易想到,字符串有ascii码格式的,必然有unicode编码格式的。我们看下unicode编码格式。

在这里插入图片描述
可以看到UTF-16有一个00字节,如果是一个单词"sun",他的UTF-16编码

复制代码
1
2
3
4
>>> import binary >>> binascii.hexlify('sun'.decode().encode('utf-16')) 'fffe730075006e00'

"sun"的UTF8编码为

复制代码
1
2
3
>>> binascii.hexlify(u'sunon') '73756e6f6e'

0x02 IDA中unicode编码

我们在看下IDA中的unicode字符串

复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
.rodata:0000000000879575 aABEHMSZY db '%a %b %e %H:%M:%S %Z %Y',0 .rodata:000000000087958D db 0 .rodata:000000000087958E db 0 .rodata:000000000087958F db 0 .rodata:0000000000879590 db 53h ; S .rodata:0000000000879591 db 0 .rodata:0000000000879592 db 0 .rodata:0000000000879593 db 0 .rodata:0000000000879594 db 75h ; u .rodata:0000000000879595 db 0 .rodata:0000000000879596 db 0 .rodata:0000000000879597 db 0 .rodata:0000000000879598 db 6Eh ; n .rodata:0000000000879599 db 0 .rodata:000000000087959A db 0 .rodata:000000000087959B db 0 .rodata:000000000087959C db 0 .rodata:000000000087959D db 0 .rodata:000000000087959E db 0 .rodata:000000000087959F db 0

明显sun中间有3个,也就是1个字符占用了4个字节,UTF-16使用2个字节编码,故UTF-32是4个字节。验证下猜想。在IDA界面中找到“Options”菜单,点击“string literals…”选项,或者使用快捷键“ALT+A”打开字符串类型设置。
在这里插入图片描述
点击32bits选项,并确认。字符串此时显示正常。说明转换是对的。
在这里插入图片描述
通过“string literals…”选项可以设置其他字符串编码类型。当然,还能转换成中文字符串。

0x03 新增编码类型

首先要将自定义编码添加到IDA默认的列表中,在“Options”菜单中选中“String literals…” 或者按“ALT+A”快捷键。打开之后在“Currently”选中“no string literal”,会弹出Encodings窗口。
在这里插入图片描述
在Encodings窗口的空白处右键点击“Insert”选项,输入指定的编码名称即可。
在这里插入图片描述
支持的编码有

  • Windows codepages (e.g. 866, CP932, windows-1251)
  • Well-known charset names (e.g. Shift-JIS, UTF-8, Big5)

0x04 参考文献

https://hex-rays.com/blog/igor-tip-of-the-week-13-string-literals-and-custom-encodings/

最后

以上就是背后康乃馨最近收集整理的关于IDA-自定义字符串编码类型的全部内容,更多相关IDA-自定义字符串编码类型内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(93)

评论列表共有 0 条评论

立即
投稿
返回
顶部