不能 Hook 的人生不值得 jsHook 和模拟执行
一、目标
李老板: 奋飞呀,上次分析的那个 App http://91fans.com.cn/post/bankdataone/ 光能 Debug 还不够呀, 网页中的 js 也用不了 Frida,我还想 Hook 它的函数 ,咋搞呀? 再有 App 可以 RPC 去执行签名,这个 js 我如何去利用呀?总不能代码都改成 js 去做请求吧?
奋飞:老板呀,你一下提这么多要求,不是明摆着要我们加班吗?这次加班费可得加倍。
二、步骤
最简单易行的 js Hook - console.log
我们的目的是 Hook 这个 encryptSm4ECB 函数,然后打印出它的入参和返回值。
在合适的位置下断点(一般是函数入口和出口)。然后在断点上点右键 -> 修改断点,然后在弹出的窗口里面输入要打印的变量。
TIP: 实际上这个功能是条件断点,可以在符合条件的时候触发断点,但是恰好可以用于打印变量值。修改成功之后断点图标会变颜色。
跑一下,我们想要的入参和结果都打印出来了。
TamperMonkey 注入
TamperMonkey 俗称油猴,你都可以理解他就是浏览器届的 Frida,不过在这个样本里面我没有找到如何 Hook 这个 encryptSm4ECB, 但使用它来 Hook 全局函数是可以成功的。有用油猴 Hook 成功这个 encryptSm4ECB 的兄弟可以给我留言交流下。
Fiddler 插件注入
Fiddler 抓包的同时是可以用插件来注入 js 代码的,这个看上去比较复杂,我也木有搞
Chrome 启用本地替换
要是可以直接在这个 ArticleDetail.js 上去修改,增加打印变量的代码,岂不快哉。
Chrome 其实提供了这个功能,算是文件级别的 Hook,就是执行到 ArticleDetail.js 这个请求的时候,不向服务器发请求了,而是直接使用你本地替换的 js。这样你就想怎么改就怎么改了。
在 源代码页 选择 替换,然后 勾选 启用本地替换,这时候浏览器会提示你给权限,然后选择一个本地的目录来存放要替换的 js。
回到 网络 页,选择你想替换的 js,点右键 -> 保存并覆盖。
再回到 源代码 页,找到这个 js 文件,实际它已经存到我们开始指定的目录下了。
这时候找到指定的函数位置写 hook 代码就可以了。
TIP: xxx.js 这种链接替换没问题,hook 代码也能激活。 ArticleDetail.js?v=ab4f0b37a4a90050d429 这种模式的 js 没有替换成功。原因未知,有成功的兄弟也留言交流下。
模拟执行第一步 先用 Nodejs 跑通
子曾经曰过:逆向是杂学,A-Z 语言都要略懂点。js 本来是跑在服务器端的,Nodejs 一出,谁与争锋。
问下度娘和谷哥,把 VSCode + NodeJs 搭配好,Hello World 跑通,开干。
ArticleDetail.js 这个样本的代码还是很厚道的,基本木有混淆,一览无遗。
跑通代码的八字真言是 循序渐进,分而治之。
一段一段代码,一个一个函数去跑通,你别一上来就把整段代码都复制上去,然后看着一堆报错就放弃治疗。
先执行这个 e 的值, e 调用了 s 这个函数,参数是 t,但是判断了 t 是不是字符串,我们之前 Hook 的时候直接打印的就是 console.log(JSON.stringify(t));
所以这里的代码在 Nodejs 里面可以写成:
这里 n、t、e 的值都可以通过之前的 hook 方案打印出来。比对一下,e 的值是 ok 的,说明 s 函数是可用的。
这个 c 的值就有点复杂了,不过我们 Hook 的时候可以把 n 和 o 的值打印出来,那实际上调试的时候可以把 c 先写死,等价于
TIP: 这里其实埋了一个坑,c 的值和最后的时间戳 timestamp 是有关系的,要对应上。
在继续往下搞
y 这个类貌似就是为了输出错误提示,干脆不要它了。
返回值 r 就是把 n 封装了一下,感觉不够优雅,我们直接返回 n 吧。
这个 l 函数貌似也就是个错误提示,干掉它。
然后把依赖的 vt 、 bt 等等函数都复制进来,貌似就能跑起来了,还有一个报错就是这个返回值。
由于我们直接返回了 n 所以要改改
这里被这个 window.btoa 给坑了,问了一下谷哥,哥说这是浏览器提供的 Base64 转码。NodeJs 也提供一个 Base64 函数,但是转出来不一样……
幸好谷哥还是靠谱的,找了个 js 写的 Base64
比对了一下,一级棒,和 Chrome Hook 出来的结果一致。
那如何利用这个结果呢?可以用 NodeJs 启动一个 web 服务器,然后 rpc 来执行。
下面我们再介绍一个优雅的方法,直接用 python 来执行 js
Js 模拟库介绍
江湖上有很多 Python 写的 JavaScript 执行引擎。
PyV8
据说年老失修,最新的版本是 2010 年的,大佬们不推荐使用。
但是实际上 2013 年它还更新了一般,廉颇老矣,尚能饭否?我觉得就冲 V8 这个名字,就值得试试。
Js2Py
https://github.com/PiotrDabkowski/Js2Py
同样嫌它年纪大了,实际上人家 5 个月前有更新,不能小看大龄程序员的潜力。
PyExecJS
https://pypi.org/project/PyExecJS/
一个最开始诞生于 Ruby 中的库,后来被移植到了 Python 上。
比较活跃,最新的更新是 2018 年,江湖上有很多它的使用例子。很多人建议使用
PyminiRacer
https://github.com/sqreen/PyMiniRacer
作者号称这是一个继任 PyExecJS 的库,比较新,这玩意看缘分,飞哥第一次就搜到了它,所以今天就用它了。
Pyppeteer
https://github.com/pyppeteer/pyppeteer
这个也可以试试,其实很多被人嫌弃年纪大的库,都还在努力更新呢。
Selenium
一个 web 自动化测试框架,可以驱动各种浏览器进行模拟人工操作
用于渲染页面以方便提取数据或过验证码
也可以直接驱动浏览器执行 JS
Selenium 可以驱使浏览器,那么执行个 js 就不在话下了,这个做最后的杀手锏用。
PyminiRacer 模拟执行 encryptSm4ECB
先来个 Hello World
是的,就是这么帅,3 行代码搞定。
依葫芦画瓢,把刚才 NodeJs 跑通的代码复制进去,执行 print(ctx.call("encryptSm4ECB", strFF))
结果就出来了。
三、总结
NodeJs 去执行的之后,不要一开始就把整页代码都拷贝上去,要分而治之,一个一个函数跑通。
JavaScript 保护只有一条路可以走了,那就是混淆。下次找到合适的样本我们再一起分析下。
廉颇老矣,尚一饭斗米,肉十斤,生命不止,coding 不息。
版权声明: 本文为 InfoQ 作者【奋飞安全】的原创文章。
原文链接:【http://xie.infoq.cn/article/22fa5de40b674ec8daa7a195e】。文章转载请联系作者。
评论