网络安全之 SQL 注入深入分析
0x00 前言
我们知道代码审计 Java 的 SQL 注入主要有两点:参数可控和 SQL 语句可拼接(没有预编译)。并且我们也清楚修复 SQL 注入的方式就是预编译,但是可能我们并不清晰内部预编译的具体实现。本文主要从代码层面深入分析三种 Java 不同数据库框架下的 SQL 注入以及预编译。
0x01 JDBC SQLi
不使用占位符拼接情况分析
不使用占位符时,输入的内容和 sql 拼接形成最终的 sql 语句:
预编译情况:
预编译会在传入的字符串前后添加'
,然后再进行拼接,保证了输入的字符串在 SQL 语句中是数值而不是关键字。
最终在执行的时候select * from user where id='2 and 1=2 union select * from user'
。
到这里我们肯定会想就算在两边加了'
,也可以在 value 中添加'
来闭合绕过:
2' and 1=2 union select * from user where '1'='1
然而事实并非那么简单,JDBC 在ClientPreparedQueryBindings.setString()
中对一些特殊符号包括'
做了转义处理,因此预编译可以防止 SQL 注入:
【一>所有资源获取<一】1、200 份很多已经买不到的绝版电子书 2、30G 安全大厂内部的视频资料 3、100 份 src 文档 4、常见安全面试题 5、ctf 大赛经典题目解析 6、全套工具包 7、应急响应笔记 8、网络安全学习路线
0x02 Mybatis SQLi
Mybatis 解析执行过程
Mybatis 解析执行过程如下图:
以查询 SQL 分析,主要步骤如下:
SqlSession 创建过程:
SqlSessionFactoryBuilder().build(inputStream)
创建一个 SqlSession,创建的时候会进行配置文件解析生成 Configuration 属性实例,解析时会将 mapper 解析成 MapperStatement 加到 Configuration 中,MapperStatement 是执行 SQL 的必要准备,SqlSource 是 MapperStatement 的属性,实例化前会先创建动态和非动态 SqlSource 即 DynamicSqlSource 和 RawSqlSource,DynamicSqlSource 对应解析$
以及动态标签如foreach
,RawSqlSource 创建时解析#
并将#{}
换成占位符?
;执行准备过程:
DefaultSqlSession.selectOne()
执行 sql(如果是从接口getMapper
方式执行,首先会从 MapperProxy 动态代理获取 DefaultSqlSession 执行方法selectxxx|update|delete|insert
),首先从 Configuration 获取 MapperStatement,执行executor.query()
。executor 执行的第一步会先通过MapperStatement.getBoundSql()
获取 SQL,此时如果MapperStatement.SqlSource
是动态即 DynamicSqlSource,会先解析其中的动态标签比如${}
会换成具体传入的参数值进行拼接,获取到 SQL 之后调用executor.doQuery()
,如果存在预编译首先会调用 JDBC 处理预编译的 SQL,最终通过 PreparedStatementHandler 调用 JDBC 执行 SQL;JDBC 执行 SQL 并返回结果集
如下是 mapper 的 select 示例,第一个使用${id}
,第二个使用#{id}
,我们具体通过调试来看下#
和$
这两种符号的解析和执行过程中的处理方式。
解析过程中$
和#
的不同
在解析 StatementNode 过程中创建 SqlSource 时,会调用XMLScriptBuilder.parseScriptNode()
来生成动态和非动态 SqlSource
深入分析XMLScriptBuilder.parseScriptNode()
,先调用XMLScriptBuilder.parseDynamicTags()
解析动态 tag
在解析时会先通过TextSqlNode.isDynamic()
判断是否存在动态标志
TextSqlNode.isDynamic()
首先创建一个 DynamicCheckerTokenParser 用来解析动态标识符,调用 createParser 创建 GenericTokenParser
createParser 会返回一个${}
标识符的标识符解析
$
解析过程:
继续下一步调用GenericTokenParser.parse()
GenericTokenParser.parse 中找到了 openhandler 即${
,会调用builder.append(handler.handleToken(expression.toString()))
handler.handleToken()
将 isDynamic 标志为true
当 isDynamic 为true
,会实例化一个 DynamicSqlSource 对象,至此$
动态 SqlSource 创建完成。
#
解析过程:
当 SQL 是SELECT * FROM user where id=#{id}
的情况下调用 isDynamic() ,进一步调用GenericTokenParser.parse()
GenericTokenParser.parse()
中没有找到 openhandler 即${
,就不会进入后面的处理,直接将原来的 text 进行返回,因此 isDynamic 还是 false
返回后初始化一个 RawSqlSource 实例
在 RawSqlSource 初始化时会自动进行解析:
SqlSourceBuilder$ParameterMappingTokenHandler 主要解析#{}
的情况
将#{id}
替换成?
进行占位,此时 sql 变成了SELECT * FROM user where id=?
小结:在创建 SqlSource 时,会根据$
及动态标签来创建 DynamicSqlSource,DynamicSqlSource 不会对${}
进行具体的处理,而非动态情况会创建 RawSqlSource,在其初始化过程会直接将#{}
替换成?
占位符。
执行过程中$
和#
的不同:
$
在执行过程中的解析:
在调用MappedStatement.getBoundSql()
时,由于$
对应的是 DynamicSqlSource,会调用DynamicSqlSource.getBoundSql()
获取 sql
在DynamicSqlSource.getBoundSql()
会调用rootSqlNode.apply()
处理,此时调用的是TextSqlNode.apply()
在TextSqlNode.apply()
中会创建一个${}
的 GenericTokenParser 然后进行 parse 解析和追加
在解析时,调用handler.handleToken()
根据标识符获取参数的内容
handleToken()
中会将参数值1 and 1=2 union select Host,User,1,authentication_string from mysql.user limit 1
返回
拼接 最终获取的 sql 是SELECT * FROM user where id=1 and 1=2 union select Host,User,1,authentication_string from mysql.user limit 1
#
在执行过程中的解析:
$
是在getBoundSql()
获取 sql 过程中就将符号进行了处理,跟$
不同的是,#
是在执行器的执行过程中(本例是 doQuery)进行处理,先通过调用SimpleExecutor.prepareStatement()
处理预编译情况后,获取 statement,然后调用 JDBC 执行
深入prepareStatement()
,发现其最终通过动态代理调用ClientPreparedStatement.setString()
调用 JDBCClientPreparedStatement.setString()
处理过程跟上述 0x01 部分的 JDBC 预编译处理 statement 一样。
注入场景:
除了上面的 where,like
、in
、order by
查询条件不能直接使用#{}
会报错,因此在开发时可能会直接使用${}
从而产生 SQL 注入漏洞:
1、like:
当 mapper 如下:
调用时传入参数为wang%' and 1=2 union select Host,User,1,authentication_string from mysql.user where User like '%root
时,绕过%'
从而获取数据:
针对该场景可考虑以下形式修复:
2、in:
当 mapper 如下:
调用时传入参数为0) and 1=2 union select Host,User,1,authentication_string from mysql.user where (1)=(1
时,闭合)
从而获取数据:
针对该场景可考虑以下形式修复,传入数组:
3、order by:
当 mapper 如下:
调用时传入参数为IF((select user())='root@localhost',id,name)
时:
针对该场景可考虑以下形式修复:
0x03 Hibernate SQLi
Hibernate 属于全自动 ORM 映射工具,使用 Hibernate 查询关联对象或者关联集合对象时,可以根据对象关系模型直接获取。Hibernate 查询方式如下代码,其中的表名不能是元数据表,必须是实体类名,并且区分大小写,并且 Hibernate 不支持 union 联合查询。因此 Hibernate 的注入存在一定的局限性,不能像常规 SQL 注入一样利用。
上面代码采用拼接方式,当lisi' and user()='root@localhost
,返回数据时证明user()='root@localhost'
,没有返回数据时证明 user 不是 root,可以导致 SQL 注入:
当采用占位符预编译时:
Loader.prepareQueryStatement()
会调用QueryLoader.bindParameterValues
来处理预编译情况
最终QueryLoader.bindParameterValues
同样会调用 JDBC 的ClientPreparedStatement.setString()
完成预编译来防止 SQL 注入
评论