openGauss 内核分析:SQL by pass & 经典执行器
本文分享自华为云社区《openGauss内核分析(七):SQL by pass & 经典执行器》,作者:Gauss 松鼠会 。
执行引擎一般负责查询的执行,执行引擎在 SQL 执行栈中起到接收优化器生成的执行计划 Plan、并对通过存储引擎提供的数据读写接口,实现对数据进行计算得到查询的结果集。
在典型的 OLTP 场景中,简单查询占了很大一部分比例。这种查询的特征是只涉及单表和简单表达式的查询,因此为了加速这类查询,openGauss 提出了 SQL by pass 框架,在 parse 层对这类查询做简单的模式判别后,进入到特殊的执行路径里,跳过经典的执行器执行框架,包括算子的初始化与执行、表达式与投影等经典框架,直接重写一套简洁的执行路径,并且直接调用存储接口,这样可以大大加速简单查询的执行速度。
SQL by pass
enable_opfusion 用于控制是否对简单增删改查进行优化,简单 insert 语句在开启 enable_opfusion 时的执行计划如下
由于开启 SQL BY PASS,从 exec_simple_query 过来的语句,会判断可以走 SQL BY PASS,否则进入 CreatePortal 走经典执行流程。
进入 InsertFusion::execute 完成数据插入操作。
SQL by pass 适应的场景有:
只支持 indexscan 和 indexonlyscan,且全部 WHERE 语句的过滤条件都在索引上。
只支持单表增删改查,不支持 join、using。
只支持行存表,不支持分区表,表不支持有触发器。
不支持 active sql、QPS 等信息统计特性。
不支持正在扩容和缩容的表。
不支持查询或者修改系统列。
只支持简单 SELECT 语句,例如
仅可以查询目标表的列,c1 和 c2 列为索引列,后边可以是常量或者参数,可以使用 for update。
只支持简单 INSERT 语句,例如:
仅支持一个 VALUES,VALUES 里面的类型可以是常量和参数,不支持 returning。
只支持简单 DELETE 语句,例如:
c1 和 c2 列为索引列,后边可以是常量或者参数。
只支持简单 UPDATE 语句,例如:
c3 列修改的值可以是常量和参数,也可以是一个简单的表达式,c1 和 c2 列为索引列,后边可以是常量或者参数。
经典的执行器
关闭 enable_opfusion,简单 insert 的执行计划是这样的
在这种执行流程中 Portal 是执行 SQL 语句的载体,每一条 SQL 对应唯一的 Portal,不同的查询类型对应的 Portal 类型也有区别。
Portal 的生命周期管理在 exec_simple_query 函数中实现,该函数负责 Portal 创建、执行和清理。Portal 执行的主要执行流程包括 PortalStart 函数、PortalRun 函数、PortalDrop 函数几个部分。其中 PortalStart 函数负责进行 Portal 结构体初始化工作,包括执行算子初始化、内存上下文分配等;PortalRun 函数负责真正的执行和运算,它是执行器的核心;PortalDrop 函数负责最后的清理工作,主要是数据结构、缓存的清理。
PortalRun 函数根据查询类型进入不同的处理函数
最终执行 ExecInsertT 完成数据插入。
以上分析了简单 insert 语句的两种执行流程,对于 delete,update,select 基本工作流程一致。
版权声明: 本文为 InfoQ 作者【华为云开发者联盟】的原创文章。
原文链接:【http://xie.infoq.cn/article/85e95ad511fbb0de93ddb9da5】。文章转载请联系作者。
评论