写点什么

openGauss 内核分析(四):查询重写(二)

作者:daydayup
  • 2023-07-31
    北京
  • 本文字数:1624 字

    阅读完需:约 5 分钟

openGauss 内核分析(四):查询重写(二)

酷哥 [openGauss](javascript:void(0);) 2022-12-13 18:01 发表于四川


外连接消除 Outer2Inner


下面首先以一个例子来说明各种多表连接方式的区别:


create table t1(c1 int, c2 int);create table t2(c1 int, c2 int);insert into t1 values(1, 10);insert into t1 values(2, 20);insert into t1 values(3, 30);insert into t2 values(1, 100);insert into t2 values(3, 300);insert into t2 values(5, 500);
复制代码



内连接 inner join:返回两个表都满足的组合,相当于取两个表的交集。


SELECT * FROM t1 inner JOIN t2 ON t1.c1 = t2.c1;
复制代码


左连接 left outer join:返回左表中的所有行,如果左表中行在右表中没有匹配行,则结果中右表中的列返回空值。


SELECT * FROM t1 Left OUTER JOIN t2 ON t1.c1 = t2.c1;
复制代码


右连接 right outer join:返回右表中的所有行,如果右表中行在左表中没有匹配行,则结果中左表中的列返回空值。


SELECT * FROM t1 right OUTER JOIN t2 ON t1.c1 = t2.c1;
复制代码


全连接 full join:返回左表和右表中的所有行。当某行在另一表中没有匹配行,则另一表中的列返回空值,相当于取两个表并集。


SELECT * FROM t1 full JOIN t2 ON t1.c1 = t2.c1;
复制代码



在以上实验的基础上增加 t2 表的 where 条件。



left join 和 inner join 的结果是一样的,这是因为查询条件中包含 WHERE t2.c2 >100 这个条件,t2 表所有不匹配元组均被过滤掉(包括空值),因此可以进行查询转换 left-outer join -> inner join,能够有效减小 t1 和 t2 关联产生的结果集,达到性能提升的目的。


在 openGauss 数据库系统中,subquery_planner 会遍历查询树中的 rtable,看看是否有 RTE_JOIN 类型的节点存在,设置 hasOuterJoins 标志量,从而进入到 reduce_outer_joins 接口,满足外连接消除条件时再执行外连接的消除。reduce_outer_Joins 函数内部做两个动作:


(1)reduce_outer_joins_pass1 预检查,就是检查 jointree 中是否含有外链接,以及一些引用表的信息,为动作 2 做好信息采集准备,重点参考数据结构 reduce_outer_joins_state;


(2)reduce_outer_joins_pass2 真正完成消除外链接。




void reduce_outer_joins(PlannerInfo* root){reduce_outer_joins_state* state = NULL;state = reduce_outer_joins_pass1((Node*)root->parse->jointree);/* planner.c shouldn't have called me if no outer joins */if (state == NULL || !state->contains_outer)ereport(ERROR,(errmodule(MOD_OPT),errcode(ERRCODE_OPTIMIZER_INCONSISTENT_STATE),(errmsg("so where are the outer joins?"))));    reduce_outer_joins_pass2((Node*)root->parse->jointree, state, root, NULL, NIL, NIL);}
复制代码


利用上一期的分析方法,可以得到查询树内存结构(查询树 Query 结构体中 targetList 存储目标属性语义分析结果,rtable 存储 FROM 子句生成的范围表,jointree 的 quals 字段存储 WHERE 子句语义分析的表达式树)



对比 reduce_outer_joins 运行前后查询树,jointree 和 rtable 中的 jointype 都由 join_left 转换为 join_inner,即外连接已转为内连接。


(gdb) p *((JoinExpr*)(parse->jointree->fromlist->head.data->ptr_value))$1 = {type = T_JoinExpr, jointype = JOIN_INNER, isNatural = false, larg = 0x7fdfb345cd08, rarg = 0x7fdfb345e2e8, usingClause = 0x0, quals = 0x7fdfb2f0b8a8, alias = 0x0, rtindex = 3}(gdb) p *(RangeTblEntry*)(parse->rtable->tail.data->ptr_value)$2 = {type = T_RangeTblEntry, rtekind = RTE_JOIN, relname = 0x0, partAttrNum = 0x0, relid = 0, partitionOid = 0, isContainPartition = false, subpartitionOid = 0, isContainSubPartition = false,refSynOid = 0, partid_list = 0x0, relkind = 0 '\000', isResultRel = false, tablesample = 0x0, timecapsule = 0x0, ispartrel = false, ignoreResetRelid = false, subquery = 0x0, security_barrier = false,jointype = JOIN_INNER, …}
复制代码


用户头像

daydayup

关注

还未添加个人签名 2023-07-18 加入

还未添加个人简介

评论

发布
暂无评论
openGauss内核分析(四):查询重写(二)_daydayup_InfoQ写作社区