openGauss 内核:简单查询的执行
本文分享自华为云社区《openGauss内核分析(二):简单查询的执行》,作者:Gauss 松鼠会。
简单查询的执行
SQL 引擎是数据库系统的入口,执行用户简单查询的入口函数是 exec_simple_query。运行在业务处理线程 Postgres。
通常可以把 SQL 引擎分成 SQL 解析和查询优化两个主要的模块,SQL 引擎对输入的 SQL 语言进行词法分析、语法分析、语义分析,从而生成逻辑执行计划,逻辑执行计划经过代数优化和代价优化之后,产生物理执行计划。
在 SQL 引擎将用户的查询解析优化成可执行的计划之后,数据库进入查询执行阶段。执行器基于执行计划对相关数据进行提取、运算、更新、删除等操作,以达到用户查询想要实现的目的。
exec_simple_query
1.start_xact_command():开始一个事务
2.pg_parse_query():对查询语句进行词法和语法分析,生成一个或者多个初始的语法分析树
3. 进入 foreach (parsetree_item, parsetree_list)循环,对每个语法分析树执行查询
4. pg_**yze_and_rewrite():根据语法分析树生成基于 Query 数据结构的逻辑查询树,并进行重写等操作
5. pg_plan_queries():对逻辑查询树进行优化,生成查询计划
6. CreatePortal():创建 Portal, Portal 是执行 SQL 语句的载体,每一条 SQL 对应唯一的 Portal
7. PortalStart():负责进行 Portal 结构体初始化工作,包括执行算子初始化、内存上下文分配等
8. PortalRun():负责真正的执行和运算,它是执行器的核心
9. PortalDrop():负责最后的清理工作,主要是数据结构、缓存的清理
10. finish_xact_command():完成事务提交
11. EndCommand():通知客户端查询执行完成
gdb 调试
调试需要用到符号信息,configure 使用如下命令
gdb attach 进程号,这里进程号为 17012
info threads 查看所有线程,t 线程号切换线程,bt 可以查看线程调用栈
也可以使用 linux 工具 gstack 打印函数调用栈
以调试 select 语句为例,gdb attach 进程号,在 exec_simple_query 打上断点,执行 select 语句即可开始调试
版权声明: 本文为 InfoQ 作者【华为云开发者联盟】的原创文章。
原文链接:【http://xie.infoq.cn/article/e1c2c1e0a38146df9d8311b53】。文章转载请联系作者。
评论