写点什么

数仓如何进行表级控制 analyze

  • 2023-03-28
    广东
  • 本文字数:1406 字

    阅读完需:约 5 分钟

数仓如何进行表级控制analyze

本文分享自华为云社区《GaussDB(DWS) 如何表级控制analyze》,作者:leapdb。

一、控制采样大小


【设置全局采样大小】


通过参数 default_statistics_target 设置全局默认采样大小。


a. default_statistics_target>0,表示按固定值方式采样。取值范围:(0, 10000]analyze采样大小 = default_statistics_target * 300;
b. default_statistics_target<0,表示按百分比方式采样。取值范围:[-100, 0)analyze采样大小 = (-1) * default_statistics_target * 表的估算大小。
复制代码


【设置表级采样大小】


pg_attribute->attstattarget 用于设置每列采样大小,所有列的最大值作为表采样大小。


attstattarget取值范围从-101到10000:[-101~-1) 表示使用百分比计算采样大小。采样大小 = 表估算条数 * (-1) * (attstattarget + 1) / 100-1 表示未设置,使用全局参数default_statistics_target计算采样大小。采样大小 = default_statistics_target * 3000 表示该列不进行采样。[1,10000] 表示使用固定值计算采样大小。采样大小 = attstattarget * 300
ALTER TABLE table_name ALTER column_name SET STATISTICS 200; --把采样大小调整为60000ALTER TABLE table_name ALTER column_name SET STATISTICS PERCENT 2; --把采样大小调整为2%
复制代码


一般表级采样大小高于全局采样大小。历史原因,813 及以下版本 default_statistics_target 设置负数时,全局采样大小优先级高。

二、控制 analyze 开关


【全局开关参数】


autovacuum --后台autovacuum线程开关参数autovacuum_mode --后台autovacuum任务参数(vacuum:仅作vacuum;analyze:仅作analyze;mix:默认参数,vacuum和analyze都做)
autoanalyze --动态采样控制参数autoanalyze_mode --动态采样类型控制参数,820及以上支持,813及以下都是normal类型
复制代码


【表级开关参数】


关闭“动态采样”,“轮询采样”和手动 analyze 等所有形式的统计信息收集。(适用于所有版本)


postgres=# select 'ALTER TABLE t1 ALTER '||attname||' SET STATISTICS 0;' from pg_attribute where attnum > 0 and attrelid='t1'::regclass;                    ?column?                     ------------------------------------------------- ALTER TABLE t1 ALTER fooid SET STATISTICS 0; ALTER TABLE t1 ALTER foosubid SET STATISTICS 0; ALTER TABLE t1 ALTER fooname SET STATISTICS 0;(3 rows)
执行以上拼接出来的SQL,修改所有列的采样大小为0即可。再次analyze时则报没有列可做analyze,即实现了analyze关闭。
postgres=# analyze t1;INFO: No columns in "public.t1" can be used to collect statistics.ANALYZE
复制代码


820 及以上版本,支持表级控制“统计信息自动收集模式”。也可以锁定统计信息。


alter table lineitem set (analyze_mode='backend'); --只做轮询采样analyzealter table lineitem set (analyze_mode='runtime'); --只做动态采样analyzealter table lineitem set (analyze_mode='frozen'); --禁止做所有形式的analyzealter table lineitem set (analyze_mode='all'); --恢复表analyze模式的默认行为select pg_options_to_table(reloptions) from pg_class where relname='lineitem'; --查看修改效果
设置成backend即关闭了动态采样,只做轮询采样设置成frozen即关闭了所有形式analyze,但无统计信息时还是会触发一次动态采样,确保至少有基本统计信息可用。
复制代码


点击关注,第一时间了解华为云新鲜技术~

发布于: 刚刚阅读数: 4
用户头像

提供全面深入的云计算技术干货 2020-07-14 加入

生于云,长于云,让开发者成为决定性力量

评论

发布
暂无评论
数仓如何进行表级控制analyze_数据库_华为云开发者联盟_InfoQ写作社区