写点什么

KunlunBase 读写分离方案

作者:KunlunBase
  • 2022 年 7 月 12 日
  • 本文字数:2155 字

    阅读完需:约 7 分钟

KunlunBase 数据库集群在数据库内部支持读写分离,并且对应用透明,用户应用程序不需要做任何修改就可以使用数据库的读写分离功能,从而提高整个系统性能及投资回报率。

一、产品架构

KunlunBase 的整体架构主要由计算层和存储层构成,计算层负责 SQL 响应、解释、执行等,存储层负责数据的存储管理,存储层的数据采用多副本存储机制,备机(从副本)通过强同步技术保持数据与主节点一致性。


备机的存储节点的硬件配置与主节点一致,在一般的生产使用过程中,备机节点的主要目的是作为主机出现故障后的替换节点,不接受应用程序的直接数据处理请求,因此,在非故障切换的情况下,备机的存储节点资源利用率相对较低。


KunlunBase 的读写分离方案是通过路由只读操作到备节点,从而可以减少计算节点的资源竞争,降低主节点负载。


二、实现原理

KunlunBase 的读写分离在计算层的远程查询优化器内实现的,当用户的 SQL 同时满足如下条件:


  1. 当前 SQL 类型为 select;

  2. SQL 中不包含用户自定义函数(即 create function 语句创建的函数),除非当前事务为只读事务;

  3. 如果不在事务中(autocommit=on),则允许读写分离;如果语句在显示事务中,则要满足:


  • 如果在只读事务中,则允许读写分离;

  • 如果在读写事务中,则该事务尚未更新过任何数据;


远程查询优化器就会将相应的 SQL 执行计划下发到从备机的节点上执行


KunlunServer 会根据以下规则选择发送 select 语句到目标存储集群的哪个备机节点:


  • 根据节点权重值选择 (ro_weight)

  • 根据网络延迟(ping)

  • 根据主从副本的数据一致性延迟(latency)

三、配置实施

场景说明:某 OLTP 业务系统有大量的查询操作,在业务高峰期数据库响应速度变慢,导致了业务的性能问题。经检查发现存储节点主节点的存储节点的 IO 资源利用到达瓶颈,但备机节点的 IO 资源利用率低。


以上场景可以通过读写分离方案解决系统性能问题,不需要修改应用, 不需要增加硬件配置,通过读写分离的实施,可以解决性能问题。

实施步骤:

第一步:设置参数,启用读写分离。(根据情况选一种级别)


设置 enable_replica_read = on (on 开启读写, off 关闭)。


用户级别开启:(用户登录后生效)


alter user abc setenable_replica_read = true;
复制代码


Session 级别开启:(当前 session 生效)


set enable_replica_read=on;
复制代码


数据库级别开启:(对该计算节点的所有 session 有效)


在 pg_hba.conf 文件中设置


enable_replica_read=on;
复制代码


第二步:登录数据库,配置读写分离策略。


设置如下参数,启动读写分离策略:


  • replica_read_ping_threshold,计算节点到备节点的 ping 延迟阈值,0 表示不关心;

  • replica_read_latency_threshold,主备同步延迟的阈值,0 表示不关系;

  • replica_read_order,选择备机优先级:0,按权重;1、按 ping 延迟;2、按主备同步延迟;

  • replica_read_fallback,备机选择的回退策略(如果备机不能访问);

  • replica_read_fallback=0,直接报错,replica_read_fallback=1,任意选择一个备机进行访问,replica_read_fallback=2,选择主机进行访问。



第三步:检查 &设置权重(可选)。


在演示的环境中 ,数据集群由两个 shard 组成(shard1 , shard2) ,shard1 的 shard_id=1, shard1 包含 3 个副本(id 为 1,2, 3,id 为 1 的是主节点,id 为 2 和 3 的是备机。


通过配置, 可以设置只读操作的首先备机


设置 Shard1 的 node3 主机的作为首先备机(因为 node2 节点位于不同机房,延迟太高):


update pg_shard_node set ro_weight=2 whereport=6006;Select * from pg_shard_node ;
复制代码



Shard1 的 node3 的权重最高(ro_weight=2)


第四步:执行查询,验证读写分离(可选)。



通过设置log_min_messages to ‘debug1’ 可以将 SQL 语句的执行信息输出到日志中, 以方便检查 SQL 下发的目标存储节点(生产系统不要设置,否则影响性能)。


查看计算节点的日志,确认读写分离。



SQL 只读语句(select ti.id from t1) 被下发到 shard1,节点 3 上(该副本权重最高), 而 update 语句(update t1 set id=3) 是在主节点 shard1 节点 1 上执行。

结论

以上过程验证了该用户的读写操作分离实现。只读语句将被路由到从备机节点,降低了主节点的 IO 资源利用率,系统整体性能获得提升。

END

昆仑数据库是一个 HTAP NewSQL 分布式数据库管理系统,可以满足用户对海量关系数据的存储管理和利用的全方位需求。应用开发者和 DBA 的使用昆仑数据库的体验与单机 MySQL 和单机 PostgreSQL 几乎完全相同,因为首先昆仑数据库支持 PostgreSQL 和 MySQL 双协议,支持标准 SQL:2011 的 DML 语法和功能以及 PostgreSQL 和 MySQL 对标准 SQL 的扩展。同时,昆仑数据库集群支持水平弹性扩容,数据自动拆分,分布式事务处理和分布式查询处理,健壮的容错容灾能力,完善直观的监测分析告警能力,集群数据备份和恢复等 常用的 DBA 数据管理和操作。所有这些功能无需任何应用系统侧的编码工作,也无需 DBA 人工介入,不停服不影响业务正常运行。昆仑数据库具备全面的 OLAP 数据分析能力,通过了 TPC-H 和 TPC-DS 标准测试集,可以实时分析最新的业务数据,帮助用户发掘出数据的价值。昆仑数据库支持公有云和私有云环境的部署,可以与 docker,k8s 等云基础设施无缝协作,可以轻松搭建云数据库服务。请访问 http://www.zettadb.com/ 获取更多信息并且下载昆仑数据库软件、文档和资料。

KunlunBase 项目已开源

【GitHub:】https://github.com/zettadb

【Gitee:】https://gitee.com/zettadb

发布于: 刚刚阅读数: 5
用户头像

KunlunBase

关注

还未添加个人签名 2022.03.09 加入

还未添加个人简介

评论

发布
暂无评论
KunlunBase 读写分离方案_KunlunBase_InfoQ写作社区