写点什么

openGauss 助力邮储银行分布式新核心迈向智能运维时代

作者:openGauss
  • 2022 年 1 月 13 日
  • 本文字数:2672 字

    阅读完需:约 9 分钟

openGauss 助力邮储银行分布式新核心迈向智能运维时代

近日,邮储银行新一代分布式核心运维平台成功投产上线,这是继邮储银行新一代分布式核心系统技术平台上线之后,取得的又一项重要阶段性成果。作为邮储银行全行一体化运维体系的重要组成部分,运维平台将为新一代分布式核心系统提供全方位监测与管控手段,也必将为新一代分布式核心系统全面投产保驾护航。


邮储银行新核心系统大管家上岗


新一代分布式核心系统肩负着邮储银行向全数字化银行,智慧化银行转型的重任,是未来业务敏捷创新和持续健康发展的基石。


但就如一枚硬币的两面,新系统的复杂架构,海量种类的设备,灵活多变的业务为系统监控与运维带来前所未有的挑战:一个业务需要成百个设备协同配合才能完成,其中每个设备节点都要监控,所产生的数据量暴增,如何归集、分析有效的监控数据?多中心、多节点、多层级、微服务和容器云带来的复杂架构,如何维护保证整个系统健康运转?整个系统 500 多个数据库,5000 多个实例分布在几千台服务器,如何确保这些数据管理的高效有序,不出错?这一切为业务部署,运维监控和系统配置都带来几十倍的复杂度,如果依赖传统的运维方式,必将难以为继。


邮储银行新一代分布式核心系统运维平台,正是应对以上的挑战而生。通过全景可视、灵活管控、量化洞察、智能驱动的创新思维,采用敏捷的互联网架构和金融级核心技术规范,分別在运行监控的微服务内核中实现应用监控、中间件监控、数据库监控、日志平台和链路追踪;在运维管控微服务内核实现分级灰度发布、批处理管控、服务治理,容灾切换和数据库切换。最终达到可见、可管、可计的高效智能化运维。


图 1   邮储银行新一代分布式核心系统运维平台全景图


openGauss 智能运维落地,

初露锋芒


openGauss 在其中除了在核心系统中承担基础金融交易数据管理之外,在新运维平台中的数据库的智能管控系统扮演着重要角色。在本次上线运维平台,基于原生机器学习、深度学习结合自研算法对智能索引推荐和基于时序趋势预测是两个重要能力,对于提升邮储银行分布式核心系统的数据库平稳运行和高性能数据处理起着关键作用。


智能索引推荐,

让数据库始终高性能运行


数据库索引是提升数据增、删、改、查性能的重要手段。但在实际操作过程中,如何才能识别出哪些表需要建立索引?怎样的索引才能性能最好?需要数据库运维经验丰富的 DBA,但这方面人才却常年不足。因此大多数数据库多数时间运行在低性能区间,整体性能没有完全发挥出来。


索引推荐有 4 大亮点:


  • 多集群,细粒度管理:既可以管理多个集群的索引,又可以单个集群内,数据库,表级的索引管理。

  • 完善的索引总览:DBA 可以清晰地了解到当前系统已建索引覆盖多少 SQL,占比多少?有多少有效索引,多少无效索引,多少冗余索引,让索引情况一目了然。

  • 索引创建建议:系统通过內置的 AI 能力,分析哪些 SQL 需要建立索引,以提升性能。并给出最为合适的索引建议,DBA 同时可以看到一条索引会涉及哪些 SQL 语句,哪些语句会有正向的收益,对哪些语句可能有负向影响。让 DBA 知其然,而且知其所以然。

  • 无效/冗余索引:DBA 可以在索引推荐系统中查到无效的,重复的冗余索引,可以删除以避免在插入与更新时对系统性能带来的影响。


图 2    openGauss 智能索引全景图


智能索引推荐大幅提升了索引发现和创建的效率,原来只有少数高级 DBA 在几个月才能完成的工作,现在可能只需要几天即可完成,而且系统是动态变化的,openGauss 智能索引系统能不间断进行系统索引监测,对索引进行持续优化,让数据库始终运行在高性能区间里。使用时间越长,索引时间越短,优化速度越快。


图 3   邮储银行新一代分布式核心系统运维平台数据库索引推荐


时序趋势预测,

让数据库稳如泰山


数据库是新一代分布式核心系统的心脏,openGauss 稳定与否关系着这颗“心脏”健康与否,而提前感知风险,化解风险是关键。openGauss 的时序趋势预测能力,能帮助 DBA 提早发现风险,并提醒及时关注,提早处理,把风险消除在萌芽阶段,保持数据库稳定运行。


openGauss 时序趋势预测可以对 CPU、內存、QPS、动态內存、事务连接数、事务缓存等多项指标进行监控预测,预测周期短到分钟、小时,长至月度、年度。


图 4    openGauss 智能运维-时序趋势预测全景图


用 CPU 占用量预测来说明,图 5 是在邮储银行环境中实测的数据。其中绿色是通过时序预测出来的趋势,黄色是系统实际运行到当前曲线图。从图中可以看到预测曲线和实际运行曲线拟合度非常好,说明 openGauss 的时序预测质量很高。


图 5 中设定,对未来 2 小时进行预测。并基于设定规则进行判断,对于超过合理范围内的可能,进行告警,提醒 DBA 对于资源提早做好规划和准备,避免系统在高负载下,产生的业务不稳定,甚至宕机等严重问题。


图 5  openGauss 时序趋势预测对 CPU 的预测及实际情况


时序趋势预测,改变过去 DBA 被动响应的运维局面,提前感知风险,早做准备,从容应对。既保证资源的合理投入,又确保了系统的稳定安全。是邮储银行新核心运维平台走向以智能驱动运维的基础。


未来,

更多 AI 能力赋能邮储银行精细化运维


当前 openGauss 在邮储银行新运维平台上的智能运维能力应用,只是一个开始,除了以上介绍的几个已落地的能力,目前已有更多智能运维能力已在上线的路上。


  • 慢 SQL 智能分析:慢 SQL 是日常数据库运维过程中十分常见且棘手的问题。openGauss 通过内置的 AI 算法来精准地分析高耗时产生的原因并给优化建议,便于用户或 DBA 进行人工分析、处理。

  • 系统故障根因分析:通过异常检测算法发掘历史产生故障,然后调用 AI 算法进行系统的故障分析,综合系统发生故障时刻的关键信息,并根据概率进行排序,精准定位系统故障和给出最佳解决建议。可以发现并诊断已经发生的疑难问题,极大提高数据库的运维效率。

  • 调优参数智能推荐:参数对于数据库的性能影响很大,openGauss 的智能参数推荐功能,能够基于当前数据库运行时的负载,根据预设经验以及启发式模型,推荐出较优的参数配置。便于用户根据参数推荐的结果对系统进行针对性优化,最大化挖掘出系统性能潜力。


这些 AI 能力,不光是 openGauss 背后数百名工程师长时间技术研究的结晶,也是 GuassDB Kernel 在工业界十几年应用的工程能力的积累,两者相辅相成,将在以邮储为代表的核心复杂场景中发挥独特的价值。


图 6  未来 openGauss 更多 AI 运维能力落地邮储银行


进步,

与邮储银行同步


从新核心技术平台上线开始,到新核心运维平台的上线,不到半年时间,两大重量级系统分别出炉,邮储银行对数字化银行的建设进入快车道,取得了骄人的成绩。未来伴随着国际汇款业务的上线,明年上半年新核心的整体上线,作为邮储银行金融数据资产的核心管控数据库,还有很多发挥空间。openGauss 会持续进步,与邮储银行发展同步,全力支持加速建设智慧化金融。

用户头像

openGauss

关注

还未添加个人签名 2020.11.13 加入

openGauss是一款高性能、高安全、高可靠的企业级开源关系型数据库。

评论

发布
暂无评论
openGauss 助力邮储银行分布式新核心迈向智能运维时代