写点什么

YashanDB 演讲实录|王南:YAC 集群,核心平替

作者:YashanDB
  • 2024-12-11
    广东
  • 本文字数:3849 字

    阅读完需:约 13 分钟

本文为“2024 国产数据库创新生态大会”深算院首席产品官兼崖山科技副总裁王南的演讲实录分享,主题为《YAC 集群,核心平替》,欢迎阅读。


尊敬的各位领导、各位专家、各位来宾:大家下午好!我是王南。今天非常荣幸能够有这样的机会给大家汇报和介绍崖山产品的发布和进展情况。今天想和大家分享的主题是《YAC 集群,核心平替》。


市场迎来规模化应用拐点

供给端和需求端仍有巨大鸿沟


数据库行业不是一个新兴行业,已经发展了数年。过程中始终有两条主线在往前进行,一条主线是产品技术创新,另一条是用户和生态。数据库技术的发展从最初的数据隔离到关系模型,再到分布式数据库、数据仓库、云技术的涌现,如今随着人工智能技术的融入,数据库再次跨入崭新的发展阶段。放眼中国市场,目前还面临着自主化替代和大规模应用的挑战。其中有个关键问题值得关注——底层技术的发展和创新,是否意味着应用也都必须随之大规模改造换代?用户和生态不应该跟随技术的发展而推倒重来,过去数十年积累的信息化资产和数据资产要能够重用。


回到当下,经过几十年的发展,数据管理应用在各个场景都经过了三个主要阶段:从探索阶段,到试点应用阶段,再到全面应用阶段,如今各场景都基本步入规模化应用阶段。



然而,现实情况是用户的诉求与市场目前所提供的产品技术能力有明显差距,在应用场景、数据处理与业务模型、商业与开源生态系统,以及性能、兼容性、核心集群技术、成本和长期发展等各个维度均有体现。就像图中所示,用户可能需要的是一艘现代化军舰,而现在市场上的技术可能还是上个时代木质帆船,能解决一些问题,但大量问题还需要用户自行解决。相对而言,大规模的金融、政企客户有实力去解决,而中国超五千个金融机构不可能都以如此高成本、高投入的方式进行规模化国产替代,该如何解决?面对这一挑战,崖山数据库立足于解决全行业在大规模应用面临的时间、资源和投入问题。


崖山:立足核心、兼顾通用

面向企业核心的通用数据库


可能很多人会问:崖山凭什么能够解决?实际上有三个关键的要素:


首先,我们拥有一支由院士带领的全球顶尖科研团队。在过去数十年里,我们在大数据和数据库领域积累了大量前沿基础理论、算法和核心技术,这是崖山能够做得更好、更强的最核心原因。


第二,我们有一支很强的技术和工程团队。核心技术人员在过去一二十年中,在数据库领域内积累了丰富的内核开发经验,踩过了各行业场景中大量的坑,同时拥有专业核丰富的工程能力,成熟经验和工程能力是技术是最终转化为成熟产品落地的基础。


第三,产品和技术的成功不仅仅取决于技术的先进性,商业化能力和支撑体系也是走向商业成功的关键。崖山团队在数据库领域也经历过从零到一、多次成功的商业化经历。迄今为止,团队曾经开发过的产品成功商业应用数量已经达到上百万套。


再回到产品和技术本身,崖山是如何发展和形成了完整的产品体系?第一层是理论创新。我们持续专注核心理论的研究,包含有界计算、跨模融合计算、异步自适应并行处理 AAP 等,这是保持技术领先性的关键;第二层是架构和原型的预研,这是将理论和算法转化为产品能力的核心要素,例如并行计算框架、共享集群引擎、云化调度框架,以及当前正在进行的向量计算、异构计算框架正逐步落地在产品中;第三层是产品能力。通过研发团队基于原型方案持续构建,我们在 2020 年发布了首个 Beta 版本,2021 年发布了分布式和主备机产品,2022 年发布了第一个 LTS 版本,构建了 Oracle 兼容和完整工具体系,以及面向金融核心的共享集群原型,2023 年把共享集群数据库真正打造成了具备商用能力的 LTS 版本。



崖山从过去到现在和未来的产品技术发展,从来不是实验室中的想象,而是基于对市场和用户进行深入分析、应用中得到的真实诉求。左图是 2023 年信创市场进展的调研,其中有两个非常关键的信息:第一是 2+8+N 行业里信创总体的替代节奏和进展并不快;第二是在核心业务场景,这个比例相对于整体的节奏会更慢、更低。我们从各个行业里看到了新的场景、新的挑战、新的诉求,如对于商业和开源生态兼容性的普遍要求、政企和金融核心真正能够 1:1 平替集群的要求、大企业和大金融机构云平台建设对云上数据库能力的要求、自主化建设 TCO 成本的挑战等等。



崖山给出了自己的探索和答案,这张图是崖山产品能力规划的全景图,蓝色部分是崖山当前已经具备的产品形态,我们构建了统一内核、主备和分布式产品形态,已经发布了相关的版本。在 YashanDB V23 版本中,面对刚才提及的挑战和问题,我们正式发布了 YAC 共享集群、MySQL 生态兼容、私有云管平台和数据库一体机,为用户提供面向未来大规模应用的能力。在产品能力持续演进的同时,我们也同步构建了市场、渠道、生态等能力,确保对用户提供从规划到选型、购买、运维等全链路支撑。面向未来,我们也会持续进行公有云技术、实时分析能力、存算分离能力以及人工智能等能力的研究和落地。



共享集群 V23.3 升级 端到端 1:1 平替


在 V23 版本中,正式发布共享集群长期支持(LTS)版本,背后我们投入和交付了数千人月、数百个特性、几十万行代码以及上百万的测试用例,经过近两年的打磨真正走向商用。市场应用不仅仅是功能兼容问题,提供全方位对共享集群数据库的应用支持,包括一键平滑迁移、针对金融核心场景从应用、高可用到性能端到端 1:1 替代的能力,形成完整全面的解决方案。主备集群性能线性扩展比高达 0.8,足以应对拥有数亿客户规模的头部城市商业银行核心系统的负载。



Oracle 99%兼容,支持 MySQL 兼容


除了共享集群之外,V23 版本在产品能力上也有了长足的进步,通过一年的努力,我们将 Oracle 的兼容性从 90%提升到 99%。在金融领域的市场客户场景中,基本可以做到应用零修改。同时我们也看到一些事件,包括 Apache 日志严重漏洞、Linux xz 压缩工具恶意植入以及最近 Linux 的内核除名俄罗斯的开发者等,这也暴露了开源软件的漏洞和开源软件的供应风险问题。因此,今年我们与央行数研所、深圳政务云等战略客户合作,面向 MySQL 开源场景进行兼容性优化,在持续深化商业生态的同时,开源安全漏洞的消除和对开源生态的兼容也成为崖山新的战略方向之一。



崖山私有云和数据库一体机全新发布


私有云技术已经在政企和金融等大企业广泛部署应用,但目前客户仍有大量对数据库的多样化需求。大部分数据库厂商的在云上的应用方案是在云上基于虚拟机部署和运维数据库,这会带来一个新的问题:云为用户带来的是统一运维、资源效率的优势,在云上又把它当作一台物理机去安装部署,这又把云的优势重新拉回了原点。因此基于私有云的场景,我们发布了基于私有云底座的崖山云管平台能力。崖山私有云基于私有云的 IaaS 提供统一的运维和服务支持,帮助用户解决云上大规模数据库集群的统一运维问题、私有云独立数据库选型难题、多云架构的切换问题以及小型且分散的系统统一建设的难题,帮助用户解决云上数据库选型和应用的痛点、并加强资源利用率和统一管理运维效率。



云和一体机是手掌的两面,云解决的是运维效率问题,一体机则能满足用户对更轻量、更高效、更极致性能的要求。我们今年也和浪潮、超聚变、宝德、联想、华为、宏杉、麒麟软件等国内头部软硬件厂商共同推出了全栈国产化的崖山数据库一体机,来为用户提供简单、灵活、强劲的软硬一体化解决方案。



高性价比、可规模化的平替方案发布


回到我们始终在讲的产业大规模应用问题,为了解决这个问题,崖山正式发布了高性价比的规模化平替解决方案。大规模产业应用的成本组成是多维度的,包含应用开发和改造成本、软硬件采购成本以及未来的服务成本。在单个项目或系统里,兼容性、性能、生态不是关键矛盾,但是放到公司、产业层面,这些都不再抽象,而是具象化为成本问题,兼容性影响应用开发和改造成本,性能影响硬件及软件的购买成本,生态则会影响未来长期的服务成本



YashanDB V23 版本完整开放公开下载


市场和用户是检验产品的真理手段,崖山在官网全面开放了 V23 完整版本下载,主备机、共享集群、分布式产品形态毫无保留,完全开放下载。我们也是想向大家传递:首先,我们有信心,敢于把产品给所有人去检验、尝试、应用;第二,我们是真诚的,没有任何限制,开放下载的版本和企业级版本没有任何区别、没有任何约束和限制,所有人无需注册直接在官网下载;第三,我们是开放的,欢迎所有的用户、开发者使用产品,我们欢迎更多的建议、更欢迎更多的批评,用户的声音是我们未来努力的方向。



生态共建,加速商业落地


除了产品层面的发布,一款数据库在市场上商业应用成功,其市场生态非常重要。从研究院走向市场,我们也开始在生态、渠道和服务领域构建起能够支撑全国各区域、各行业的合作伙伴。截至目前,我们已经构建了 200 多个生态伙伴,在产业生态领域,与技术栈上下游的应用厂商、ISV 厂商、中间件、操作系统以及硬件厂商深度适配;在市场渠道领域,已发展 20 多家全国各区域和各行业的渠道和代理商;同时除了原厂服务能力之外,和国内 12 家服务厂商达成了战略合作,以支撑未来崖山应用全面的技术服务支持。



崖山数据库在过去两年也开始构建客户场景的打磨与应用,在行业纬度,形成了政府、金融和央国企三大主要行业方向,并开始其他行业应用;在区域维度,在深圳、华东和华北三大区域形成了区域中心并走向全国。通过原厂以及和合作伙伴的努力,整体市场的销售、渠道和服务等能力,已经形成深圳、上海、北京、西安四大区域中心,并辐射西南、西北、东北等全国区域的格局。


在市场和产品构建的进程中,崖山团队始终坚持对于核心技术的持续探索和创新,我们坚持:原创理论,才能够铸就科技创新的不断引领;自主创新,才能够陪伴用户持续的成长。

再次感谢大家!

发布于: 刚刚阅读数: 5
用户头像

YashanDB

关注

全自研国产新型大数据管理系统 2022-02-15 加入

还未添加个人简介

评论

发布
暂无评论
YashanDB演讲实录|王南:YAC集群,核心平替_数据库_YashanDB_InfoQ写作社区