演讲分享 | 从“淄博模式”,看面向未来的数据库创新和发展方向
在刚刚结束的 2023 可信数据库发展大会上,YashanDB 产品总监王南受邀出席主论坛,带来了《从“淄博模式”,看面向未来的数据库创新和发展方向》的主题演讲,针对自研技术路线、开源、云数据库、HTAP、规模化应用等话题分享了价值观点。
以下为演讲实录(有删节):
2023 年,淄博凭借“真诚经营”、“坐地降价”成为旅游业的一股“清流”,但“破圈”的背后是旅游业长期以来的乱象。与旅游业类似,国产数据库如今呈现出百家争鸣的局面,但供给端的低质无序竞争,同消费端规模化应用诉求的矛盾十分突出,在高度竞争的市场环境中,数据库厂商面向未来应该选择什么样的创新路线和发展方向?
“如果说真诚是最大的必杀技,诚信就是城市最大的金字招牌。”我认为这是“淄博模式”带给数据库行业的启示,我们需要为用户提供诚实可信的高性价比产品、公正透明的价格、完善的生态体系以及放心省心的服务,重塑“供需信任”,促进数据库产业可持续地健康发展。针对数据库在市场应用中面临的几个关键问题,我们尝试把自己的理解分享和探讨一下。
1、为什么要替换?解决商业利益、生存底线和长期发展问题
数据库替换有三个层面的意义:一是商业层面,长期垄断造成数据库购买和使用价格昂贵,IT 成本支出高,大量经济收益向上游转移;二是生存层面,随着国际格局的演化和国际竞争的加剧,消除供应风险与业务连续性风险迫在眉睫;三是从发展层面,传统数据库技术和产品发展过慢,难以快速响应新场景的诉求,从业务视角需要有能满足诉求的新技术与新产品。
同时,基础软件作为软件领域的重工业,和大飞机、半导体、新能源等基础重工业一样有着同等重要的战略意义。国产化替换已经不是一道选择题,而是必答题。大量的事实证明,数据库具备国产替代的能力,但怎么做、怎么才能做得好,是我们接下来要给出的答案。
2、市场客户面临的最大挑战是选择判断成本过高、社会资源极大浪费
一方面,市场很多产品质量参差不齐,用户需要花费大量精力来判断和识别,而且大量中小企业并不具备能力进行精准和全面识别;各种产品技术路线眼花缭乱,无论从技术手段还是可行性角度,企业都难以判断数据库的自主原创能力和未来发展演进的可持续性。
另外,客户侧虽然由于自主可控、商业产品过于昂贵等外部因素已经开始逐步启动数据库替换,但由于应用改造成本过高、选择多种产品运维使用代价过高等内部因素,生产和核心系统的替换进度仍然偏慢,不利于数据库产品的优胜劣汰、快速成熟和市场化。
3、自主可控的关键是掌握核心技术,而不是源代码
什么是真正的自主研发?分为依次递进的七个层面:改写代码、优化能力、掌握核心机制、完全掌控、代码原创、攻坚任何难题,最后是技术创新与引领的能力,只有全自研才能做到以上所有能力。
除了拥有源代码,还需要真正掌握核心技术以及拥有掌握技术的核心团队,才能快速响应和解决技术问题,实现技术的持续创新和发展演进。所以,坚持自主研发不仅能从根本上化解“卡脖子”风险,更是技术推动和需求拉动的选择。
4、数据库与应用的兼容问题是数据库规模化应用的前提
数据库和应用的不兼容,会导致用户需要付出极大的迁移成本,带来的直接后果就是难以形成规模化复制,这是企业无法承受的。目前大量存量数据库仍未替换,而这些数据库之上的应用系统数量,更是存在一到两个数量级的放大,不兼容带来的改造成本也会呈数量级上升。
规模化复制有哪些挑战?一,迁移成本,大量业务系统改造投入的资源、时间和成本巨大,单个系统需要数人月到数百人月;二,迁移时间,行业应用生命周期 5-15 年,老旧系统甚至无法改造,只能等自然淘汰,存量系统的替换完成遥遥无期;三,迁移风险,找不到应用厂商、推不动厂商、改造难度太大、迁移后的系统稳定性以及运维能力承接和新的 Lock-In 等。
数据库要解决快速规模应用问题,而不是短期和点状问题,要避免因“人肉兼容”等方式带来的大量社会资源的无谓浪费,因此答案只有一个:必须做兼容,做高度兼容,兼容核心系统和开放生态占比最大最关键的 Oracle 和 MySQL。
5、集中式和分布式有其各自适用的场景,两者不是替代演进关系
在汽车行业,有满足家庭需求的轿车,也有适用于客货两用的皮卡,同时也有服务于高端用户的跑车,数据库和汽车场景类似,无法 one size fits all。
过去和现存大部分企业和场景使用的是集中式系统,随着互联网和 ToC 业务爆发,产生了分布式数据库来应对大规模数据量的增长。而金融、运营商等企业核心系统由于高可用的诉求大量使用大小机和集群数据库,这些行业场景中大量存在的存量集中式数据库,以及金融等高端核心系统使用的 RAC 集群数据库,都需要平替的解决方案,而不是强迫所有家庭都更换成“皮卡”。
集中式和分布式不是替换和演进的关系,有其各自适用的场景。
6、HTAP 为大量中小企业、中小业务系统的混合负载带来新选择
OLTP 和 OLAP 的分离是历史和技术原因导致的,OLTP 是公司局部、业务流程驱动和生产交易系统的诉求,OLAP 是公司全局、目标场景驱动和决策分析系统的诉求,但对于占大多数的中小公司、中小场景,没有那么大的数据量和计算量,通常一个 Oracle 就可以解决大部分问题。
对于大企业而言,目前在生产交易系统、数据转换、数仓系统之间已经建立了非常完备进而成熟的体系。但对于中小企业或中小数据规模场景,没有那么大数据量的诉求,没有必要、也没有预算来构建复杂的 TP、AP 和 ETL 系统,一个能够支持 HTAP 能力的数据库就可以解决大部分问题。因此,HTAP 有非常大的真实诉求和市场空间。
7、有没有公有云,数据库都先要解决产品、技术问题
云和数据库两个概念不冲突,数据库首先要从内核层面解决好功能、性能、扩展性、高可用等关键技术问题,然后云数据库在此基础上,通过一站式数据管理、云原生、规模化等云自身优势,来解决开发效率、运维效率、资源管理调度、数据治理和数据价值等问题,核心还是要先解决数据库自身的产品、技术问题。
数据库厂商当下面临“易、效、价、量”四个层面的关键挑战,覆盖对技术满足度、团队和能力、产品策略以及战略方向全方位的考验。第一是应用透明问题,实现应用、生态、功能、底座、上下游的兼容,让数据库变成光盘、盒子,能够简单选择和使用;二是资源效率问题,充分发挥现代硬件能力,降低单位操作下的消耗 CPU 指令数,提升单节点的吞吐性能,进而提高算力与存储效率;三是成本问题,通过高性能+兼容+合理价格,降低购买、改造和使用成本,具备高性价比;四是规模化可持续发展问题,具备通用性、全场景能力、技术演进性和发展持续性。
“YashanDB,一个新的可能。” 这些极具挑战性的问题,是我们坚持持续创新和投入的重点,YashanDB 从五个维度为市场提供一个可能选择:
一,全场景能力,支持单机/主备、共享集群、分布式等多种产品形态,覆盖 OLTP/HTAP/OLAP 负载场景,并提供完整的工具体系;
二,真实承诺,内核代码自主率 100%,高度兼容商业数据库,并提供可用于生产的性能配置和数据;
三,一流团队支撑,全球一流的科学家、研究团队、工程团队和服务团队,持续硬核创新,可支撑快速响应和规模应用;
四,高性价比,适用于高端核心/生产交易/管理系统等多场景,支持自动评估和迁移,有效降低成本;
五,开放利益,与产业上下游、渠道和服务伙伴实现共赢。
数据库作为未来全球数字化的底座,不但要解决有无问题,未来更关键的是如何解决规模化诉求下社会效率、资源效率、人才效率问题。
我们将国产数据库未来的创新发展总结为“大浪淘沙”、“患难与共”这两个关键词,大浪淘沙意味发展过程中需要大量客户的支持、应用场景的打磨,促使产品和技术优胜劣汰、快速走向成熟;患难与共需要用户和硬件、应用、中间件、基础软件、服务等上下游企业一起,形成互相支持和利益共享,共同探索出一条真正可行的数据库发展方向和模式,推动中国数据库产业的健康和可持续发展。
评论