功能强大的 PostgreSQL 没有 MySQL 流行的 10 个原因
以下内容是根据玖章算术 CEO 叶正盛在「3306π 数据库朋友圈」技术演讲整理。文末附完整的 PPT 下载链接!
MySQL 与 PostgreSQL 都是非常优秀并且非常成功的数据库,PostgreSQL 的功能比 MySQL 强大,但是依然没有 MySQL 流行,作者从产品功能、技术架构、生态、品牌商业几方面来分析原因。
根据搜索引擎指数统计,过去 1 年 Google Trends(全球)显示 MySQL 关键字网页搜索是 PostgreSQL 的 1.5 倍,百度指数(中国)显示 MySQL 是 PostgreSQL 的 4.2 倍。
根据云厂商调研数据,全球 MySQL 用量大概是 PostgreSQL 的 3 倍,中国大概是 15 倍(备注,云厂商数据统计口径比较多,仅供参考)。
DB-Engines 从 2013 年开始对全球数据库流行度做跟踪,每个月从搜索引擎(Google)、社区问答(Stack overflow,DBA Stack Exchange)、企业招聘岗位(Indeed,Simply hired)、个人资料(Linkedin)、社区话题(Twitter)等渠道采集数据并做加权计分,在行业里有很高权威性。从 2023 年 9 月份的数据看,MySQL 以 1111 分排名第 2,PostgreSQL 以 621 分排名第 4。
1、PostgreSQL 没有 MySQL 流行的 10 个原因
综合来看,MySQL 比 PostgreSQL 都具有更高的流行度,但是 PostgreSQL 在产品功能方面是公认的开源领域 No.1。为什么功能强大的 PostgreSQL 没有 MySQL 流行,作者总结了以下 10 个原因。
从产品功能分析,虽然 MySQL 没有 PostgreSQL 功能强大,但是 MySQL 基于线程模型+读写分离方案,在早期互联网兴起时 LAMP(Linux+Apache+MySQL+PHP)是非常流行的解决方案。早期(2000~2010)MySQL 更多使用在新闻、论坛等互联网场景,随着 InnoDB 存储引擎的成熟,MySQL 在事务处理方面也全面增强,开始在互联网交易领域全面开花,如阿里巴巴使用 MySQL 全面完成了去 IOE,京东、携程也从 Oracle/SQLServer 转到了分布式 MySQL 架构。PostgreSQL 因为是进程模型,与 PHP 这类没有内置连接池的语言较难配合,在高并发的互联网场景不如 MySQL 有扩展优势,并且大型互联网公司在分库分表后 SQL 语句普遍较简单,PostgreSQL 不能体现出竞争力。
从公司和品牌观察,MySQL 长期有主体公司(MySQL AB/SUN/Oracle)推动,并且基于 GPL 开源协议(GPL 主旨是第三方如果修改源码再发布需要回馈到主干或者开源),可以更好聚合社区回馈形成品牌效应,PostgreSQL 的没有绝对的主体商业公司驱动,加上宽松的类 BSD/MIT 协议,PostgreSQL 有很多分支,功能并没有回馈到主干,导致社区品牌效应没有 MySQL 聚力。
MySQL 的易用性非常好,出生就支持 Windows/Linux,MySQL 的小巧灵活,简单易用(limit 分页、show 语法等等),获得了很多开发者的喜爱,容易形成人才优势,人才技能会很大影响着软件架构选型。PostgreSQL 早期只支持 Linux,直到 8.0 才支持 Windows,它在代码结构与数据库标准实现方面是典范,是学术领域的最爱,但是学术研究相比工业应用的人群少很多,实践成功案例不如 MySQL 丰富。
MySQL 在中国流行度是全球最高,很大原因来自于新浪、网易、搜狐、百度、腾讯等公司早期使用 PHP+MySQL 的实践,再加上阿里巴巴成功通过 Java+MySQL 完成去 IOE 的标杆案例,让 MySQL 在中国全面压倒性超越 PostgreSQL。题外话:MySQL 在英文含义与发音方面相比 PostgreSQL 简洁,对于大众品牌心智来说有些许优势。
数据库是非常核心的基础软件,生产使用后替换的成本很高,即使现在看 PostgreSQL 在功能上更领先,但是在稳定性方面没有得到大规模的验证、人才储备不足的情况下,要替换现有系统是高风险的事情。Uber 曾经就因为使用 PostgreSQL 遇到很多问题,然后全部迁移到 MySQL。
2、数据库在主要业务场景的竞争力分析和展望
在互联网领域,MySQL 有绝对的影响力,但是我们也看到 PostgreSQL 在 GIS(地理信息系统)领域非常强大,PostGIS 是 PostgreSQL 面向 GIS 领域的专业插件,几乎成为 GIS 领域的标准解决方案。
PostgreSQL 已经错失了互联网机遇,不过它支持更复杂的 SQL,HTAP 能力也更加出色,适合应用于企业级软件领域(ERP、CRM、BOSS 等等)。但随着中国的信创产业发展迅速,PostgreSQL 宽松的 BSD 开源协议,很多厂商基于 PostgreSQL 发展出了新型国产数据库,提供更好的服务支持,信创涉及到大量系统替换,这可能会是 PostgreSQL 在中国迎来新的发展机会。另外 PostgreSQL 的 pgVector 插件可以支持基础的向量数据库功能,在赶上了今天 ChatGPT 引领的大模型 AI 时代风口。
产品与技术总是在不停的进步,MySQL 与 PostgreSQL 的选型还会是持续争论的话题,MySQL 依靠互联网有先发优势,并且人才丰富,当前在互联网领域还会是首选,但是由于 MySQL 对复杂 SQL 支持不足,在企业级软件领域 PostgreSQL 会更有后劲。虽然国内 Oracle、DB2 这些企业级数据库都将远去,但是我们看见达梦、OceanBase 等自研数据库在飞速发展,PostgreSQL 还会面临新一轮的竞争。
本文更多是作者的经验总结与思考,也查阅了大量的资料,以下是部分参考资料:
https://dev.mysql.com/doc/refman/8.0/en/what-is-mysql.html
https://www.postgresql.org/docs/16/index.html
https://survey.stackoverflow.co/2023/#most-popular-technologies-database
https://www.toutiao.com/article/6824292543253971459/
https://www.uber.com/en-TW/blog/postgres-to-mysql-migration/
https://db-engines.com/en/ranking
https://www.modb.pro/dbRank
3、作者简介
叶正盛,玖章算术 CEO,NineData 程序员(NineData-让每个人用好数据和云-玖章算术),原阿里云数据库产品管理与解决方案部总经理,资深技术专家,是阿里巴巴去 IOE、异地多活、云原生数据库等项目核心成员。
▶︎ 附注 2 个数据库分类和市场大图
如要下载完整的 PPT,请关注 NineData 公众号,回复「NineData」,直接领取。
评论