写点什么

「回看 Zilliz 的 2024」:Think Big, Think Long

作者:Zilliz
  • 2025-01-03
    上海
  • 本文字数:3535 字

    阅读完需:约 12 分钟

「回看Zilliz的2024」:Think Big, Think Long

很多年前,我读过张磊的《价值》一书,其中“做时间的朋友”这一理念深深打动了我,并对我的思考方式产生了长远的影响。如今,站在 2024 年的尾端,回顾和展望向量数据库这一赛道,我愈发感到这一理念的重要性。


大模型和 AI 技术已经从创新者与早期采用者的阶段过渡,行业热度正在快速回落。在新技术发展的浪潮中,如何穿越“死亡之井”(The Valley of Death),成为每一位创新开发者必须直面和解决的挑战。



图:技术成熟生命曲线


2023 年,向量数据库领域几起连续的大规模投资掀起了热烈的行业讨论。同年,ChatGPT 的诞生不仅点燃了全球对科技创新的热情,还将向量数据库的重要应用场景——RAG(Retrieval-Augmented Generation) 推向了风口浪尖。在这一背景下,数十家向量数据库公司迅速崛起,与向量检索相关的产品成为业界焦点,获得了空前的关注度和市场认可。


短短时间内,数十家向量数据库公司如雨后春笋般涌现,与向量检索相关的产品纷纷成为焦点,获得了前所未有的关注度。借助这股浪潮,Milvus 也实现了高速发展,Star 数目快速突破 30000,Docker 镜像下载量呈现几何级增长。


然而,行业热度终究难以持续高位。正如《桃花扇》中所写:


“眼见他起朱楼,眼见他宴宾客,眼见他楼塌了。”


2024 年下半年,随着大家对 AI 应用落地能力的质疑和资本退潮,整个 AI 行业的泡沫也逐渐显现。一方面 AI 应用公司融资困难,客户流失成常态;一方面传统数据库公司与云厂商快速反应,凭借技术积累和市场优势对向量数据库展开强力追击。热情消散,情绪冷却之后,向量数据库面临更加严峻的挑战:如何从短期的市场风口转向长期的价值创造?

与时间做朋友

面对外部环境的剧烈变化,我们始终坚持初心,专注于产品的核心价值。面对这一趋势,我们重新审视了 Milvus 在功能开发与架构设计上的每一个选择。好的产品正是由无数关键选择构成的,每一次选择都决定了我们前行的方向,以及最终将看到的风景。

面向未来的应用构建下一代基础设施

基础设施赛道不仅需要具备远见的开拓者,还需要有能够长期坚守的践行者。Infra 产品没有捷径可走,时间是创业者最有价值的武器。远见者能够在复杂多变的选择中抓住创新的机会,坚守者则能够始终坚持初心。即使是像 OpenAI 这样的行业巨头,从成立到崛起也经历了长达 7 年的蛰伏期,凭借时间积累技术和人才护城河,并逐步建立资本和用户壁垒。


回顾 Milvus 的发展历程,从 2018 年敲下第一行代码,到 2019 年 10 月正式开源,再到 2021 年发布 Milvus 2.0,我们始终坚信非结构化数据处理蕴藏着巨大的机遇。通过 AI 构建新一代基础设施,我们致力于帮助用户挖掘和理解非结构化数据的潜在价值。早在大模型出现之前,Milvus 已成功部署在全球 1000 多家用户的生产环境中。随着大模型的崛起,RAG(检索增强生成)迅速成为一个重要的应用场景,正是因为此前的产品与人才积累,Milvus 才能在向量数据库市场的激烈竞争中脱颖而出,成为 Forrester 报告评选出的向量数据库领导者。对于一家创业公司而言,单凭“更快的行动”很难超越大公司,尤其是在向量检索这类快速形成行业共识的赛道中。唯有先发优势加上长期的坚持与积累,才能在基础设施领域占据一席之地。

构建可持续的技术框架与架构

从技术的角度看,“与时间做朋友”意味着构建能够持续迭代和演进的基础架构。自第一天起,Milvus 2.0 便遵循存算分离、按需解耦的设计原则。通过依赖 Kubernetes、消息队列和对象存储等高度成熟的基础设施,显著降低了数据库架构的复杂度。尽管 Milvus 的组件经历了多次重构和调整,其核心设计始终保持稳定。这种架构的灵活性,使我们能够在同一套架构中满足高性能低延迟、低成本以及冷数据访问三种截然不同的产品需求。


随着业务场景的演变与数据规模的增长,我们每隔约 18 个月都会对系统架构进行系统性反思与总结。在 Milvus 的早期设计中,我们主要聚焦于高吞吐量场景,数据规模集中在 1000 万到 10 亿之间,主流索引方式基于内存。然而,随着 RAG(Retrieval-Augmented Generation)应用的兴起,数据规模逐渐扩展到百亿甚至千亿级别,对基于磁盘缓存甚至直接访问 S3 冷存储的需求日益增加。这些新趋势为向量数据库的架构设计带来了全新的挑战,也推动我们不断探索与优化。

与优秀生态和基础依赖同行

正如《价值》一书中提到的:“在长期主义之路上,与伟大格局者同行。” 要做好基础设施软件,必须与优秀的生态系统和依赖同行。以 Milvus 为例,其使用的开发语言 Golang 在过去十年间性能优化接近 10 倍。语言和工具链的持续进步,为基础设施软件的迭代和演进提供了坚实支持。


另一个典型案例是 AWS S3 所代表的对象存储。当前基础设施领域最热门的话题之一是 Zero Disk Architecture。通过将所有数据存储在 S3 上,该架构显著降低了系统复杂度和运维难度。同时,S3 的低廉存储成本和免除跨 Region 网络费用的特性,进一步降低了存储与流量成本。特别是 AWS S3 Express One Zone 的推出,大幅提升了 S3 的写入性能和吞吐能力,使其成为数据库主存储的理想解决方案。像 Snowflake、WarpStream 和 AutoMQ 等公司,已经率先采用了 Zero Disk 架构。针对用户长期以来对 Milvus 架构复杂维护成本高的反馈,我们也计划在未来版本中拥抱以对象存储为核心的持久化方案,逐步移除基于消息队列的日志存储设计,全面优化系统架构,持续降低系统的复杂度。

自动化,简化复杂重复的流程

践行长期主义的关键在于将优先级聚焦于能够产生时间复利的项目。自动化是实现效率和效果的关键。通过自动化,可以建立高效的流程和标准,显著降低出错的概率,提升团队生产力。对于那些需要频繁执行的任务,无论是每日还是每周的重复操作,都应尽可能实现自动化,从而节省时间并减少人为干预可能带来的波动。


自动化的核心在于选择正确的工具。在 Milvus 的部署和运维中,K8s、Operator 和 Terraform 的组合显著降低了复杂性。这些工具不仅简化了繁琐的配置,还使得非专业运维人员也能高效管理系统。即使在维护过程中,许多复杂的细节也由熟悉 DevOps 的团队成员持续优化,最终实现了在数百万次部署中收回投资的成效。


这一理念同样贯穿于 Zilliz Cloud 的开发中。通过集成 Hubspot、Orb、Sugar.io、Stripe、Auth0 和 Zendesk 等优秀的 SaaS 工具,我们实现了业务流程的无缝衔接,大幅降低了 SalesOps 的复杂性。这些工具的协同使用,使团队能够专注于核心业务目标,大大减少了重复劳动和资源浪费。

聚焦与取舍

在中国市场的竞争环境下,许多 SaaS 和基础设施公司追求全面的平台级解决方案。然而,我们选择了更专注的策略,将全部精力聚焦于向量数据库这一核心赛道。在非结构化数据处理领域,我们积极拥抱生态系统,与合作伙伴密切协作,共同推动行业创新。同时,我们持续投资公有云产品,充分发挥云原生架构的技术优势,以更精准地满足用户需求。


产品与用户之间是相互选择的动态关系。优秀的产品只有在最合适的场景中才能真正与客户产生共鸣。特别是在当前 AI 热潮退却的大背景下,唯有勇于深入、专注于核心技术的公司才能在严峻的市场环境中生存和成长。


正是由于我们对向量检索技术持续不懈的专注和投入,在众多用户的 POC 测试中,我们能够凭借卓越的性能、可靠性和功能特性,成功地应对竞争对手的价格战,赢得用户的信赖。

帮助付费用户取得价值

作为一款 SaaS 产品,时间总是站在能够为用户创造价值的一边。而对于一款开源产品而言,“帮助付费用户取得价值”更显重要,这也是过去一年我思考最多的问题之一。


首先,付费用户的需求更加明确,反馈质量更高。他们的实际需求往往具有强烈的业务导向,能够帮助团队聚焦于真正解决用户痛点的功能开发,避免资源浪费。这种反馈的精准性和时效性,对产品迭代至关重要。


其次,付费用户对产品的价值评估更加全面和严谨。他们不仅关注产品本身的功能和性能,还会考量其对业务目标的直接支持。这种关注促使我们不断反思产品的核心价值定位,从“做得更好”到“帮助用户实现更多”,以更高的视角完善产品战略。


最后,付费用户更有可能成为产品的早期传播者。付费用户从产品中受益的同时,也获得了优质的服务体验。当他们感到满意并在业务中获得成效时,自然会更愿意将产品推荐给其他潜在用户,成为产品在行业内的可信代言人。

世界上只有一条护城河

正如《价值》一书中提到的:“传统的护城河都有生命周期。无论是品牌、渠道、技术规模,还是知识产权,这些都无法成为真正的护城河。唯一持久的护城河,是企业家不断创新、不断追求创造长期价值的能力。”


打造一款优秀的 AI 基础设施产品亦是如此。无论是 AI 技术本身,还是与之息息相关的向量数据库,这些都是需要长期深耕的赛道。它们在短期内往往会被市场高估,而在长期中却常常被低估。与每一位构建者和创新者共勉。

作者介绍

栾小凡

Zilliz 合伙人兼研发 VP

LF Al & Data 基金会技术咨询委员会成员




发布于: 刚刚阅读数: 2
用户头像

Zilliz

关注

Data Infrastructure for AI Made Easy 2021-10-09 加入

还未添加个人简介

评论

发布
暂无评论
「回看Zilliz的2024」:Think Big, Think Long_长期主义_Zilliz_InfoQ写作社区