OpenAI 成长史,凭什么快速崛起?特殊股权设计带来哪些影响?
贯穿人类发展的历史长河,科学和技术始终是促进人类社会发展与变革的核心驱动力。
比如,指南针的发明,助力人类大航海时代的开启,让人类的财富获得了极大的增长。印刷术的发明,推动了人类文明的传承,大幅度提高了生产力。蒸汽机的发明,标志着人类进入了机械化时代。因特网的发明,推动人类进入了信息化时代。大数据技术和云计算平台的广泛落地,标志着产业迈入数智化时代。AlphaGo 和 AlphaFold 的诞生,预示着机器人在某些垂直领域内比人类更专业、更聪明。GPT-4 多模态大模型(简称 GPT-4)的诞生,预示着人类距离 AGI 时代不再遥远……
国外著名的信息化咨询服务企业 Gartner 每年都会发布新兴技术成熟度曲线(Hype Cycle for Emerging Technologies),以帮助市场了解当前的新兴技术及其发展趋势。
引起人们兴趣的是,这些技术有可能成为驱动下一次人类社会生产力变革和产业革命的关键技术。
通过研究近 10 年(从 2014 年到 2022 年)Gartner 发布的新兴技术成熟度曲线,我们发现:与 AI 相关的技术一直处于行业的“热点”地位,比如智能机器人、自动驾驶、深度强化学习、强人工智能、机器视觉、生成式人工智能等。这说明近 10 年来,AI 技术一直都处于行业研究和产业落地的前沿地位,也是人类科技发展的重要方向。
我们的观点是,昨天的 AlphaGo、今天的 GPT-4,都是 AI 技术持续发展的必然结果。从整体而言,GPT-4 不是终局,AGI 之路还很漫长,未来大概率还会有新的范式和明星产品出现。
2015 年 12 月,特斯拉创始人埃隆·马斯克和 Y Combinator 总裁山姆·阿尔特曼在蒙特利尔 AI 会议上宣布 OpenAI 成立。
因为谷歌在 AI 领域占据强大的领导地位,所以 OpenAI 从成立之初就仿佛一直活在巨人的阴影之下。
谷歌在自然语言处理领域的研究硕果累累,比如谷歌大脑团队在 2017 年发布了 Transformer 预训练模型,在 2018 年发布了基于转化器的双向编码表示(Bidirectional Encoder Representation from Transformers,BERT)模型,这两个研究成果将机器对自然语言的理解推到了新的高度,也是 AI 发展史上里程碑式的研究成果。
下面详细介绍从成立开始,OpenAI 的重要发展历程。
(1)2018 年以前一直默默无闻,“两耳不闻窗外事”,努力搞研发,做一些 AI 的基础建设工作,虽然发布了一些研究成果,但是由于效果一般,并没有激起多少浪花。
(2)2018 年 2 月,由于理念不合,埃隆·马斯克宣布退出 OpenAI,一时激起千层浪。随着埃隆·马斯克的退出,OpenAI 的资金开始有些捉襟见肘。
(3)在谷歌的 Transformer 预训练模型发布后,OpenAI 团队受到了极大启发,发现强大的算力+预训练+海量数据的方式可以让模型不断迭代和优化。2018 年 6 月,OpenAI 发布了生成式预训练转化器(Generative Pre-trained Transformer,GPT)小模型 GPT-1。虽然该模型在自然语言生成(Natural Language Generation,NLG)领域有一定的效果,但是在自然语言理解方面效果一般,因此没有引起行业的广泛关注。
(4)2019 年年初,为了解决资金问题,OpenAI 改变了非营利组织的商业形态,将公司拆解为两个部分:技术部分仍是非营利组织,而商业部分变为营利组织,不过设置了投资回报率的上限,超过投资回报率上限的收益将转为非营利组织的收益。
(5)2019 年 2 月,OpenAI 发布了 GPT-2。与 GPT-1 相比,该模型的参数更多,效果更好,开始引起学术界的关注。
(6)2019 年 7 月,OpenAI 获得了微软 10 亿美元的投资,并与微软深度绑定。在解决了资金问题之后,OpenAI 开始专注于技术,发展进入了快车道。
(7)2020 年,OpenAI 推出了 GPT-3。GPT-3 引入了一些创新举措,比如指示学习,使得其推理能力大幅度提高,引起了行业更多的关注。
(8)2022 年年底,OpenAI 推出了爆款产品 ChatGPT,快速火爆全球,让世人瞩目,全球开始争相模仿。
(9)2023 年,OpenAI 推出了 GPT-4,其能力比 ChatGPT 有了显著提高,不论是在处理多模态任务上,还是在自然语言处理和生成能力上,都显著强于 ChatGPT。一时间,GPT-4 让全球膜拜,让对手胆寒。
可惜 GPT-4 尚未开源,具体的技术细节还不得而知。
我们觉得单模态大模型 ChatGPT 只是过渡产品,多模态大模型(类似于 GPT-4)才代表 AI 未来的发展趋势。
这也解释了为什么 OpenAI 在发布 ChatGPT 短短几个月后就发布了具有划时代意义的,效果远超 ChatGPT 的多模态大模型 GPT-4。
我们可以将 OpenAI 的发展历程分为 5 个阶段,分别是摸索期、低谷期、发展期、一鸣惊人期和高速发展期,如图 1 所示。
图 1
(1)摸索期。2015—2017 年是 OpenAI 发展的摸索期和初级阶段。在这个时期,OpenAI 主要搭建平台,寻找技术方向和打磨队伍。
(2)低谷期。2018—2019 年是 OpenAI 发展的低谷期。OpenAI 遭遇了核心创始人的退出,也遭遇了资金方面的捉襟见肘。好在 OpenAI 有着强大的明星创始团队和科技大佬的支持,找到了微软这个“大靠山”。
(3)发展期。2020—2021 年是 OpenAI 处在修炼内功的发展阶段,在解决了资金问题之后,找到了技术发展的方向,稳扎稳打,“撸起袖子加油干”。
(4)一鸣惊人期。2022—2023 年,OpenAI 的发展一鸣惊人,分别推出了两大明星产品 ChatGPT 和 GPT-4,让世界瞩目,也改变了整个 AI 行业。
(5)高速发展期。从 2024 年开始将是 OpenAI 的高速发展期,GPT 系列模型的能力会逐渐完善,新的版本也将陆续发布,商业应用和赋能的场景会越来越多。
OpenAI 成功的因素
尽管 OpenAI 的发展并非一帆风顺,经历了创业前期的摸索、低谷和起伏,但是从整体而言 OpenAI 的发展十分迅猛。
自 2015 年成立到 2022 年年底,短短 7 年时间,OpenAI 一跃成为 AI 领域的重要一极,甚至有成为领军人的“潜力”,这着实让人惊叹,也不禁让人感叹这家公司的伟大。
7 年时间,弹指一挥间,很多公司倒闭了,很多公司裹足不前,为什么 OpenAI 能够快速崛起?OpenAI 成功的因素到底有哪些?
下面尝试解答这些问题。
失败的原因有很多,成功的因素无外乎资金、人才和资源。通过对 OpenAI 的创始团队和公司发展历程的研究,在资金、人才和资源的基础上,我们总结出其成功的 6 个关键因素,如图 2 所示。
图 2
(1)选择大于努力,伟大的事业吸引伟大的人才。OpenAI 的创始团队选择 AGI 这个“伟大的事业”作为公司发展的方向,并励志打破巨头的垄断,成为 AI 势力中的重要一极。改变世界的梦想不一定适合所有创业者,毕竟不是每个人都适合做惊天地泣鬼神的大事,还有些人适合做立足于眼前的事情。对于大部分初创公司来说,第一个成功的因素可以弱化为公司选择的市场是否足够大,影响面是否足够广,影响的人群是否足够多。根据我们创业的经历,这里可以简单地给出一个市场容量的最低标准,比如对于 100 亿元的市场盘子,假设公司能占据的市场份额为 10%,那就是 10 亿元的营收。这就是一家不错的公司。
(2)有众多复合型人才的明星创始团队。伟大的事业往往能吸引出类拔萃的人才。OpenAI 的创始团队主要包含以下几类顶尖人才:顶级的“金主”、拔尖的投资人、全球有影响力的科技大佬和“技术大拿”。这意味着 OpenAI 在成立之初,就拥有了成功公司的 3 个因素:资金、人才和资源。当然,对于大部分初创公司来说,这个条件也可以弱化为初创公司需要管理人才、融资人才、技术人才和商务人才。“一个好汉三个帮”,一个公司要想成功,至少需要这几个方面的核心人才。
(3)充裕的启动资金。OpenAI 在成立之初大概募资了 10 亿美元,这保证了 OpenAI 现金流的稳定性,即使公司在前几年发展方向不清晰,处于“不断摸索的状态”,也能保证公司轻松地“活下来”。对于初创公司来说,资金十分关键,这是公司能够战胜竞争对手的核心武器之一。
(4)强大的融资能力和影响力。当公司发展处在低谷的时候,OpenAI 的创始团队能快速融资,而且能找到大佬投“大钱”(微软投资了 10 亿美元)。这不仅能解决公司的生存问题,还可以依托大佬的资源,让公司快速成长。对于大部分初创公司来说,其实因素(3)和因素(4)也可以弱化为初创公司需要一个强大的 CFO(Chief Financial Officer,首席财政官),这个 CFO 能够找到“金主”,为公司解决钱方面的后顾之忧。
(5)管理团队的战略应变和聚焦能力。在发现问题后,OpenAI 的管理团队能快速地解决问题,而在发现方向不对后,能快速地调整方向。当发现方向可能是对的时,OpenAI 的管理团队能做到战略聚焦,持之以恒地攻坚克难。对于大部分初创公司来说,因素(5)可以弱化为初创公司需要一个有能力和不断学习的掌舵人。
(6)站在巨人的肩膀上和获取核心资源。OpenAI 的成功其实离不开竞争对手(比如,谷歌、Facebook 等)的技术和人才,我们将其统称为“巨人”。OpenAI 一直站在巨人的肩膀上。如前面所述,OpenAI 的爆款产品 ChatGPT 借鉴了谷歌提出的许多技术思路。微软不仅给 OpenAI 带来了“枪和炮”,还给 OpenAI 带来了 AGI 应用的诸多场景,这可以帮助 OpenAI 的产品从实战中快速得到验证和迭代,并有助于加快商业化进程。对于大部分初创公司来说,因素(6)也具有现实价值,要努力找到自己创业的核心资源,这能够让创业事半功倍。
简而言之,一个公司要获得成功离不开资金、人才和资源。这 3 个因素是成功的充分条件。在有了这 3 个充分条件后,公司还需要确定正确的发展方向和愿景,并具有强大的战略应变、聚焦和执行能力。
OpenAI 特殊的股权设计带来的启示
我曾经参加过一个科技论坛,有一位国内知名的区块链专家详细介绍了 OpenAI 特殊的股权设计,并赞赏该股权设计,提出了“灵魂拷问”:为什么在中国不能出现这种股权设计?为什么在这种股权设计中,即使没有绝对的掌控力,微软也愿意投巨资?
当然,专家并没有给出问题的答案,只是简单地提出自己的“灵魂拷问”。
OpenAI 为什么要引入风险投资?
我们认为,核心原因还是 OpenAI 的“大数据、大算力、大参数量、大模型”模式太“烧钱”,大模型完整训练一次可能需要花费数百万美元,这头“吞金兽”很容易让 OpenAI 陷入“地主家也没有余粮”的困境。
为了既解决资金问题,又保持一定的独立性,2019 年,OpenAI 推出了全新的股权结构,在原来 OpenAI 非营利组织(OpenAI Inc)的基础上,成立了一家有限合伙公司(OpenAI LP Ltd),由该公司作为 OpenAI Inc 的融资平台,为 OpenAI Inc 提供资金支持,同时也允许该公司将利润分配给风险投资人和员工。
为了保留对公司的控制权,OpenAI Inc 作为 OpenAI LP Ltd 的普通合伙人(General Partner,GP),主要负责 OpenAI LP Ltd 的管理和运营,而其他投资人、核心团队作为有限合伙人(Limited Partner,LP)。无论 LP 占股多少,都不直接参与公司的管理和运营,而只享受公司的投资回报。因为 OpenAI Inc 是非营利组织,所以无法上市,因此 LP 无法享受股票增值等收益,只能享受分红等权益。
为了让 LP 获得足够收益后合理退出,OpenAI 做了特殊的设计,让 LP 可以从 OpenAI LP Ltd 的利润中获得回报。GP、LP 的股权设计在现代股权设计中十分普遍,在此不做赘述。
下面重点介绍 OpenAI 最具特色的退出机制。股东对 OpenAI LP Ltd 的投资回报并不是无穷无尽的。为了兼顾 OpenAI Inc 的非营利性和独立性,OpenAI 设计了“回报封顶”的特殊退出机制。
“回报封顶”采用分级策略,第一批合伙人(First Close Partner, FCP )最高可以获得 100 倍的利润回报,比如投资了 10 万美元,最高可以获得 1000 万美元的利润回报。后期进入的投资人的回报比例会有所降低,最高不会高于 20 倍。
所有 LP 在获得“回报封顶”规定的收益后,其股份将无偿转让给 OpenAI Inc,至此将不再持有 OpenAI LP Ltd 的股份,也不再享有利润回报。
以微软为例,微软累计给 OpenAI LP Ltd 投资了约 130 亿美元,只享受公司的利润分享权,并不能直接参与公司的管理和运营。在获得“回报封顶”规定的收益后,微软的股份将无偿转让给 OpenAI Inc,微软不再享有直接的利润回报。假设微软的收益倍数是 10 倍,微软投资了 130 亿美元,其总收益为 1300 亿美元,在微软从 OpenAI LP Ltd 累计获得 1300 亿美元后,微软的股份将无偿转让给 OpenAI Inc。
此外,OpenAI LP Ltd 也设置了详细的规则,规定了退出的顺序。退出机制可以简单地分为 5 个阶段,如图 3 所示。
图 3
(1)第一个阶段:FCP 享有优先退出权。直到 FCP 收回投资本金后,其他的 LP 才能选择退出。
(2)第二个阶段:公司拿出 25%的利润分配给 FCP 和持股的员工,直到达到利润的上限。
(3)第三个阶段:微软享有 75%的利润优先分配权,直到收回本金。
(4)第四个阶段:在微软收回本金后,其利润优先分配比例将下降至 49%,其余的部分继续支付 FCP 和持股的员工的收益。
(5)第五个阶段:LP 在获得“回报封顶”规定的收益后,所有的股份将无偿转让给 OpenAI Inc。
OpenAI 的股权设计确实做了一些创新,按照当前 OpenAI LP Ltd 获得的融资额,我们推算,其累计利润到达 1500 亿美元才能还完股东的投资本金和收益部分。
根据公开发布的财报数据,Meta 2022 年的净利润为 232 亿美元,谷歌 2022 年的净利润为 600 亿美元,微软 2022 年的净利润为 727 亿美元,苹果 2022 年的净利润为 998 亿美元。
这四大巨头成立的时间分别为 2004 年、1998 年、1975 年和 1976 年,距今(2023 年)的成立年限分别为 19 年、25 年、48 年和 47 年。
OpenAI 在 2022 年还处于亏损状态,大约亏损 5 亿美元,因此要获得 1500 亿美元的累计利润确实“路漫漫其修远兮”,任重而道远。
由此可以看出,微软花巨资投资 OpenAI,可能看重的并不是短期回报或者现金回报,而是 OpenAI 给微软带来的商业价值和股票方面的回报。
综上所述,OpenAI 特殊的股权设计确实可以给从事硬科技研发且需要巨大投入的科技公司带来一些启示,这样既能有效地解决资金问题,又能从长远上保持经营的独立性,值得行业借鉴。
OpenAI 的 FCP 和微软等投资者因为相信 AGI 的潜力和价值而选择相信 OpenAI,同时也相信 AGI 具有巨大的商业价值。从事硬科技研发的中小公司能否给投资者同样的愿景,并获得投资者的信任是一项重大挑战。
此外,在 OpenAI 后期的投资者中,最关键的角色是巨头微软。
我们认为最主要的原因是 OpenAI 的产品可以和微软的产品形成战略协同,从而大幅度提高微软的商业价值。
同时,微软拥有丰富的应用场景,也能快速推动 OpenAI 的产品商业化。两者其实是相辅相成、相互提高的关系。
因此,从事硬科技研发的中小公司能否找到类似的战略协同巨头,也是能否快速成功的关键因素。
OpenAI 的横空出世重新点燃了各个行业对 AI 的热情,也让我们第一次感觉人类距离 AGI 越来越近。
作为 2015 年的创业公司,短短 7 年时间,OpenAI 给行业带来了两款明星产品 ChatGPT 和 GPT-4,给这个世界带来了如此大的震撼。
OpenAI 到底能给创业者带来哪些启示?
这是本文想重点研究的课题。
以上详细讨论了 OpenAI 成功的 6 个因素。
我也是一名创业者,经过两年的摸索,我发现要做成事业,这 6 个因素至关重要。
当然,OpenAI 还有很多其他闪光点,比如其独特的股权设计、战略自适应能力、协同伙伴的选择能力、战略聚焦和专注能力等,这些也是其快速成功的关键因素。
潮起潮落,花开花谢,AGI 之路肯定不会一帆风顺,笑看风云,只有用平常心态看待一时的高峰和低谷,才能获得持续发展的能力和动力。
在 AGI 领域,未来肯定还会诞生其他的明星产品,只要在这条路上坚持不懈,就肯定会有收获。
对于广大的中小公司而言,道理也一样,虽然资金和资源相对少点,但是只要方向正确,保持正向现金流,付出持之以恒的努力肯定就会有收获。
我们衷心希望通过深入挖掘 OpenAI 成功的因素,能够对广大的科技爱好者、从业者或创业者有所帮助,也衷心希望他们能为多模态大模型的发展和应用做出贡献,从而实现其商业价值。
此外,与单模态大模型相比,我们认为多模态大模型(比如 GPT-4)才是 AI 的未来,未来也会成为各行各业的基础 AI 设施,而单模态大模型(比如 ChatGPT)只是过渡产品。
但是,我们发现当下很少有书籍或研究报告能够将多模态大模型的技术思路、技术亮点和实际应用案例详细介绍清楚。大部分书籍或者研究报告的介绍都是“蜻蜓点水”,点到为止,读者看完也不明白如何应用多模态大模型、如何和自己的场景结合产生商业价值。
基于这些痛点,《多模态大模型:技术原理与实战》一书做了详细介绍。
本书后面的章节会重点介绍 OpenAI 的两大明星产品 ChatGPT 和 GPT-4 的技术原理与技术亮点,并通过实际案例清晰地展示如何应用 ChatGPT 和 GPT-4、如何产生商业价值。
本文截选自《多模态大模型:技术原理与实战》一书,想要了解更多多模态大模型的内容,欢迎阅读本书~~
↑限时五折优惠↑
限时五折优惠,快快抢购吧!
评论