为什么 ChatGPT 不是中国搞出来的?
无论是 2022 年 11 月 30 日上线的 ChatGPT,还是最近 OpenAI 正式发布的迄今为止规模最大、功能最强悍的多模态预训练模型 GPT-4,都着实让普罗大众感受到了 AI 人工智能的强大威力,宣告了强人工智能时代的到来。在这场人工智能引发的破圈热闹之下,我们不免要进一步深入思考一个问题,为什么这么多年过去了,引领产业技术革命的依然是美国而不是中国?
2021 年,中国以全球 AI 顶级会发表的论文数 27.6%的比例高居榜首,而欧盟和英国以 19.0%紧随其后,美国以 16.9%位居第 3。无论 AI 人工智能论文发表量还是专利申请量,中国在全世界范围内都名列前茅,那么按道理来说中国在 AI 人工智能领域的研究既广泛又深入,像 ChatGPT 这样具有里程碑意义的人工智能应用应该在中国诞生才对。虽然说自然语言理解和生成是人工智能研究领域的一座高峰,想要攀登和征服就需要持续不断地高质量资源投入,而阿里达摩院、华为以及清华大学等研究机构也在做类似的事情。不过很遗憾,最终还是美国的 OpenAI 率先发布了强大的 ChatGPT。今天我们试图客观的分析下是什么原因造成了我们没有成为新一代技术革命的发起人,以后我们应该怎么做才能成为未来技术的引领者而不是跟随者。
原因分析
也许是因为过去中国二十年互联网的蓬勃发展,国内一些互联网巨头公司的市值可以在国际上和美国的互联网公司掰手腕了,让我们产生了不少的错觉,误以为在技术上我们也可以和美国一较高下了,但是事实真的如此吗?
相信大家在新闻中经常可以看到,这几年为了遏制中国发展,美国政府不断向中国高科技行业挥舞制裁大棒。比如向中国华为公司实施技术封锁,以国家安全为由,禁止美国公司向华为出售技术和设备。一时间中国的高端芯片行业哀鸿遍野,遭遇技术卡脖子危机。我们在感叹美国政府无耻的同时,也为自身没有预先布局底层技术研究以及体系构建而感到扼腕叹息。这次 OpenAI 发布的 ChatGPT 以及 GPT4 又给我们上了一课,越来越多的人认识到中国和美国的技术差距何止高端芯片,前沿的人工智能技术、强大的算力网络等等诸多高新技术方面都和美国有不小的差距。美国政府打压中国高科技行业发展这一巴掌,终于把一些还对美国抱有幻想的技术人彻底打醒,无论高端芯片还是前沿人工智能等核心技术买不来也求不来,只能靠自己一步一个脚印地走出来。当然这也坚定了我们和美国有关的技术类别必须全部实现国产化替代的决心。
过度关注商业模式,忽视底层技术研究
在过去的 20 年当中,中国互联网行业处在高速发展阶段,据 CNNIC(中国互联网络信息中心)报告,截至 2022 年 12 月,我国网民规模达 10.67 亿。随着互联网在线人数的持续攀升,各种各样形态的商业模式在这片热土上不断得以验证以及发展壮大。移动支付、电商物流、外卖打车、短视频等商业形态深刻改变了老百姓的日常生活方式,为大家带来了极大的生活便利以及娱乐消遣,同时也提升了整个社会的效率。但与此同时,各大互联网公司好像都沉浸在如何发展新商业模式以及维护已有商业格局的怪圈中不可自拔,几乎所有的精力都放在业务内卷上。因此投入底层技术研究的时间和资源相对就会被挤压甚至是完全没有,最终导致被别人技术卡脖子的概率大大提升,同时能够产生颠覆性创新技术的可能性却大大降低。
对比中美两国技术发展路线,我们可以发现一个有意思的现象。在中国,技术的发展大都是围绕业务进行,也就是说当一个业务模式被推出来之后,如果想要支撑这样的业务规模就需要发展什么样的技术,那就研究和发展什么技术,通过商业模式的创新、业务的发展推动技术向前发展演进。
但是美国好像正好相反,常常是一项技术的发展进步反向催生出新的商业形态。就拿推出 ChatGPT 的 OpenAI 公司来说,它原本就是一个非营利性的技术组织,集结了 AI 人工智能界的各路大佬,初衷就是让人工智能向着友好的方向发展,核心宗旨在于“实现安全的通用人工智能(AGI)”,使其有益于人类。GPT 模型经过不断的迭代升级最终搞出来了 ChatGPT,有望成为未来人工智能应用技术的基础底座,因此未来可能将会有海量的上层应用都是基于 ChatGPT 来进行构建,可以毫不夸张地说,ChatGPT 或者说通用大模型也许就是人工智能领域的操作系统,将来会诞生多少新的的商业模式以及业务形态不可估量,这种技术革命是自下而上的颠覆性创新将会对未来的产业形态产生深远的影响。
而我们太关注上层应用商业模式的创新了,从而忽略了底层技术的研究。我们仿佛在一次又一次的电商大促、一次又一次的短视频娱乐中逐渐迷失了方向,表面上的热闹掩盖不了底层核心技术的匮乏。其实想想就背后发凉,当下无论是互联网技术、人工智能技术等前沿技术好像都是建立在别人的技术底座之上的。那些曾经我们引以为豪的移动支付、电商物流等等不过是这些底层技术的上层应用而已。如果被人家釜底抽薪,那真的就玩不转了。所以底层技术真的非常重要,可以说没有底层技术的支撑,所有上层的应用都是空中楼阁。
缺乏长期主义
也许是国内竞争压力太大了,无论是个人还是公司,都恨不得今天投进去资金,明天就能看到结果和收益。如果在短期看不到收益的项目,一般公司实际上很难有持续的资源投入,更别提看不到明确回报周期的基础技术研究了。浮躁的氛围,层出不穷的技术噱头,表面上的热热闹闹,只会让大家都热衷于赶时髦追风口,却没有多少人能真正静下心来进行长期的技术研究。又有多少公司可以有马老师那样的魄力和实力每年 10 个亿连投 10 年,最终投出来个阿里云。
说到这里,不知道大家还记不记得区块链、VR、元宇宙这些科技名词,一开始出现的时候受到了极大的关注和资本的热烈追捧。但是当热头过去之后,现在又有多少公司还在不断地进行产品迭代,不断地进行技术深度优化研究呢?不能说完全没有但绝对是寥寥无几,与其说是他们追捧高新技术,不如说他们追捧的是如何快速赚钱的工具。至于到底是 VR、元宇宙还是 ChatGPT 其实都无所谓,对他们来说其实就是个技术名称而已。
但是实际上无论是 ChatGPT 还是 GPT4 这样的人工智能应用,都不是横空出世的,它们都是在 GPT、GPT2 以及 GPT3 基础上逐步迭代发展而来的,这其中耗费了多少顶尖人工智能专家长期坚持的心血以及大量资金的持续投入。OpenAI 在获得微软投资之前的三四年里烧掉将近 1 亿美元,才搞出来一个以 GPT 第一代模型为基础的雏形,当时还远远达不到 ChatGPT 今天的效果。基础技术研究不是一朝一夕就能完成的事情,它需要不断的试错,需要对未来技术发展趋势的独到眼光,更加需要长期主义的坚持。不过让我们感到欣慰的是,阿里巴巴、华为在技术研究上的投入已经每年超过 1000 亿,相信在不远的将来一定会有新的技术突破出现。
缺乏技术体系支撑
就好比高端芯片制造,其中涉及芯片设计、芯片制造以及封装测试都是一整套复杂的工艺缺一不可。同样通用大模型也是一个复杂的系统工程,而通用大模型的训练离不开海量的高质量训练数据、优秀的深度学习算法以及强大的算力资源支撑。ChatGPT 的成功得益于高质量的标注数据,OpenAI 为了获得高质量的训练数据雇佣了超过 40 家承包商进行数据标注,这在国内几乎是不敢想象的事情。另外以 ChatGPT 在 2023 年 1 月的独立访客平均数 1300 万计算,其对应芯片需求为 3 万多片英伟达 A100 GPU,如果没有庞大的算力支撑,很难训练出高质量的通用大模型。
也就是说,通用大模型的训练需要一个完整的人工智能技术体系来进行支撑,否则即便有先进的算法,但如何获得高质量的训练数据,到哪里去找庞大的训练算力资源,这些都是摆在通用大模型训练面前必须要解决的问题,否则没有高质量的数据以及算力支撑也是巧妇难为无米之炊。
如何破局
通用大模型是未来人工智能的重要发展方向,我们肯定要加大资源投入力度才能有机会在未来人工智能前沿技术的竞争中占有一席之地。那我们应该怎么做才能破局呢?我想可以从以下几个方面入手。
数据方面
虽然当前中文在线联网数据也算是海量,但是数据质量普遍不高,同时数据孤岛问题比较严重。如果我们想基于中文数据来训练通用大模型,就必须对中文在线数据进行治理提高中文在线数据质量,解决数据孤岛问题,推动实现数据的共享和互联互通。
算力建设方面
结合国家东数西算工程,协调各个区域的算力中心,形成全国通用算力基础设施,加快构建国家级一体化新型算力网络体系,为通用大模型训练提供源源不断的强大算力支撑。只有这样,才能满足大模型训练所需要的算力要求,同时为强人工智能时代的到来做好算力资源储备。
意识方面
和别人的技术差距,我们当然要尽力弥补。不过我们需要注意的是我们在进步,别人也在进步,所以我们光追赶别人不行,还要有更加长远的眼光,要有对于未来准确的判断力,进行提前技术验证以及产业布局,为下一次技术革命做准备,真正成为未来技术发展的引领者而不是追随者。
总结
科技的发展进步不是一朝一夕就能实现的,它可能需要一代又一代技术人员孜孜不倦地追求。虽然我们在很多领域都已经取得了长足的进步,但是同时我们也要清醒地认识到,在计算机领域、互联网技术领域以及人工智能技术领域我们还有不小的差距需要弥补。因此少一点网红、明星的曝光,多一点科技工作者勤恳务实地宣传,努力营造技术为先、科技为先的社会氛围才是未来科技行业蓬勃发展的社会环境基础。我相信如果我们可以少一点浮躁,多一点纯粹,也许下一次的科技革命就是在中国这片土地上诞生。最后和大家分享下马老师曾经说过的一段话,我觉得对我们当下思考未来技术发展非常有帮助。
我一直觉得填补空白这句话是有问题的,不是因为欧美的就是先进的,就是我们要去填补的。其实今天我们不应该要和哪个东西接轨,适应哪国的标准,填补哪个空白,今天我们要思考的是怎么和未来接轨,怎么适应未来的标准,怎么弥补未来的空白,我们要想明白未来是如何的,以及自己到底要做成一个什么样的体系,然后再去看看别人怎么做,如果永远重复别人的语言,讨论别人设定的主题,我们不但会迷失现在,而且会错失未来。
版权声明: 本文为 InfoQ 作者【慕枫技术笔记】的原创文章。
原文链接:【http://xie.infoq.cn/article/0c9dc9cefeb16c7f04d48ef86】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论