写点什么

应对 ChatGPT,中国 AI 需要这三种能力

作者:脑极体
  • 2023-02-19
    天津
  • 本文字数:4902 字

    阅读完需:约 16 分钟

应对ChatGPT,中国AI需要这三种能力

这段时间,ChatGPT 成了全球科技企业“群起而攻之”的风口,几乎打开每一个社交媒体平台、每一个微信群,都在激情讨论 ChatGPT。

不过我发现,经过一段时间的发酵,大家的情绪不再只是猎奇和兴奋,一部分 AI 业内人士,已经率先进入了 ChatGPT 冷静期。

一位长期从事 NLP/AI 的研究人士告诉我,NLP 本来属于长期坐冷板凳的领域,ChatGPT 对话中错误随处可见,LLM 大语言模型的商业模式还不清晰,认知智能刚刚划过了冰山一角,对目前 ChatGPT 的一波波信息轰炸已经审美疲劳了,是时候给 ChatGPT 降降温了。

降温是不可能降温的,但找回常识和理性是必须的。

大胆预测,今年会是一个 ChatGPT 大年。

国产化的必然选择,股市与投资者的热捧,大量中国科技企业已经切实在跟进类 ChatGPT,而且“chat”问答天然的低门槛和娱乐性,确实会吸引大量原本不关心技术的人开始玩 AI。所以,尽管围绕 ChatGPT,有很多疯狂炒作和无稽之谈,但热度势必还会持续一段时间。

当然,如果你已经对 ChatGPT 资讯有点审美疲劳了,好消息是,大部分人在“调戏”ChatGPT 之后,猎奇心理也会消失。加上 ChatGPT 在应用和体验上还需要迭代,个人关注度会下降,而能够用 ChatGPT 带来业务价值的产业关注度,还会持续保温。

所以,ChatGPT 接下来的发展,不是“要么火要么凉”那么两极分化,而是会经历一个恒温培育孵化的发展期。

担心中国做不好 ChatGPT 的,不用急,一切才只是刚刚开始;认为中国 ChatGPT 可以弯道超车的,不用嗨,新技术还是要按照规律按部就班地发展进步。

从第一代生成式预训练模型 GPT-1 到 GPT-4,这条路 OpenAI 走了五年。可以说,没有对大模型的长期投入与探索,是不可能一步登天,做出 ChatGPT 这样的产品的。

那么,中国有没有类似的 AI 企业,拥有支撑起类 ChatGPT 的综合实力呢?

通过国际权威咨询机构 IDC 新近发布的《2022 中国大模型发展白皮书》,我们可以一窥国内大模型实力分布。


评估结果显示,百度旗下的文心大模型表现非常突出,在市场格局中处于第一梯队,产品能力、生态能力、应用能力全面领先,给百度即将发布的生成式对话产品文心一言,提供了强大的技术支持。

让我们暂时排除“支持国货”的民族情绪,带着理性和常识去探究一下,文心大模型的水平到底怎么样?文心一言等类 ChatGPT 产品,究竟能为用户和市场提供什么样的价值?

拆解 ChatGPT:一匹以大模型为骨架的“特洛伊木马”

ChatGPT 的出现,代表了大语言模型的突破,将对话式 AI 与 NLP 技术带到了一个全新的高度,展现了 AI 的更多可能性和商用潜力。

上个世纪,信息哲学领军人卢西亚诺•弗洛里迪就说过,“人工智能就像特洛伊木马, 把一种更具包容性的计算/信息的范式引入哲学的城堡。”而 ChatGPT 就是一匹看起来极其神奇的特洛伊木马,令人类啧啧称奇,担心自己不再是城堡中唯一的万物之灵。

当然,归根结底,AI 也好,ChatGPT 也好,都是一匹人造的木马,由人类创造,也为人类所驱使。


ChatGPT 这匹“特洛伊木马”的出现,更大的意义在于,它代表了一个标志——通过大模型这种方式,人工智能的知识瓶颈,是可以被打破的。

我们知道,算力、算法、数据,这 AI 三要素在当下基本得到了满足,带来了 AI 技术应用化的突破。但许多自然语言处理 NLP 任务,如机器翻译、情感分析、问答系统、语言生成等,需要模型具有一定的语言知识和理解能力。张钹院士曾提出:AI 最重要的能力是知识。但知识,始终是 AI 的一个瓶颈。

ChatGPT 的出现,标志着知识瓶颈是可以被打破的。通过大模型,学习海量的语料库,可以获取丰富的语言知识,对语言中的复杂结构、语义和逻辑,进行识别和处理。

大家感觉 ChatGPT 特别神奇,好像真的有自主思维一样,正是源自知识能力融入大模型后,在泛化性、通用性、迁移性上的强大表现。

它是一个标志,也只是一个标志。

因为 ChatGPT 也并没有彻底解决知识瓶颈,还存在一些局限性。比如由于中文语料不够多,获取的深度中文知识少,所以对中文的理解和问答效果都不如英文,经常出现常识性错误。

那么,问题来了。OpenAI 又不向中国大陆开放服务,对于优化 ChatGPT 的中文能力显然不会投入太多资源。同时,AI 又广泛应用在安防、识别、智慧城市等重要领域,安全性和可靠性也决定了,发展国产化 ChatGPT,成为了必然的选择。

好消息是,机会总是留给有准备的人,中国 AI 过去多年间不断积累升级,并没有在大模型时代令我们失望。

自 2018 年预训练大模型成为风潮后,中国 AI 领域快速跟进,已经积累了大模型所需要的全产业链要素,包括算力基础设施、数据集、算子库、深度学习开发框架、AI 开发工具,以及多个领域的大模型产品。

人家牵出了盘亮条顺的“特洛伊木马”,中国科技企业将自家拉磨的驴包装成汗血宝马,显然就不太合适了。国产大模型必须足够优秀,才能让国人和企业放心支持。

IDC 此时发布《2022 中国大模型发展白皮书—— 元能力引擎筑基智能底座》,首提大模型评估框架,是一个大模型比武的好契机,让我们可以综合评估国产大模型的实力。

从文心的三轮驱动,称称国产大模型的重量

投资市场有句话,“在短期,市场是个投票器;在长期,市场是个称重器。”遇到短期风口“猪也能在天上飞”,但长期来看,任何公司和概念都要靠扎扎实实的核心能力,长出翅膀,才能穿越风雨,持续腾飞。

放到 ChatGPT 概念上也一样,各种国产类 ChatGPT 产品出现,到底是骡子是马,得拉出来遛遛。


此次《白皮书》中,IDC 搭建了大模型评估框架 V1.0,选取国内主流厂商(N=9),从模型能力、工具平台能力、开放性、应用广度、应用深度、应用生态共 6 大维度的 11 项指标,进行打分评估。结果显示,百度文心大模型的产品能力、生态能力达到 L4 水平,应用能力达到 L3 水平,处于第一梯队。IDC 中国副总裁兼首席分析师武连峰认为,百度文心大模型是其打造文心一言的坚实基础。

现实进展来看,百度率先打开局面,即将推出类 ChatGPT 的生成式对话产品文心一言。

《白皮书》中提到,“模型+工具平台+生态” 三级协同,是 OpenAI 在开发 GPT 大模型过程中的核心思路,经过长期的积累,也更容易形成竞争壁垒。


我们不妨从这三个角度出发,去称称百度文心大模型的重量,究竟与 OpenAI 有何差距?

第一,大模型的产品能力。

模型层,是大模型的核心引擎,也是相关产品的主要优势和竞争赛点。

ChatGPT 的成功,得益于大规模的数据集,较强的模型开发和算法调优能力,在 NLP 领域的长期积累,以及来自微软的计算资源支撑等。总的来说,打造一个像 ChatGPT 这样的大模型产品,需要对算法和技术有深入的理解,以及数据、算力等支持。

这方面,我们可以看到,百度要打造类 ChatGPT 产品,不是从零开始,而是有着长期积累和综合优势。

百度自 2019 年开始深入研发预训练模型,发布了知识增强的产业级大模型文心 ERNIE1.0。在深度学习的基础上融入知识,将海量的知识积淀和自研的多源异构知识图谱,投入到文心大模型的预训练中,在知识的指导下,文心大模型的效率更高、效果更好,可解释性更强。用于训练的数据量级也有显著优势,模型参数达到万亿级别。2020 年开始将文心大模型应用到搜索业务,可以说,百度在破解 AI 知识瓶颈这一问题上的探索,并不比 OpenAI 落后,更比国内很多科技企业要早得多。


目前,困扰国产 ChatGPT 的算力资源和成本问题,百度也在开发文心大模型的过程当中,与国内外硬件伙伴合作寻找解决方案,百度飞桨深度学习平台向下适配各种硬件,以支持文心大模型的开发、高性能训练、模型压缩、服务部署的各种能力。

可以说,百度在大模型方面有着贯通全产业链的积累,能够满足类 ChatGPT 产品的开发需求,具有较强的先发优势。

第二,应用工具平台。

大模型的落地应用,是海外 AI 研究机构很少提及,却是产业智能化不可规避的问题。真实的产业应用场景中,企业和开发者接入大模型的方式多种多样,有的需要产品级的 API 接口,有的希望能够开放深度定制,有的则对成本非常敏感。

所以,要让大模型广泛应用,就必须平台提供完善的成体系的全栈工具链,包括深度学习框架、基础模型库、数据集、端到端开发套件、API 接口等,才能让更多行业人员或开发者,能够低门槛甚至零门槛的将大模型应用于自己的业务中。

目前,ChatGPT 还是没有开源的,想要基于 ChatGPT 打造集成化的行业应用产品,还不现实。这一点上,和飞桨深度学习平台生态共享的文心大模型,可以借助飞桨庞大且丰富的工具平台,以及 AI 开发社区,加速大模型的产业化应用,更快建立起商业闭环。

第三,行业生态。

正如 OpenAI 的首席执行官山姆·奥特曼所说,ChatGPT 的技术不应该被保留在科技行业的狭小范围内,而应该拥抱真实世界。

但是,大模型与千行百业的融合,充满了未知的领域,要一个行业、一个行业去探索,与开发者、行业用户、上下游产业共创,这是一个苦活重活,确实大模型走向产业、拥抱真实世界的更优解。

生态建设上,百度文心大模型与飞桨深度学习平台生态共享,前期已经做了大量的工作。《白皮书》显示,百度飞桨生态已经凝聚了 535 万开发者、服务 20 万家企事业单位,与 12 家硬件伙伴联合发布飞桨生态发行版、推动深度学习平台与更多硬件适配,还与国内科研院所、实验室以及高校强强联手,一同攻克 AI 技术难关,目前赋能了 389 所高校,服务 747 名教师,学分课培养 10 万余名 AI 学子 。

在此基础上,文心大模型与众多头部企业合作,融合了通用数据和行业特有知识,推出行业大模型系列,比如能源行业 NLP 大模型国网-百度·文心、金融行业 NLP 大模型浦发-百度·文心等,显著提升了大模型在行业任务上的应用效果,也在重点行业形成了大模型落地应用的参考路径,给全球大模型走向商业化,起到一定的示范作用。

“模型+工具平台+生态”,三轮驱动下,一点点将大模型推向广阔的产业天地。

化解中国 AI 焦虑的另一种思路:大模型的产业突围

ChatGPT 火爆之后,大家可能听到了类似的声音,认为中国科技企业不像 OpenAI 这样长期投入,中国 AI 缺乏元创新、底层创新,中国在 ChatGPT 上已经落后了追赶要花很多钱……

其实梳理百度文心大模型的进化史会发现,这些都是一种科技自立焦虑心理的“晕轮效应”,即因为某个细分领域、垂直领域的短板,而放大到对中国 AI 整体能力的质疑和虚无论,这显然是不客观的。至少在大模型这个领域,中国技术自信是很真实的。

ChatGPT 热潮也体现出,大模型成为发展 AI 技术的必然选择。这也为化解中国 AI 焦虑,提供了另一种思路,那就是大模型的产业突围。


IDC 认为,大模型将会助推数字经济,为智能化升级带来新范式。对行业用户而言,大模型已表现出巨大的潜力,企业应该尽早关注,在业务中布局。

但 ChatGPT 虽好,这类新技术在与行业融合时,实际中还会面对一系列适配问题,比如:

1.原始模型太大,难以在产线、矿山、园区等终端侧部署。

2.需要与行业专精知识相结合,开发定制程度更高、更安全可靠的垂直应用。

3.服务商自行开发类 ChatGPT 成本太高,难度很大,商业效益难保障。

所以,要打通 ChatGPT 等新 AI 技术向产业释放的一系列关节,真是“寻龙分金看缠山,一重山是一重关”,有着千山万水要过。这时候,围绕文心大模型这样的产业级平台,去撬动新技术的可能,或许才是真正的机遇所在。

在这个过程中,百度这样的 AI 头部玩家,接下来还需要做好三件事:

1.夯实 AI 基础设施。通过文心大模型与飞桨深度学习平台,夯实 AI 基础设施底座,加速类 ChatGPT 产品的开发,持续技术创新的同时,提供基础模型、丰富工具栈、API 接口等必要资源,成为各行业都可以低门槛引入 AI 的创新底座。

2.进一步加强生态开放。有活力的创新开发环境,才有中国 AI 应用的百花齐放,头部企业有责任为生态赋能,不断向开发者释放资源和支持。近日来,爱奇艺、集度汽车(通过 Apollo)、小度、宇信科技、汉得信息、金蝶软件、宝宝巴士、智联招聘、太平洋汽车网等知名企业,都已经加入了百度文心一言生态圈,获得该 AI 技术的“加持”。据说,文心一言还将会推出生态伙伴计划,全面支持伙伴,共同发展商业市场。

3.探索无人区,不断推动新技术与行业问题的结合。尽管每次 AI 领域的技术突破都会引发很大的舆论关注,但 AI 在行业当中的渗透率只有 10%左右,还有大量空白地带是可以与 AI 相结合的,需要头部企业去引导和探索,形成示范案例。

总之,中美 AI 或许在顶级科研、底层技术上有差距,但中国科技企业、从业者、开发者以及无数行业和企业,从来没有“躺平”过,一直在追逐着新技术的脚步。这些要素叠加在一起,是文心大模型的重量,也是中国 AI 的重量。

用户头像

脑极体

关注

还未添加个人签名 2020-06-12 加入

还未添加个人简介

评论

发布
暂无评论
应对ChatGPT,中国AI需要这三种能力_百度_脑极体_InfoQ写作社区