频频破圈,走向百业:大模型的毕业季
人间六月,满眼芳菲。很多人将在这时迎来人生中又一个毕业季。与熟悉的课堂、校舍、同学道别,走向新的学府,或者走向自己选择的行业。
这个情感浓烈的六月,却与往昔有点不同。除了人类的青春故事依旧精彩,AI 大模型也在毕业季频频出圈。最近,百度的数字人度晓晓,向我们完美展示了一枚 AI 同学如何度过一个完美六月。先是写高考作文,后是画作参加美院毕业展,紧接着还跟龚俊一起创作音乐。难怪很多同学表示,我的毕业季可没有 AI 那么精彩……
支撑度晓晓实力破圈的,是百度自主研发的文心大模型。
几年以来,大模型可以说是 AI 领域,乃至整个科技界的核心热词之一。我们经常会听到某公司/科研机构训练了新的大模型,参数规模打破了记录;却很少听到某行业/领域真的用到了大模型。从 2018 年十月谷歌 AI 发布 bert 开始算起,大模型到这个六月正好度过了“大学四年”。换言之,这项被赋予期望的技术,也该迎接自己的毕业季了。
此前,我们看到的是大模型无尽的提升训练模型参数,无尽的刷新数据集测试分数,并且有各种各样新的技术思路加入大模型训练。但面向未来,我们可能只需要以一种思路来评判大模型:能不能带来产业价值。
度晓晓的出圈,确实刷新了很多人对 AI 的认识。但更重要的是它通过一系列动作,向产业证明了预训练大模型如何跨越技术屏障,真正与产业结合,向开发者与千行百业开放生态。
2019 年,百度率先发布了中国首个正式开放的预训练模型 ERNIE1.0,开启了中国大模型的“入校生涯”;2022 年,文心大模型第一个冲出实验室、数据集的大门,引领了全球大模型的“产业岁月”。
能够做到这一切的原因,在于文心大模型正确回答了三道“毕业考试题”。
先答这道“证明题”:一系列出圈动作背后的技术跨越
短短几天之内,百度数字人度晓晓首先挑战高考作文。参与作答了全国新高考Ⅰ卷的《本手、妙手、俗手》议论文写作,40 秒就根据题目创作了 40 多篇文章,平均 1 秒生成 1 篇,随机抽取其中一篇,分数已赶超约 75%高考考生。
紧接着,度晓晓带着她的画作参加了西安美术学院 2022 年“时空留痕·无界西美”本科毕业展,开设了自己的专属展区。她平均只需数十秒就能完成一幅有意味,充满鲜明艺术特质的画作,被美院老师评为已经具有毕业生水平。
这两件事当然让 AI 数字人实力出圈。而在行业内人士看来,这两件事的核心意义在于,文心大模型做了两道难度非常高的技术证明题,展示了大模型不是只能纸上谈兵,而是能够应对真正的产业场景。
在以往的大模型测试中,所使用的基本是内容固定、方向单一的数据集。这种测试当然有一定价值,但却与产业中需求多样、数据样本稀少、用时要求苛刻的环境有天壤之别。
比如说高考作文写作就是这样一个任务。高考作文比一般的文本生成任务更长,而且需要保证长文各个段落之间的逻辑性和连贯性。与此同时,写作需要彻底理解并且紧扣主题,从而保证中心突出,确保所有信息准确指向踩分点。这种真正考人,而不是考 AI 的任务,就是对大模型的一个巨大挑战。在 AI 写作高考作文中顺利完成任务的,是百度使用了最新推出的文心·NLP 大模型 ERNIE 3.0 Zeus。它就像个见多识广的“尖子生”“学霸”,理解能力和创作能力比传统模型更强。最终展现在我们面前的,就是一篇文辞华美、立意准确的高考作文。
再说说参加毕业画展。我们知道,大模型的特征之一就是不仅能够处理自然语言处理任务,还在机器视觉、跨模态、知识图谱等领域取得了巨大进展。度晓晓在美院画展上创作的“无界”系列画作,从不同角度诠释了 AI 理解的“无界”,就展现出了文心大模型跨模态图文生成模型 ERNIE-ViLG,所具备的强大跨模态理解和生成能力。
跨模态理解信息,生成内容,是人类智力的专属价值,也是 AI 的核心努力方向。根据题目创作画作,需要 AI 对给到的信息进行深度理解,紧接着结合自身联接的知识进行信息拓展,进而阐述创作的灵感,最终再以跨模态生成的方式完成画作。文心大模型的这一系列操作行云流水,而且真正做到了信息准确与艺术表现力的统一。这种智商与情商兼具的艺术家,其实才是最难得的。
这两件出圈之举,可以说是文心大模型回答的证明题:向业界证明了 AI 大模型不仅能够堆参数,跑数据集。还能够无差别参加那些只有人类才能参加的活动,并且给出不属于人类的完成水准。我们已经不需要谨小慎微地给大模型出题了,广阔天地,四海八方,或许都是 AI 可以参与一答的题目。
当然,写作文与作画背后,不仅是文心大模型的技术能力自证,同时也是 AIGC 产业方向的清晰标识。能够写文作画的 AI,当然也可以在更多内容生产中大展身手。比如 AI 写歌、AI 剪辑等等。
于是,刚刚放下答题纸和画笔的文心大模型,就跑去写了首歌,顺道组了个 CP。
再来看看“多选题”:和龚俊组 CP 展示出的应用价值
毕业季中,走向社会的年轻人不仅需要证明自己的能力,还需要选择清楚自己的道路——大模型当然也是如此。
于是我们看到,大模型正在越来越多的岗位发光发热,并且还是与明星一起。6 月 14 日,度晓晓与龚俊数字人联合演唱的《每分 每秒 每天》歌曲 MV 成功刷屏。这是国内首支从作词到编曲都是由 AI 来完成的虚拟偶像单曲。
此外,度晓晓与龚俊数字人已经入驻百度 APP。在用户使用百度 APP 的时候,可以通过搜索框或者底部的语音按钮发起聊天类需求。比如用户说“你好,你多大了,我想你了,我想聊天”,会直接进入搜索负一楼的对话式框架。度晓晓 &龚俊数字人会在负一楼陪伴用户,进行具有深度的语音对话。
为了这份随时随地的陪伴,文心大模型提供了整合了多模态交互技术、机器翻译、语音识别、自然语言理解等多项能力,从而实现了个性化聊天陪伴、辅助搜索、服务分发和互动玩法四大功能为一体。在百度 APP 中,用户可以直接通过个性化聊天来感受大模型的能力和魅力。文心大模型可以呈现出有上下文联系,自然生动的聊天互动,并且在对话中识别用户是否有搜索需求、服务类需求等进行辅助。而这背后,是全球首个生成式开放域对话大模型 PLATO。
PLATO 当然有着一系列技术差异性,但或许更重要的是,它清晰展示出了预训练大模型如何与具体的应用场景、实际应用任务相结合。大模型的价值清晰展现在了对以往 APP 交互的超越上,通过开放域对话大模型,APP 可以向用户提供超越以往搜索服务与语音助手服务的全新价值。其体验更加接近与真人互动,并且比传统的关键字搜索会更加人性化、更有针对性,能够更加准确理解用户的需求。
大模型的应用价值,不在于能够替代此前的某种技术。或者说不仅于此,而是可以做出“多选题”,集成多样化的价值,应用于多样化的产业需求。
在数字人生成、智能客服、AIGC 等等领域,可以看到文心大模型都有着真实且广泛的产业级应用落地。
一起来做这道“开放题”:大模型刚刚毕业,却已经走向百业
也许那边的朋友要问了:这么好的大模型,什么时候才能体验到呢?答案是,现在。
文心大模型已经是一道开放题,等待着千行百业的你来一起写画她的毕业作品。
举个例子,上文提到的 ERNIE 3.0 Zeus 是文心大模型最新发布的融合任务相关知识的千亿大模型,也是国内首个开放 API 调用的千亿大模型。该模型在学习海量数据和知识的基础上,进一步学习百余种不同形式的任务知识,增强了模型的效果,在各类 NLP 任务上表现出了更强的零样本和小样本学习能力。而 ERNIE 3.0 Zeus 的智能写作功能目前已经上线旸谷社区,开发者可以即可体验到这些前沿技术带来的价值。
既很强,也很落地,或许可以被称为文心大模型的毕业季口号。这背后是文心大模型的两大核心特色:产业级和知识增强。
“知识增强”是文心大模型的核心技术差异,即通过引入知识图谱,通过“知识增强”的方法,将数据与知识融合,使得文心大模型相较于其他模型,学习效率更高、可解释性更好。这是文心大模型能够超越众多“同学”,率先走向就业的技术保障。
而“产业级”则是百度在大模型落地领域的经验、技术、产品设计与生态培养等等能力的融合。一方面,文心大模型的技术来源于产业,从设计与技术上就倾向产业应用;另一方面,文心大模型建设了一系列配套能力和工具,通过多种方式降低大模型应用门槛,提升其真实应用的可行性。
在这两大特性的保证下,百度在全球范围内开启了一场让大模型走向产业的“毕业旅行”。写高考作文,画毕业作品,与明星一同写歌,都可以看作这场旅行中的一些风景。在更广阔的产业原野上,百度还将文心大模型不断升级,瞄准各行业的智能化需求。不久之前的 WAVE SUMMIT 2022 深度学习开发者峰会上,文心大模型迎来一系列升级:发布 10 个新的大模型,同时提出了基础大模型、任务大模型、行业大模型构成的三级体系。让不同的应用场景、行业需求有不同的大模型支撑,真正让大模型走向千行百业。与此同时,考虑到开发者、应用者不同的使用需求和开发能力,百度还围绕文心大模型提出了一系列产业落地的关键路径,比如建设更适配场景需求的大模型体系,提供全流程支持应用落地的工具、平台和方法,建设激发创新的开放生态等。为促进大模型惠及最广泛的行业与开发者,配套发布大模型套件、API 体系,以及旸谷大模型创意社区,全方位帮助开发者更低门槛地应用。
如今,智能作画、智能对话、智能创作、故事生成等大模型创意应用已经上线旸谷社区。百度与国家电网、浦发银行等行业头部企业进行了联合研发与创新,成功实现了行业大模型在产业中落地生根。
从应用深度上看,在百度内部文心大模型也全面应用于智能搜索、信息流、智能音箱等互联网产品,大幅提升了用户获取信息、知识和服务的效率和体验。在百度之外,文心大模型的落地应用已经覆盖工业、能源、教育、金融、通信、媒体等众多行业,例如工业领域的零部件质量检测、能源领域的输电线路巡检、金融行业的合同信息抽取等等,帮助企业实现智能化升级。
百度业务中看得到,产业应用里用得到,开发者找得到,让文心大模型做成了一道开放题。它的答案,是人人都能成为大模型开发者,行行都能成为大模型应用者。
《经济学人》最近发了一篇关于大模型的文章,其中提到文心 ERNIE 大模型是中国最好的预训练大模型。就我的理解,文心大模型好就好在它的“真”。
真实的解决技术难题,而不是用多少亿的参数,百分之九十九点多少的分数来证明自己。
真诚不套路的去用,去证明自己的价值。而不是画饼充饥,用 PPT 展示未来。
真正地融入产业,融入需求,赋能开发,筑造生态。
或许,每个人在校园里都许下过改变世界的梦想。后来有人真正实现了,有人没有。
差别可能就在于毕业季到来的那天,我们选了什么,做了什么。
致用,务实,本分,这才是大模型的花样毕业季。
评论