写点什么

大模型的现在进行时:走出对话框,走向产业端

作者:Alter
  • 2024-04-25
    浙江
  • 本文字数:3744 字

    阅读完需:约 12 分钟

大模型的现在进行时:走出对话框,走向产业端

大模型热潮涌动了一年多后,越来越多人平复了激动的情绪,开始从客观的视角重新思考大模型的价值和机会。

红杉资本在 Al Ascent 2024 的开场演讲中提到,大模型的创造能力和推理能力,第一次实现了以类似人类的方式进行交互,将支撑起数十万亿美元的市场。

然而和 AGI 的遥远梦想相比,大模型的创业者们却不得不正视摆在眼前的现实挑战:大模型的训练成本高达数千万元,但至今还鲜见杀手级应用,在“先射箭后画靶”的质疑声中,生存仍然是最先要考虑的问题。

一面是重构千行万业的机会,一面是必须要翻越的高山,2024 年的大模型市场,还会翻出怎样的浪花?

01 大模型的数量快速收敛

据不完全统计,国内已经有 200 多个大模型,并且引发了“百模大战”的说法。可稍微理性一些就能明白,“大炼模型”不过是早期过于狂热的产物,不少大模型存在“套壳”的嫌疑,有机会上牌桌中终归只有头部几家。

市场研究机构 CB Insights 发布的《2023 年人工智能行业现状报告》显示,2023 年中国 AI 领域的投融资数量约为 232 笔,同比下降 38%;融资总额约为 20 亿美元,同比下降 70%。大模型热度空前的局面下,资本市场却罕见“降温”。

对 2023 年的融资数据再深挖一层,融资额度在 5000 万元以上的项目只有 26 个,其中还包括少数几家企业的多轮融资。而大模型本就是一门“烧钱”的生意,那些拿不到钱的创业者,注定会悄无声息地消失。

事实也是如此。大模型热潮进入到第二年,真正有机会进入决赛圈的企业,似乎只剩下两个流派。

一派是有资源、有技术、有人才的科技大厂,比如百度的文心大模型、阿里的通义系列大模型、华为云的盘古大模型等。在 ChatGPT 走红之前,这些科技大厂就已经开始探索大模型的方向,对大模型价值的理解也更加深刻。

比如华为云在 2023 年 7 月发布的盘古大模型 3.0,被定位为“一个面向行业的大模型系列”,注意力聚焦在了产业层面。百度创始人李彦宏也曾多次公开表示,“卷大模型没意义,卷 AI 原生应用才有价值。”



另一派是被互联网大厂青睐的明星创业者,目前主要是智谱 AI、月之暗面、百川智能、零一万物和 Minimax,被媒体形容为“大模型五虎”。

五家“独角兽”拿走了大模型领域 40%以上的融资,但总融资额不到 200 亿元,而亚马逊已经为 Anthropic 投资了 40 亿美元,微软对 OpenAI 的注资早已超过 100 亿美元。“缺钱”仍将是国内大模型创业者的常态。

需要说明的是,现阶段的大模型市场远没有到决赛时刻,淘汰赛才刚刚开始,新的大模型仍有机会崛起,一些熟面孔也可能跑不到最后。但可以笃定的是,大模型不是一场毫无章法的无序竞争,并不难猜测接下来的走向。

当前大模型被普遍认可的有三个价值,即效率、体验和创造,且都不缺少落地的土壤:在体验层面优化人机交互,创造层面已经产生了大量的 AIGC 内容,效率层面的直接例子就是编程和研发效率的提升。

而价值体现的唯一路径,正是将模型和各行各业的需求融合。也就意味着,“炼大模型”将是小部分玩家的战场,将大模型的能力落地到千行万业,才是每一个开发者都可以参与其中的事,才会是大模型的终极方向。

02 走出对话框,走向产业端

互联网技术的普及,在很多人眼中是先 To C 再 To B 的路线,不管是电商、搜索还是网络游戏,目标对象都是个体为单位的消费群体,直到国内的人口红利见顶,“产业互联网”的概念才渐渐被讨论。

以至于在大模型浪潮兴起后,不少人想要重走互联网的“老路”。可把视角放大一些的话,互联网的繁荣其实是网络传输技术落地应用的“果”,借用业内普遍将算力比作电力的比喻,算力和数据是“燃料”,而大模型对标的是蒸汽时代的发动机、电力时代的电动机,扮演的是“引擎”的角色。

以电动机为例,在日常生活中无处不在,却几乎没有人会注意到,因为创造价值的是电动机驱动的空调、洗衣机、榨汁机等产品。沿用同样的逻辑,对话式 AI 就像是给电动机加了扇叶,目的是给人们演示电动机的作用,想要进一步释放大模型的价值,必须要走出对话框,走向产业端。

科技大厂选择“面向行业”的原因也就不难理解。尽管大模型产业应用的时间并不长,价值却早已被验证。

早期是科研等领域的试水。

2018 年的时候,谷歌大脑团队就宣布完成了可识别蛋白质结晶的计算机视觉技术,用于辅助多种疾病的药物研发。

预训练大模型诞生后,不少科研机构开始将大模型能力应用到药物研发领域。比如西安交通大学第一附属医院的刘冰教授团队,基于盘古药物分子大模型发现了全球 40 年来首个新靶点、新类别的抗生素,将先导药物的研发周期缩短至 1 个月,研发成本较传统方式降低了 70%。对比新药研发“平均需要 10 年时间、花费 10 亿美元”的铁律,大模型的能力几乎可以用“降维打击”来形容。

然后是大中型企业的探索。

不同于外界印象中的“守旧”形象,拥有丰富私有数据资源的大中型企业,在大模型落地应用中,可以说是名符其实的先驱。

可以找到的案例也更多。蚂蚁金服发布了金融大模型,涵盖理财顾问、保险代理、投研、金融营销、保险理赔等业务;山东能源集团在华为云上搭建了“盘古矿山大模型”,涵盖 9 大专业 40 多个应用场景,推进人工智能大规模“下井”;广发证券通过盘古大模型大幅提升了预测精度,企业财务异常识别准确率高达 90%……有别于自上而下的赋能,大中型企业已经学会了使用工具。



现在越来越多行业开始拥抱大模型。

比起缺乏付费意愿的 C 端用户,一旦大模型释放的生产力被印证,B 端客户对新技术的渴求要更加强烈。

IDC 曾在 2023 年第四季度进行过一场 AI 应用调研,结果显示超过九成企业已经布局了 AI 应用,已经接触大模型并且有明确预算的企业占比 24%、34%的企业开始制定潜在应用场景、35%的企业开始进行试点,仅有 7%的企业对生成式 AI 完全没有规划。历史上的每一次工业革命,都离不开新旧生产力迭代,只要大模型能够做出场景创新,大大小小的企业总能在权衡后做出正确的选择。

不过,大模型的落地是个相当复杂的系统工程,除了在方向上达成共识,还要找到更高效、更普适的路径。

03 终端和大模型加速融合

智能手机、PC、智能汽车、智能音箱等数量庞大的终端,俨然是大模型落地中不可或缺的一环。如果把大模型比作“超级大脑”,智能手机、智能汽车等终端就是人类走向 AI 时代的“器官”。

所以在过去一年中,端侧 AI 的说法被频频提及。

华为在 2023 年 8 月的鸿蒙 4.0 发布会上,官宣了小艺智能助手的升级,不仅支持用户使用自然语言进行交互,还能帮助用户输出小作文、图片、视频等内容;三星将生成式 AI 作为 Galaxy S24 系列的最大卖点,实现了即圈即搜、通话实时翻译、笔记助手;即使是慢了半拍的苹果,也在不久前公布了自己研发的 MM1 多态大语言模型……大模型和终端的融合已经是一种现在进行时。

端侧 AI 的理念,让外界看到了人机交互再次被重构的可能。就像触摸屏淘汰了传统的键盘和鼠标,打开了超级 APP 的格局,大模型让“人机对话”成为现实,和智能助手聊聊天就能点外卖、打车、购物。



倘若只是从“入口之争”的角度看待大模型和终端的关系,不仅和大模型走出对话框的趋势相悖,也低估了终端厂商的决心。

不久前结束的第 21 届华为分析师大会上,华为副董事长、轮值董事长徐直军在主题演讲中提到了两个不应被忽略的信息:

第一个是打造统一的开发者平台,面向鲲鹏、昇腾和鸿蒙生态所有的开发者,将基于华为云打造一个统一的开发者平台,给开发者一个统一的入口,让开发者在这三个生态上自由地移动。

第二个是打造“小艺”超级智能体,基于盘古大模型把“小艺”打造成为超级助手,并把 HarmonyOS Next 打造成为一个原生智能的操作系统,统一 AI 能力底座,构建系统级原生智能。

统一的开发者平台和系统级原生智能,既是进一步打通产业端和消费端的关键,也是对大模型和终端深度融合的注解。

比如开发者可以通过盘古大模型理解和匹配用户的高阶意图,结合意图框架做服务管理和分发,精准地触达目标用户,在电商、政务、金融、教育等场景中提供用户需要的个性化服务;再比如加速大模型工程化,在数据工程、模型开发和应用开发等环节外,不断简化应用部署和分发的流程,原本需要面向不同终端开发不同 APP 的服务,也许只需要唤醒“小艺”就能满足。

刚刚,华为开发者大会 2024(HDC2024)官宣,将于今年 6 月 21 日~23 日在东莞举办。根据 HDC2024 邀请函中释放的信息,会上将发布盘古大模型 5.0,并将和 HarmonyOS Next 鸿蒙星河版同台亮相。同时也预示着,徐直军在主题演讲中的内容并非是在“讲故事”,而是 2024 年即将上演的一幕。

做一个大胆的预测,在 HDC2024 披露更多关于盘古大模型 5.0 以及端模融合的消息后,将有越来越多的终端厂商跟进,讨论的焦点将不再局限于端侧大模型,而是怎么打通生态、怎么为开发者赋能,跳出“入口之争”的思维误区,推动大模型从尝鲜期走向落地期,从“好玩”走向“好用”。

有别于行业端落地的润物无声,数以亿计、乃至十亿计的智能终端,直接影响着普罗大众的体验和感知。终端和大模型的结合,不单单是终端厂商的“战争”,关系着每一个开发者的前途命运。大模型的行业应用和用户教育,不再是两条平行线,2024 年将是交叉的开始。

04 结语

回顾每一次工业革命的历程,比发明更重要的其实是推广,怎么将新技术推向千行万业。

大模型代表的新一轮工业革命也是如此。大模型的价值,不在于有多少参数,甚至不在于有多么“逆天”的能力,而是让大模型被越来越多的人使用,通过场景化的创新产生价值。2024 年也许就是大模型市场的拐点,不再是“炼模型”的时代,而是“用模型”的时代。

用户头像

Alter

关注

还未添加个人签名 2022-03-25 加入

还未添加个人简介

评论

发布
暂无评论
大模型的现在进行时:走出对话框,走向产业端_Alter_InfoQ写作社区