百度沈抖:主力模型免费,是为了最大限度降低企业创新试错成本
5 月 28 日,2024 智能经济论坛在北京举行。会上,百度集团执行副总裁、百度智能云事业群总裁沈抖介绍了文心系列主力大模型免费背后的原因。此外,为了加速行业大模型的落地,百度智能云推出“千帆·行业增强版”,目前已经在政务、交通、工业等行业落地。
沈抖表示,为什么能把价格打下来?主要是依托于技术能力,尤其是百度智能云有业界最高效的 AI 异构算力管理平台和“一云多芯”两项硬实力。目前,文心大模型已经拥有中国最大的产业落地规模,超半数央企正在联合百度进行 AI 创新。
(百度集团执行副总裁、百度智能云事业群总裁沈抖)
揭秘主力模型免费原因,每年为企业节省 50 亿智算成本
“其实我们决定免费的原因特别朴素,就是希望大家别再天天拉表格比价格了,有这个时间,不如去卷场景、卷应用。现在成本更低了,大家创新的胆子可以更大一些、步子可以更快一些,把相关的场景都试一遍,快速验证。跑成功了,就快速复制。”沈抖表示。
一周前,百度智能云宣布 ERNIE Speed、ERNIE Lite 两款主力模型全面免费。据了解,本次免费的两个模型是客户在场景应用中经常用到的主力模型,在文案创作、聊天对话、知识问答、内容续写等场景中有非常高的调用量。
会上,沈抖首次揭秘了模型免费背后的原因,以及为什么能把价格打下来,主要是依托于技术能力,尤其是业界最高效的 AI 异构算力管理平台和“一云多芯”两项硬实力。
首先,百度百舸·AI 异构计算平台能够对不同地点、规模、集群的智能算力进行统一、高效的管理,基于芯片性能优化、自动芯片选型、潮汐混部等技术,大幅提升智能算力效能,万卡集群上的模型有效训练时长占比超过 98.8%。相同的大模型任务,百舸能够帮助客户将资源成本降低一半。据推算,百舸每年为企业客户节约的智算成本可达 50 亿元以上。
第二,在“一云多芯”方面,百舸兼容昆仑芯、昇腾、海光 DCU、英伟达、英特尔等国内外主流 AI 芯片,支持同一智算集群中混合使用不同厂商芯片,最大程度上屏蔽硬件之间差异,帮助企业摆脱单一芯片依赖,打造更有性价比、更安全、更具弹性的供应链体系。在多芯混合训练任务中,百舸能够将单芯片利用率、芯片间通信效率、集群整体效能发挥到极致,百卡规模性能损失不超过 3%,千卡规模性能损失不超过 5%,均为国内最高水平。
此外,在模型层面,千帆 ModelBuilder 提供的模型路由能力,能够针对任务类型自动分配合适的模型进行处理,让更便宜的小参数模型在特定场景中媲美大参数模型的效果。以小度 AI 助手为例,通过使用模型路由能力,相比全部任务调用旗舰版文心大模型,成本大幅下降了 99%,模型响应速度也提升了 200%。“即使是在复杂应用场景下,模型路由也可以节省 30%的成本。”沈抖说。
目前,文心大模型日均调用量超过 2 亿,每天处理的文本相当于 74 万本《新华字典》,已经成为中国落地应用最广的大模型。千帆平台累计服务 10.5 万家企业用户,累计帮助用户精调了 1.75 万个大模型,帮助用户开发出了 32 万个 AI 原生应用。
推出“千帆行业增强版”,加速行业大模型应用落地
在行业落地中,仅靠大模型的通用能力很难满足各行各业的特有需求,而是要在通用大模型基础上增强行业专业性,同时降低行业应用开发门槛。
沈抖指出,行业大模型本质上是一个多模型的行业解决方案,由一个通用大模型和多个行业模型组合而成。这些行业模型往往由小模型精调而成,在特定领域具有很强的能力。但企业应用场景十分复杂,如果只是用一个个“孤立”的行业模型去解决特定场景的问题,那么整套工程将会非常复杂,和传统的 AI 开发没有区别,开发效率极低。
因此,为了进一步降低行业大模型的开发门槛,百度智能云此次推出了千帆·行业增强版,将通用大模型的理解、生成、逻辑、记忆能力,与行业模型的专业能力相结合,搭配体系化的工具和组件,支持从资源管理、大模型服务到应用开发的全过程。
(百度智能云千帆·行业增强版)
具体来讲,千帆·行业增强版主要由资源服务、大模型服务、应用服务三部分组成,它不仅提供千帆、百舸的通用能力,在这个基础上,还做了行业能力的扩展和适配。在资源服务方面,企业可以结合业务情况,扩展多源数据治理、云边端协同等能力,为业务构建起强大的基础设施;在大模型服务方面,企业可以在千帆平台上自由选择不同参数规模、不同上下文长度、不同细分领域的大模型,然后按需扩展行业模型、行业知识、行业智能体;在应用服务方面,支持添加运营、运维、企业环境内应用开发、应用服务等各类业务逻辑。
在千帆·行业增强版上,还可以不断的增加新的行业。有了通用底座和行业增强的能力,应用开发范式将彻底改变,复杂的工程会被千帆屏蔽掉,真正实现“场景驱动”。目前,千帆·行业增强版已经在政务、交通、工业、金融等行业落地应用。
比如,在政务领域,中华全国总工会联合百度智能云打造了 AI 法律咨询助手,为劳动者提供精准的法律问题解答、快速计算劳动赔偿金额、生成个性化案情评估等便捷服务。相较于传统的开发模式,整套系统及应用的交付周期从 3~6 个月大幅缩短至 1 个月。
“我们和客户一起整理了所需的专业数据,精调出工会行业大模型,部署在客户的专有云环境。这样,当公有云上的文心大模型完成任务规划、拆解后,具体的任务就会交给工会行业大模型执行,之后文心大模型会汇总结果、做出回答。这样,既满足了数据合规的要求,又得到了非常好的模型效果。”沈抖表示:“为了丰富这个平台的场景化能力,我们还封装了法律问答、案例推荐这些行业智能体。”
中国超半数央企联合百度进行 AI 创新
就在上周,国内大模型行业的价格战已经打响。包括字节、阿里、百度、腾讯、科大讯飞在内的多家厂商宣布降价或免费。不过,多位企业技术负责人表示,价格只是选择大模型的一个考量因素,比起价格,更重要的是模型效果和应用场景。
沈抖表示,目前,百度文心大模型已经拥有中国最大的产业落地规模,超过半数的央企正在使用百度智能云的技术和服务进行人工智能创新。百度智能云总结了过去一年国内客户落地 AI 与大模型的关键问题,并针对性的打造了全栈的技术服务体系。
在交通领域,贵阳市公安交通管理局与百度智能云一起,在贵阳观山湖核心区的 31 个关键交通节点部署了 AI 信控系统。通过引入交通信控大模型,对各路口、各流向的交通流量进行精准感知和预测,动态调节路口信号灯时长,缓解交通拥堵。目前,贵阳市工作日车均延误时长下降多达 15%,全国城市拥堵排名也从过去的第 4 位下降至第 20 位,AI 与大模型功不可没。
在汽车行业,蔚来汽车基于千帆平台,在文心大模型的基础上通过提示词工程打造出了端云协同多模态大模型——NOMI GPT。NOMI 能够自然地与用户互动,成为一个更懂用户、更聪明的座舱 AI 小助手。目前,NOMI 已经陪伴了近 20 万车友家庭,为用户创造更美好的出行体验。
在工业领域,中化信息携手百度智能云,共同探索利用大模型进行新型材料的研发。中化信息基于千帆 AppBuilder 打造的“化小易”知识助手,能够基于自然语言提问,快速检索并回答分子特性、分子合成路线等专业知识,替代了传统的人工查询方式。目前,特定分子的检索效率能够提升 5 倍以上,极大提高了研发效率。
此外,百度智能云还联合上海交通大学,构建了 Al for Science 科研创新平台,孵化了多项首创性科研成果;联合沈阳首府经开区,规划建设了全国首个“场景-平台-模型-算力”全栈部署的 1000P 智算中心,为沈阳特色产业、重点产业提供强有力的算力支持,建设不到 1 年就实现了 10%的投资回收。
评论