AI 大模型,如何破圈而出?
一年即将过去,回望整个 2023,我们会觉得这是一个毫无疑问的“AI 大模型之年”。这一年里,全球兴起了数百个大模型。根据相关报道,仅仅在中国就有超过 200 个大模型,形成了名副其实的“百模大战”。
但有个问题不知道大家注意到没有?大模型虽多,但真正用到大模型的企业和行业却很少。绝大多数大模型都困守在一个小小的“点”里,只能刷榜、跑分、发论文,却无法真正走到行业应用的山川大河当中去。或多或少有点“圈地自萌”的味道。
AI 大模型真正走向成功,不是拼数据参数和模型规模,而是看最终的价值深度与广度。大模型需要破圈而出,到行业手中去,到企业手中去,到用户手中去。
那么,大模型的破圈运动究竟如何实现?华为云在盘古大模型的发展进程中,给出了一个答案。
近期,以“开放同飞,共赢行业 AI 新时代”为主题的华为云盘古大模型主题论坛·深圳站成功举办,现场发布了基于盘古大模型打造的三大基础解决方案和华为云 AI 出海计划。
其间,华为云 Marketing 部部长董理斌发表“AI for Industries,开放同飞,共赢行业 AI 新时代”主题演讲,他表示:“为了让每个行业、每个企业都能快速使用和构建大模型能力,实现基于大模型的创新升级,华为云将坚持‘AI for Industries’,以盘古大模型为核心,持续技术创新;以昇腾 AI 云服务为基础,为企业提供澎湃的 AI 算力供给;以联创方式使能场景化创新,激发解决方案繁荣。同时,华为云还将提供大模型开发工具链、AI 能力调用与联合创新的应用模式、全域协同生态体系和全球化推广策略,与客户伙伴开放同飞,加速商业共赢。”
总结分析华为云围绕盘古大模型指定的推广与赋能策略,会发现大模型破圈有三个维度的工作需要完成。这些经验,可以被云计算与 AI 行业吸收。
AI 大模型,为什么很难破圈?
提到 AI 大模型,我们总是会强调模型参数、数据规模,以及刷榜、评分等内容,却很少讨论大模型如何真正被行业与企业所运用。仿佛本应与行业充分结合的大模型,却遇到了一些无形之墙,被困在非常局促狭小的学术空间内。
究竟是什么原因导致了这种现象的出现?
我们所处的物理世界是一个三维空间,X\Y\Z 三个轴构筑了三维空间的坐标。把这个比喻用到大模型上,会发现 AI 大模型在这三条轴上都会遇到困难与挑战,从而限制了自身的发展可能性。这三面墙包括:
1.技术之墙。大模型走向行业应用,首先是会遇到一系列技术问题。其中包括最为著名的 AI 算力稀缺问题,也包括大模型在调参、部署阶段很容易遇到的工具匮乏难题,应用生态支持不足挑战。从算力到应用,AI 大模型在每一个栈层都可能遇到技术卡点,从而使整个大模型落地变成了一个木桶效应,即一个问题无法解决会导致一连串的障碍。
2.场景之墙。在技术维度之外,大模型还必须兼顾行业用户自身的需求、特性与知识。不同行业对大模型的需求既有共性又有特性,需要完整的场景化解决方案来支持,从而实现高效率、低成本应用大模型,而这一点在目前的大模型行业当中还是非常匮乏的。
3.地理之墙。很多人没有注意到,围绕大模型的还有一道地理之墙。伴随着企业出海、全球化运营成为新的商业风尚,大量企业需要在全球范围内获得一致性的 AI 大模型技术支持与应用体验。而这一点对云计算供应商的全球化基础设施建设与全球运营能力提出了极大的考验,在目前阶段更是一致稀缺资源。
这三面墙的存在,极大限制了大模型的应用范围。反过来说,大模型想要出圈、破圈,也必须打破这面墙,实现大模型从一个点,到线、面、体的多维度进化。
盘古大模型,在三个方面同时做出了探索与尝试,这在目前的大模型领域中可谓独树一帜。
X 轴破圈:构建从算力到应用的全栈支持
盘古大模型实现的第一个“破圈”,是从技术上打通大模型落地的卡点,解决从算力层到应用层的一系列大模型挑战。
作为模型层核心的盘古大模型,其本身就提供 5+N+X 的三层解耦架构,天然具备良好的生态开放性。通过模型与算力、工具、生态的结合,盘古大模型可以解决行业用户多元且复杂的大模型需求。这种“技术破圈”, 主要体现为围绕盘古大模型进行上下两个方向的延展。
首先是向下打通算力基座。
在算力层,华为云昇腾 AI 云服务,可以有效解决 AI 算力稀缺,企业排队等待的一系列难题。华为云在贵安、乌兰察布、芜湖打造了 3 大 AI 云算力中心,可以为企业提供澎湃的昇腾 AI 算力。与此同时,企业和开发者还可以通过“华为云昇腾 AI 云服务百模千态专区”直接使用业界主流的开源大模型,比如 LLaMA,百川等。
接下来是向上打通工具与应用生态。
为了更好赋能企业用户与开发者,华为云在模型基础之上还提供一系列技术与生态的赋能方案。这些能力可以解决大模型在调优、开发、应用落地过程中的难题,打通大模型到行业应用的最后一公里。总体来看,其中包括:
3 大全流程工具链:从算力调优、通用 AI 开发、到大模型开发,帮助企业一站式加速大模型开发效率。
2 种应用模式:企业可以通过 API 直接调用盘古大模型能力,也可以基于盘古大模型,结合自有数据定制企业专属的大模型。
1 个全域协同生态体系:华为云面向软件伙伴、服务伙伴、咨询与系统集成伙伴三类伙伴开放全方位的大模型生态合作路径,并提供 AI Gallery 和云商店 KooGallery 平台,为大模型资产变现、知识共享、商品上架、交易推广等提供完善的平台支持。
1 个全球化推广策略:华为云将在全球各区域节点加速上线盘古大模型、AI 算力及调优的开源大模型等,通过能力共建、商机共享、商业加速,与客户、伙伴共享 AI 价值。
这个 3+2+1+1 的模式,打通了大模型从开发工具到应用生态的系列难题,从而使大模型不仅可训练、可部署,还能得到完善的运营与商业化支持。
从昇腾 AI 云服务,到盘古大模型体系,再到“3+2+1+1”赋能,一条完整的大模型全栈支持链就被塑造了起来,企业用户不会在任何一个栈层遇到大模型的卡点。
Y 轴破圈:走向场景,释放生产力
接下来行业与企业用户面临的大模型问题,是如何以最高效率、最低成本,将大模型变成自身所需的场景化解决方案。要知道,大模型技术非常新颖,企业进行解决方案开发的难度非常大。同时不同行业之间又有众多应用大模型场景的共性,频繁重复开发会造成成本的极大浪费。
为了解决这个问题,华为云围绕盘古大模型打造了三大基础解决方案,从而可以帮助客户、伙伴更快实现面向细分场景的 AI 解决方案创新,降低大模型应用门槛,实现大模型技术与行业场景高效率融合。其中包括:
1.盘古大模型+搜索解决方案。
搜索是大模型在行业应用当中的主要场景,尤其在金融、政务、医疗等行业中,搜索可以提供知识问答、文档问答等应用,从而极大释放行业生产力。盘古大模型通过与行业知识库深度融合,并结合搜索、GaussDB 向量数据库、精排等技术,可以提升搜索在语义理解、泛化能力、准确度等方面的能力,实现实时知识获取、精准问答、结果溯源。以金融行业为例,应用盘古大模型+搜索解决方案,座席知识问答场景服务效率能够提升 10%。
2.盘古大模型+数字人解决方案。
伴随着数字人的不断发展,与大模型结合的数字人受到了越来越多行业的青睐。在智能客服、电商、企业办公当中有极大的生产力提升作用。盘古大模型+数字人解决方案,可以为播报交互、智能客服、办公助手等各种数字人应用场景提供支持。盘古大模型加持的数字人大脑中枢,能够提供精准意图理解、用户隐私和安全保护、插件中心三大能力。基于该方案的数字人创作效率可以提升 200%,并且全面提升数字人的最终交互体验。
3.盘古大模型+RPA(智能流程机器人)解决方案。
流程机器人的应用非常广泛,可以有效作用于政务、金融、法务、财务、零售、人力资源等领域。盘古大模型+RPA(智能流程机器人)解决方案,充分发挥了盘古大模型和 RPA 产品 WeAutomate 的核心优势,支持大模型自然语言交互调用 RPA,执行误差率低于 0.05%,合法合规遵从度 100%,大幅降低人工操作的准确性和合规性风险。
场景化解决方案的出现与发展,将进一步降低行业用户的大模型应用难度,消弭开发成本。通过盘古大模型的场景化解决方案,搭配专属模型的调参订制能力,企业可以找到适合自身需求的最佳大模型方案,从而打破大模型的场景之墙,让大模型真正融入行业。
Z 轴破圈:大模型出海正当时
大模型与企业出海、企业全球化运营的结合,是一个尚未得到有效关注的话题。但事实上,在全球对 AI 大模型关注极高,以及中企出海迎来高潮的背景下,大模型的全球化支持其实至关重要。
获得全球一致的大模型体验,企业就可以更加从容地进行智能化升级,以大模型能力作为全球范围内的企业竞争力,从而构筑出独特的智能化产业优势。为了帮助企业以 AI 之帆驾船出海,华为云推出了 AI 出海计划。
能够实现这一点,是因为华为云始终坚持全球化发展策划,华为云 KooVerse 全球一张网已经在全球打造了 50ms 时延圈,成为出海企业的首选。在此基础上,华为云 AI 出海计划将在海外节点陆续上线大模型全栈技术成果,帮助出海企业构筑大模型优势。
其中,在算力方面华为云将在 2024 年陆续在全球范围内提供 AI 双栈算力服务,满足全球多样化的 AI 算力需求。
在模型层面,华为云将在海外节点率先上线盘古自然语言、视觉、多模态、科学计算、预测等大模型能力。其中,自然语言大模型支持英语、阿拉伯语、泰语等多国语言。
在开源大模型方面,华为云明年将在海外节点陆续上线调优适配自然语言、视频图像及多模态等多种类别 100 多个开源大模型。满足企业多样化的大模型需求。
董理斌表示,未来十年最大的机会是人工智能,大模型时代已然开启。
通过全栈技术构建、场景化解决方案落地,以及 AI 出海的发展,大模型将不再仅仅发挥一个点的局限作用,而是可以打通界限,将价值释放到行业场景、企业生产,以及用户体验当中去。
最终,一个每家企业都能快速、高效、低成本构建大模型能力的时代将会到来。
大模型的价值的深度与广度,将在这个时代中熠熠生辉。
评论