写点什么

系列 二 从 GPT 到"通义千问": 国内外大模型技术演进与产业图谱解析

  • 2024-06-26
    浙江
  • 本文字数:2193 字

    阅读完需:约 7 分钟

系列 二 从GPT到"通义千问":国内外大模型技术演进与产业图谱解析

在过去的一年里,大模型的发展可谓是风起云涌,百花齐放。OpenAI 的 ChatGPT 犹如一声惊雷,在全球范围内引发了一场人工智能的盛宴。无数科技巨头、创业公司纷纷跳入这个赛道,希望能分得这块大蛋糕。



放眼全球,微软、谷歌、Meta、DeepMind 等头部企业早已将大模型视为兵家必争之地。

他们投入巨资,招兵买马,致力于打造出性能卓越的通用大模型。与此同时,各行各业也涌现出大量针对特定场景的垂直领域大模型,如医疗、金融、教育等。据权威机构不完全统计,目前全球已经诞生了大几百个大模型,形成了一场声势浩大的"百模大战"。

在这场战斗中,中国不甘落后。事实上,国内大模型的崛起可以追溯到 2017 年。彼时,以清华大学、中科院为代表的科研机构,以及阿里巴巴、百度等头部企业就已开始深度学习和自然语言处理领域的探索。

据业内人士透露,目前国内已有 168 家以上公司涉足 AI 大模型领域。截止到 3 月份的数据,通用大模型有 24 个,用于科研、医疗、政务等公共服务领域的大模型达 40 个。



这些模型大致可分为三类:第一类是自主研发的真原创模型与其它“原创大模型”;第二类是在开源大模型的基础上进行适配和优化,比如 Meta 在去年 8 月开源的 LLaMA 大模型,衍生出了众多不同参数规模的变体模型;第三类是拼装大模型(我们将在后文中详细讨论)。


根据大模型技术发展历史大致可分为三个阶段(更多内容自行查阅相关知识):

  • 萌芽期(1950-2005):这一时期的模型以传统神经网络为主,如卷积神经网络(CNN)等,它们为后来的发展奠定了基础。

  • 探索沉淀期(2006-2019):2006 年,Transformer 模型的诞生标志着神经网络技术的一次重大突破。它引入了注意力机制,极大地提升了机器翻译和文本处理效率,为后续大模型的崛起铺平了道路。

  • 迅猛发展期(2020-至今):进入 2020 年后,以 GPT 系列为代表的预训练大模型开始呈现出爆发式增长。它们展现出了惊人的学习能力和应用潜力,在多个领域取得了突破性进展。

目前,Transformer 家族可谓是百花齐放,既有追求通用性的解码器模型、编码器模型,也有侧重特定任务的编码器-解码器模型。

从开源社区到商业公司,从学术机构到政府部门,全部都在努力撸大模型中。



那么,在轰轰烈烈的技术角逐之外,大模型的商业化进程如何?产业应用成效几何?

在这片神奇的土壤中,大模型正在各行各业大放异彩。比如从办公、游戏到内容创作,从电商、广告到 AI 客服,大模型的身影无处不在。它们正以前所未有的效率和智能,为传统行业赋能,开创全新的发展空间。

下图是京东到家为例,借助大模型,其设计响应速度大幅提升,营销创意更加精准高效。



还有例如在煤矿和保险等领域,大模型也展现了强大的赋能效果,助力一线巡检、专家决策和智能服务,带来显著的效率提升和成本节约。

文娱领域更是大模型的天然舞台,也是大模型最具想象力的应用领域之一。从内容生产到用户体验,处处闪耀着它的身影。在这里,多模态大模型正展现出令人眼花缭乱的创造力。从文字、音乐到绘画、视频,大模型用灵巧的"手"在各种内容形式间自由切换,用智慧的"脑"不断迸发创意火花。

对于内容创作者而言,大模型就像一位全能助手,能帮助他们更高效、更独特地进行创作。在交互体验上,虚拟偶像、数字人等崭新形态,正重新定义着人机交互的边界。

个性化推荐背后,是大模型对海量用户数据的深度理解和匹配。而在 IP 孵化上,无论是角色塑造还是故事架构,大模型都能提供灵感源泉和加速器。



对标 微软、Open AI、谷歌、Anthropic、亚马逊等国内外主要科技公司在大模型和 AI 应用方面的布局与进展,国内与他们的产业链布局是什么样的内?



从基础资源来看,各家企业在算力、参数量、训练数据规模等方面都有不同程度的积累,其中 OpenAI 和 Anthropic 具备一定优势。

基础能力方面,OpenAI 的 GPT 系列模型可谓是业界标杆,微软、谷歌、百度等巨头也纷纷推出了自己的大语言模型。同时,在图像生成、语音交互、知识搜索等细分领域,各家也有针对性的布局。

应用层面则更加丰富多样。在生产力工具上,微软借助 OpenAI 能力,在 Office、Bing 等产品中实现了 AI 赋能。国内企业如百度、阿里、小米也分别推出了文国内企业如百度、阿里、小米也分别推出了文心一言、通义千问、ChatGPT 等对话交互应用。

在内容创作领域,各家重点探索文案、绘画、视频等 AI 辅助生成方案。编程辅助、行业解决方案、智能客服等 ToB 场景也初具雏形。

从 2C 的视角看,基于 LLMs 的创新应用也在加速涌现。例如米家 App 集成了问答功能,剧本杀、游戏助手等垂直细分需求正被满足。

法律咨询、心理陪伴等专业服务供给也将提质增效。当然,这一切能否真正产生用户粘性,尚待时间检验。

整体来看,无论是国际科技巨头,还是国内的产业新秀,都在 AI 浪潮中激流勇进,以期抢占先机。他们从模型到应用、从 2B 到 2C,多点开花,加速布局,共同推动了产业生态的繁荣。

客观来说,虽然大模型在过去一年取得了长足进步,但真正落地应用还处于起步阶段。微软将 ChatGPT 整合到办公软件中,代表了商业化的一种有益尝试。

一些创业公司瞄准垂直领域,开发了智能助手、智能客服等产品,满足了特定场景需求。但就整体而言,大模型距离规模化应用还有相当长的路要走。

一方面,当前大模型的训练成本高昂,部署门槛较高,中小企业难以承担。另一方面,大模型在安全、合规、伦理等方面还存在诸多挑战,这些问题如果得不到妥善解决,将成为商业化的重大阻碍。

此外,大模型的应用开发也需要一定的技术积累和行业理解,许多企业还不具备这样的能力。

我是链接:

系列的第一篇:https://xie.infoq.cn/article/86b392394c9d95d2007a5a774

发布于: 刚刚阅读数: 2
用户头像

还未添加个人签名 2018-10-30 加入

公众号:松子聊数据

评论

发布
暂无评论
系列 二 从GPT到"通义千问":国内外大模型技术演进与产业图谱解析_产业链_松子(李博源)_InfoQ写作社区