写点什么

IT 行业,抢滩大模型

作者:脑极体
  • 2024-01-17
    天津
  • 本文字数:3642 字

    阅读完需:约 12 分钟

哪些公司在做大模型?面对这个问题,我们首先会想到大型互联网公司和 AI 创业公司。他们更多是做大模型算法本身,以及围绕大模型的上层应用。

但顺着这条产业链向下看,却会发现在 AI 芯片与 AI 算法之间,还有非常关键的一层,这就是 IT 层。围绕 AI 大模型的爆发,产生了一系列存、算、网等 IT 设备升级,以及 AI 数据中心、私域大模型的市场需求。这些需求持续上涨,带来了 IT 行业的又一次爆发。


所以,当我们在讨论大模型产业链的时候,不能离开 IT 行业与 IT 企业。从 2023 年到现在,可以看到各个主要 IT 厂商纷纷出牌,抢滩大模型的新机会。这种趋势将在 2024 年持续上升,产生更加激烈的市场竞争。

IT 大厂面对大模型,首先是做产品,找切口,继而开始形成连贯的智能化战略。

本文中我们希望和大家一起读懂,IT 企业为何要抢滩大模型,又是如何实现这一战略目标的。

走向第三春:大模型带来的 IT 市场迭代

AI 大模型的爆发,客观上给 IT 企业带来了巨大的机会。这是由于传统的 IT 设备,大多数都无法满足 AI 大模型的训练与部署需求。其中最知名的,就是 AI 需要专项算力。于是就产生了 AI 服务器这个全新的 IT 市场。再比如集群化 AI 训练,需要对数据中心的网络设备进行全面升级,以此来避免珍贵的 AI 算力在集群化过程中被浪费。

这些由大模型特殊性产生的 IT 设备迭代需求,伴随着 AI 技术的爆发给 IT 市场格局带来了显著影响。比如,根据 TrendForce 此前发布的数据,2023 年全球 AI 服务器(包含搭载 GPU、FPGA、ASIC 等)出货量应该可以达到 120 万台,年增长率高达 38.4%,并且市场规模上将占到整体服务器市场出货量的近 9%。

如果这种情况持续下去,AI 技术专项适配的 IT 设备,既是目前阶段的增长爆发点,也可能是未来市场的主流需求。因此没有 IT 厂商可以放弃大模型带来的战略契机。

回溯 IT 市场的发展历史,行业内经常将过去划分为早期 IT 市场的信息化时代,以及互联网兴起之后的数字化时代。那么伴随着 AI 大模型的全面渗透,市场很可能将迎来 IT 第三春,也就是智能化时代。

在智能化契机的序曲当中,还有一条不能忽视的主线,那就是 IT 技术的国产化。尤其在 2023 年,伴随着 AI 芯片禁令的反复炒作,AI 算力国产化成为科技自主可控趋势中的重中之重。

国产化意味着新需求。这一需求与 AI 大模型带来的市场需求交融在一起,加重了这一轮 IT 市场迭代的分量。

面对走向 IT 第三春的可能,各个厂商纷纷开始寻找自己的 AI 市场切入口,同时注重提升自主可控 AI 产品的占比。

而分析 IT 厂商实现这一目标的战略,我们可以将其归纳为以下三种。

以高度,赢广度

IT 厂商在切入大模型机遇时,首先要解决客户信任的问题。AI 相关的 IT 基础设施选择很多,且差异化较小,用户试错成本巨大。所以如何能够与客户建立技术及解决方案信任是关键。

破解这个难题,有这样一种思路:厂商首先来把最核心、最难的事情完成,再通过核心市场来影响普及市场,形成以高打低,以高度赢广度的市场格局。

而 AI 领域的核心任务有两个。最复杂、庞大的基础设施是 AI 计算中心,而最复杂的 AI 任务是 AI for Science。


而在这两个维度布局最深,并且已经赢得口碑的,应该是中科曙光。

AI for Science 为代表的“重型 AI”需求,具有算力规模大、多元算力融合、服务需求水平高的一系列特点。为了切入这个领域,早在 2022 年曙光就完成了算力一体化平台的开发及布局。依托各类算力中心,以原生的底层资源、市场化运营机制、开放生态体系,以及大量增值服务为支撑,为用户提供集“算力、数据、应用、运营、运维”的一体服务。

这一战略的代表性成果,就是曙光推出的 5A 级智算中心。在智算中心场景中,需要集中呈现厂商的技术、资源、生态、产学合作等 AI 行业要素。需要完成从技术投入到解决方案构建,再到运营支持、生态建设的一系列工作。因此在东数西算背景下,能够获得大量认可的智算中心,就会成为整个智能化 IT 生态中的战略高地,满足更多用户对厂商 AI 技术能力与生态能力的信任。

陆续建设并投入使用的 5A 智算中心,也就成为曙光在切入 AI 机遇时的高点。广泛带动了曙光在 AI 服务器、存储等领域的发展。同时,曙光在 AI for Science 的积极布局与成功经验,也成了其持续挺进 AI 机遇时的核心差异化要素。

目前来看,“以高带广”是 IT 厂商走进智能时代一个行之有效的策略。

以算法,带设备

相较于互联网企业与 AI 公司,更多有 IT 需求的企业其实并不了解 AI,同时也很难探索满足自身业务需求的大模型落地方案。这也就导致更广泛的客户难以向 AI 方向转化。为了解决这个问题,在 2023 年我们看到了 IT 厂商开启了一种比较超越常规的探索:自己做 AI 大模型,并且开源。

去年 11 月,浪潮信息对外发布了完全开源且可免费商用的源 2.0 基础大模型。这个系列的 AI 大模型包含 1026 亿、518 亿、21 亿等不同的参数规模。对外称为是国内首个千亿参数、全面开源的大模型。在能力应用上,源 2.0 大模型可以执行多种任务,比如数理逻辑、代码生成、知识问答、中英文翻译、理解和生成等。

作为硬件供应商的 IT 企业,去做纯软件的开源大模型,似乎是一件打破常规的事。但在浪潮信息的动作中,我们却可以看到这个策略在“打开 AI 机遇切口”上的合理性。


首先,训练大模型的基础是硬件能力,尤其是算力能力。同时也会展现出厂商对软硬件适配能力的理解。比如说在算力层面,源 2.0 就采用了非均匀流水并行的训练方法,综合运用“流水线并行+优化器参数并行+数据并行”的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题。这个方法为硬件差异较大的环境提供了新的训练方式。这样的经验展现、路径探索,可以帮助 IT 厂商更紧密了解客户的 IT 环境与 AI 训练需求,从而提供准确的产品及服务。而对于用户来说,先看懂厂商如何做算法,也可以有效指导自身的 AI 算法尝试,从而可以推动尝试与客户间的 AI 合作关系。

另一方面,IT 厂商推出开源且可免费商用的大模型,等于将大量潜在客户的算法应用门槛降到最低,让他们可以开始尝试大模型。而在尝试成功之后,客户也自然会更倾向于开源模型背后,原厂提供的 IT 设备,从而实现了以软件带动硬件的市场策略。

这种策略能否收获积极的市场反馈,在 2024 年引起行业的效仿和跟随,让我们拭目以待。

以全栈,降门槛

在 IT 行业中,企业需要坚持产品和解决方案两条腿走路的策略。前者主攻出货量,而后者可以带来更为可观的利润空间。

而在 AI 大模型机遇到来时也是如此。相对来说,本身 AI 能力较强,应用相对成熟的企业会考虑购买 AI 相关的存、算、网 IT 产品。但更多的企业则没有强大的 AI 能力,但又对智能化能力有着需求和期待。这种情况下,就需要 IT 企业以解决方案的模式进行 AI 能力交付,从而降低企业的 AI 大模型门槛。

这也就引出了 IT 厂商入局大模型的第三种思路:发挥自身的全栈技术优势,提升解决方案交付能力。在降低企业 AI 应用门槛的前提下,获得更好的商业回馈。

这一点,可以说是 IT 厂商面对大模型机遇时的普遍选择。各家都是重兵投入,集结力量。一般来说,AI 大模型相关的硬件设备有算力、存储、网络和商用终端,而在硬件基础上还有 AI 开发平台、管理平台、私域大模型等软件能力。在这各个领域有广泛布局的 IT 厂商,也就有了拥抱大模型机遇的更大底气。


比如说,新华三面向 AI 大模型机遇,打造了百业灵犀 LinSeer 私域大模型,定位是为企业用户提供定制化服务的私域大模型。可以提供资料分析、代码编写等服务,覆盖了政府政务、工业制造等诸多领域。百业灵犀 LinSeer 私域大模型,可以与新华三此前的一系列 AI 布局进行结合,比如训练型智算服务器、推理型智算服务器、绿洲平台、傲飞算力平台、无损网络,高性能存储、液冷解决方案等,能够综合性帮助客户一站式部署智算底座,快速搭建 AI 场景化应用。

这种尽量发挥自身全栈技术优势,打通 AI 大模型所需软硬件底座的模式,在很多 IT 厂商的最新动作中都有展现。比如联想推出的大模型解决方案及服务,就包括智算中心、AI 平台、AIforce 的“三位一体”。面向私域大模型市场,联想也推出了帮助企业构建私有化大模型平台的服务,其依托于一站式端到端的解决方案与陪伴式服务,让客户不必考虑部署细节,就可以快速获得大模型能力。这一解决方案的建立,也融合了联想在 IT 基础设施、IT 服务、AI force 平台,以及智能终端领域的多种能力。


这种尽量将自身产业优势结合,形成整体性解决方案,从而提供低门槛 AI 获取方式的能力,是 IT 企业切入大模型机遇核心策略。比如我们可以看到新华三在切入大模型领域时,就将自身在网络、液冷等方面的优势融合进来。而联想则将自身在商用终端、AI 能力平台上的积累纳入整体方案。

这种通过能力融合来构建差异化的策略,将在接下来 IT 厂商布局 AI 业务时展现得更加清晰。


整体来看,IT 厂商抢滩大模型,是一种综合能力的考验,同时也需要厂商有调动、整合的能力,从而实现高举高打的系统性战略。

在这个过程中,有三个要素尤为关键。

一是厂商能否将多元化的布局协同起来,通过能力整合发挥出自身独特的 AI 优势。

二是能否实现软件侧对硬件侧的补充,甚至通过软件创新反哺 IT 基础设施市场。

三是技术自研以及全面国产化的能力,这点将在科技自主可控的浪潮中不断变得更加重要。

可以说,IT 行业的 AI 迭代与智能化竞赛,才刚刚拉开序幕。

发布于: 刚刚阅读数: 2
用户头像

脑极体

关注

还未添加个人签名 2020-06-12 加入

还未添加个人简介

评论

发布
暂无评论
IT行业,抢滩大模型_AI_脑极体_InfoQ写作社区