写点什么

AI 加剧 GPU 短缺,解决之道在哪里?

作者:PowerVerse
AI加剧GPU短缺,解决之道在哪里?

随着 AI 模型从企业级训练走向终端应用,对算力的需求迎来全面爆发。

 

最初,GPU 主要用于游戏机和计算机中渲染图像和视频,现在它们已走在人工智能(AI)蓬勃发展的最前沿,作为现代前沿科技不可或缺的基础设施。GPU 能够同时执行成千上万次计算,使其成为机器学习和深度学习等应用所需并行计算任务的理想选择。

 

当生成式人工智能发展趋向蓬勃,并向着代理式人工智能的方向推进,一个让业界关心的问题逐渐凸显:全球 GPU 短缺。

 

英伟达市值的强劲增长是 AI 时代的彰显,显示出新兴科技领域对芯片和算力的海量需求。

 

“芯片荒”构成了从游戏产业到科学研究等多个领域的重大障碍,AI 的发展对算力的巨大需求进一步加剧了这一困境。

 

本文将探讨 AI 技术不断增长的算力需求如何加剧了 GPU 供应短缺,并分析其对科技行业的影响及可能带来的后果。

 

GPU 驱动的 AI 发展浪潮

 

人工智能(AI)应用通常依赖图形处理单元(GPU)来加速计算。GPU 擅长并行处理任务,这使其成为 AI 计算基础设施的重要组成部分。

 

当生成式 AI 在 2022、2023 年让人眼前一亮,到 2025 年代理式人工智能再次刷新大众视眼的时候,人工智能在以一种嵌入式的形态融合进人们的生活。从购物到工作,各行各业对 AI 技术的需求持续上升,大数据分析中 AI 发挥着越来越重要的作用,投研机构在利用 AI 寻找更贴近的投资标的,商业机构在利用 AI 分析有价值的商业洞察。

 

在自动驾驶领域,AI 技术所需的算力支撑和数据处理体现的非常充分。自动驾驶技术高度依赖 AI 来执行导航、目标检测和决策,每辆自动驾驶汽车每天都会生成海量数据(以 TB 计),需要强大的 GPU 进行处理。

 

可以预见,GPU 算力成为 AI 持续发展不可或缺的重要基础设施。

 

GPU 面临短缺

2023 年,根据 GPU Utils 的深度调查,科技巨头们面临着 GPU 短缺的问题。通过与国外各大云服务和 GPU 提供商高管的对话,博客主克雷·帕斯卡尔(Clay Pascal)写道:“我被告知,对于需要 100 或 1000 块(英伟达 GPU)H100 的公司来说,Azure(微软云服务)和 GCP(谷歌云服务)实际上已经没有容量了,亚马逊也接近没有容量了。”

 

在此之前,OpenAI 首席执行官山姆·奥特曼和特斯拉首席执行官埃隆·马斯克抱怨 GPU(图形处理器)不够用。

 

GPU 短缺的问题给芯片需求方带去了不小的影响。

 

1. 游戏行业受冲击

 

游戏产业是受 GPU 短缺影响最严重的行业之一。GPU 是高质量游戏图形渲染的关键硬件,供应短缺使得玩家难以升级设备,引发消费者不满,也可能导致游戏公司损失收入。

 

2. AI 初创企业面临挑战

 

GPU 短缺对小型企业和 AI 初创公司也造成了不小的打击。许多 AI 公司依赖 GPU 进行算法训练和推理。据 Wired 报道,NVIDIA 芯片短缺使得许多 AI 初创企业难以获得足够的计算资源。

 

3. 影响技术创新

 

GPU 短缺还可能拖慢技术进步的速度。TechUK 指出,GPU 供应不足可能会对 AI 产业革命产生负面影响。缺乏 GPU 资源可能会阻碍 AI 新技术的开发和现有技术的优化。

 

由于供应链紧张,NVIDIA CEO 预计 这一情况可能会持续数年。GPU 短缺的影响可能是长期性的。2025 年,随着 AI 项目的建设仍在大量投入,如 OpenAI 的星际之门、亚马逊的网络服务的数据中心和服务器、微软的数据中心等建设,GPU 的需求还将凸显,预测 10 万卡级别的集群正逐步成为 AI 计算的标配。

 

应对 GPU 短缺的解决方案

GPU 供应紧张情况下,部分企业和个人开始寻找替代方案,一个趋势是转向 CPU 计算硬件,部分科技巨头转向 ASIC 芯片开发。还有一种方式是追溯 GPU 算力短缺的源头,通过源头解决短缺问题。

 

这些替代方案也面临困境。无论是转向 CPU 计算还是 ASIC 芯片开发,都依赖实力雄厚的技术和资金支持,而只有科技巨头才有这种选择。

 

对于大量中小企业或许多小型 AI 初创公司来说,这不是最好的选择。

 

困境需要回到源头解决。

 

一方面,产能端是 GPU 缺货的一个问题。作为 GPU 的两大支柱,CowoS 封装和 HBM 存储制约了 GPU 的产能。另一方面,GPU 的算力供给不均衡是造成短缺的另一个问题。

 

如何将不均衡的算力资源通过 AI 技术等动态调整,并结合区块链、加密货币、超算智算、边缘计算,让算力资源均衡供给?去中心化云算力被看作是解决 GPU 短缺的方式。

 

去中心化云算力平台(如 PowerVerse)通过融合上述技术,将闲置算力资源接入进来,通过将算力资源铸造成 NFT 在平台中流通和交易,以此提供给算力需求方。区块链、NFT、加密技术能够保障链上数据隐私和安全,AI 技术动态分配算力资源促进算力的均衡供给(意味着科技巨头的 GPU 算力可以在深夜继续供给中小型企业)。

 

这样一来,算力短缺问题得到有效解决。同时算力资源得以有效利用,避免算力闲置或浪费。结合边缘计算、超算智算,算力性能进一步提升,中小型企业和个人开发者享用低延时、高性能算力将唾手可得。

 

结语

 

根据 Grand View Research 的报告,全球 AI 市场预计将在 2030 年达到 约 1.8 万亿美元,从 2023 年到 2030 年的复合年增长率(CAGR)高达 37.3%。我们或会预见到 AI 时代,算力将像水电一样成为重要的基础设施,如此一来,算力也将像水电一样成为可及时享用的资源。


联系我们和加入社区

Telegram:@PecPowerversechain

Telegram 社区:https://t.me/PowerVerseChain

X:https://x.com/PowerVerseChain

声明:本文为 PowerBeats 的原创文章,不构成投资及应用建议,欢迎将本文分享给更多好友

用户头像

PowerVerse

关注

PowerVerse(算力)驱动,PowerBeats发现 2025-03-08 加入

PowerBeats是一个聚焦DePin和去中心化云算力为主的媒体平台,关注元宇宙、Web3、AI、DePin、GPU、区块链、加密货币等领域动态,为行业提供新闻资讯、分析与见解。

评论

发布
暂无评论
AI加剧GPU短缺,解决之道在哪里?_趋势_PowerVerse_InfoQ写作社区