液冷赋能,AI 算力锐不可当
#数据中心 #液冷数据中心 #液冷服务器 #智算中心 #液冷算力 #水冷服务器
一、引言
近年来,随着人工智能、大数据、大模型等技术的快速发展,对高效散热的需求不断增加,液冷技术得到了广泛关注和应用。许多知名企业纷纷投入液冷技术的研发和应用,推动其不断创新和发展。液冷技术在 5G 通信、边缘计算等领域的应用也在逐渐拓展,为这些领域的发展提供了有力支持。
根据市场研究机构的数据,全球液冷市场规模预计将在未来几年内保持高速增长,到 2025 年将达到数十亿美元。在中国市场,液冷技术的应用也在逐渐增加,市场规模有望在未来几年内实现翻倍增长。
二、算力与散热的演进
在算力演进的道路上,散热扮演着至关重要的角色,每一次算力的重大突破往往都伴随着散热技术的同步提升。早期主要以风冷散热为主。通过风扇带动空气流动来带走热量,这是较为传统和常见的散热方式。
随着算力提升和发热增加,出现了更高效的热管散热技术。热管利用工作流体的蒸发和冷凝来传递热量,具有较好的导热性能。接着,液冷散热技术逐渐兴起。它通过液体循环来更有效地吸收和转移热量,相较于风冷散热效率更高。当前异构、HPC、AI 等算力需求进一步提高,液冷散热的重要性愈发彰显。
先进封装是在半导体制程接近物理极限的情况下延续摩尔定律的重要路径,除了通过制程工艺来缩小器件尺寸、研发新材料以及电路结构以提升单位面积的晶体管数量之外,改变封装方式来提升集成电路容纳性也是重要的一个方向。而在多芯片的 2.5D、3D 封装等提升系统性能,且架构堆叠加上系统功率与热源密度提升的情况下,液冷作为高效的散热方案在算力网络的产业框架中不可或缺。
AI 训推重构算网架构,大模型参数量的增速显著大于 GPU 内存增速,高集成度+大内存+多 GPU 的系统更适配大模型训推。为应对 AIDC 机柜的芯片密度显著提升,传统散热向高效液冷演进是必然。
三、液冷应用场景和技术
芯片层面,芯片的典型功耗超过 300W 时,需要使用液冷才能保证算力性能释放; 整机层面,AI 服务器单柜功率 10kW 级增至数十 kW 以上,密度激增迫切需要液冷渗透;机房层面,IDC PUE 从 1.5 以上降至 1.2 只能选择液冷。
目前国内主流液冷方案包括冷板式、浸没式、喷淋式三大类,冷板式应用较多。
随着对计算性能要求的提高,液冷技术在以下关键应用场景中发挥着重要作用。
数据中心:用于冷却服务器和其他 IT 设备,提高能源效率和降低运营成本。
超级计算机:处理大规模计算任务,确保高性能和稳定性。
人工智能:训练和运行深度学习模型,加速计算过程。
医疗设备:如 MRI 机器,保持设备的正常运行温度。
工业制造:冷却加工设备,提高生产效率和产品质量。
电动汽车:电池组的冷却,延长电池寿命和提高安全性。
航空航天:冷却电子设备和发动机部件。
科研领域:各种实验设备的冷却。
游戏电脑:提供高性能的散热解决方案。
加密货币挖矿:保持挖矿设备的高效运行。
四、液冷技术的发展趋势
在节能减排的大环境下,液冷技术的优势逐渐显现,其发展呈现出一些新的趋势:
更高的效率:不断提高散热效率,以满足日益增长的计算需求。
更低的能耗:通过优化设计和材料,降低液冷系统的能耗。
更广泛的应用:拓展到更多领域,如 5G 通信、边缘计算等。
智能化管理:实现对液冷系统的智能监控和管理。
绿色环保:采用环保的冷却液和材料。
集成化设计:与其他技术集成,提高系统的整体性能。
成本降低:随着技术的成熟和规模化应用,降低成本。
可靠性提升:提高液冷系统的整体可靠性和稳定性。
定制化解决方案:根据不同应用场景提供定制化的液冷方案。
热回收利用:探索液冷系统产生的热量的回收和再利用。
五、常见液冷技术的特点和应用场景
六、液冷渗透 — "算力的尽头是电力"
谈到“东数西算”,IDC/AIDC 作为高耗能行业,算力与电力匹配是现实需求。据 Omdia 2020,全球数据中心的耗电量占社会耗电总量比例已达 2%。据中国能源报,2022 年,我国 IDC 耗电量达 2700 亿千瓦时,占全社会用电量约 3%;预计到 2025 年,全国 IDC 用电量占全社会用电量的比重将提升至 5%,2030 年全国 IDC 耗电量将接近 4000 亿千瓦时。
PUE 是评价 IDC 项目经济性、能耗指标审批的重要标准之一。“东数西算”对数据中心 PUE 水平的要求高于当前水平(全国项目普遍要求 PUE 在 1.2 左右),能耗达标的核心环节是温控节能设备。“东数西算”意味着我国整体算力水平大幅提升,与之配套的温控散热节能设备需求将同步提升。
PUE = IDC 总能耗/IT 设备能耗
IT 设备能耗 = 单机柜额定用电量×机柜上电数量×24 小时×全年天数×负荷率
七、提升液冷经济性
拆分 AIDC 成本结构,液冷渗透已具经济性,原因在于功率密度而非仅液冷成本。
Capex 视角:土建(空间成本)、配电(电力容量)、热管理设备成本(风冷 or 液冷)占初始投资绝大部分(不考虑 ICT 设备,成本占比>50%)
Opex 视角:电费与折旧则是日常经营的主要成本项(成本占比可达 80%+)
衡量液冷经济性的核心因素在于 PUE 优化后的电费节省、密度提升、能否超越设备初始投资的增项。
液冷经济性的逻辑框架
过去传统 IDC 的建设成本,土建、配电、空调是影响项目经济性的核心因素。随着机柜功率密度的增加,电力设备 Capex 和每年电费 Opex 在 IDC 商业模型中的影响力显著提升。
八、算力液冷
与 AI 算力体系类似,储能系统的高效稳定运行也对工况的温度、湿度有较高要求,温度直接影响电池容量和工作效率衰减,且和热失控事故直接相关。目前主流的储能温控技术有风冷、液冷、热管冷却、相变冷却。其中风、液冷是产业主流。
据中国储能网,储能系统中电池成本占比约 55%,PCS 占比约 20%,BMS 和 EMS 合计占比约 11%,热管理成本根据所选温控技术方案的不同,成本在 2-4%之间。
随新能源电站、离网储能等大容量、高密度的储能电站建设,以及大型能源集团、大型系统集成商的带动,储能液冷的渗透率正持续提升。国内储能温控由 IDC 精密温控、工业温控、新能源车温控等领域拓展而来,表明延伸可能。
储能温控产业链下游集中度较高、话语权和议价能力强,一旦供应资格形成后粘性强,先发优势较为重要。核心 AI 芯片、终端大厂的认证、服务能力提升算力液冷的核心竞争壁垒。
风冷、液冷系统在储能领域大规模应用,需求迅速放量,产品交付能力以及成本控制能力是核心。通过制造、成本控制能力,降低 ICT、IDC 环节的投资成本。
随着储能容量变大,产品定制化需求较强,液冷系统的流道数量、流量、流速等定制化设计要求高,客户更多选择具备联合设计能力的厂商。零部件环节标品,重性能,实际产品力差异巨大,横向拓展可能性大;系统环节非标品,需要理解热管理技术,具备 ICT、IDC 相关知识。
九、如何选择合适的液冷技术
选择适合自己的液冷技术需要考虑以下几个因素:
散热需求:
首先要确定自己的设备或系统的散热需求。不同的应用场景和设备对散热的要求不同,例如高性能计算、数据中心、游戏电脑等可能需要更强大的散热能力。
技术类型:
了解不同类型的液冷技术,如冷板式、浸没式、喷淋式等。每种技术都有其特点和适用范围,需要根据具体情况进行选择。
成本:
液冷技术的成本相对较高,包括设备成本、安装成本和维护成本等。需要根据自己的预算来选择合适的技术。
空间要求:
液冷系统通常需要一定的空间来安装和运行,需要考虑设备的尺寸和空间限制。
可靠性和维护:
选择可靠的液冷技术和供应商,确保系统的稳定性和可靠性。同时,了解系统的维护要求和难度,以便进行日常维护和故障排除。
兼容性:
确保液冷技术与自己的设备和组件兼容,不会对其他部件造成损害。
性能和效率:
比较不同液冷技术的散热性能和效率,选择能够满足自己需求的技术。
环保和安全:
考虑液冷技术对环境的影响和安全性,选择环保、无毒、不易燃的冷却液。
技术支持和服务:
选择能够提供良好技术支持和售后服务的供应商,以便在使用过程中遇到问题时能够及时得到解决。
综合考虑以上因素,根据自己的具体需求和情况,选择适合自己的液冷技术。在选择之前,可以咨询专业的液冷技术供应商获取更详细的信息和建议。
随着技术的不断进步,液冷技术将更加成熟和普及,应用领域也将不断拓展。未来,液冷技术可能会与人工智能、物联网等相结合,实现更加智能化的散热管理。液冷技术的发展将为各个行业带来更多的机遇和挑战,需要不断创新和探索。
评论