写点什么

冷板式、浸没式、喷淋式液冷散热能否引领高性能计算发展?

作者:蓝海大脑GPU
  • 2022 年 6 月 23 日
  • 本文字数:4082 字

    阅读完需:约 13 分钟

冷板式、浸没式、喷淋式液冷散热能否引领高性能计算发展?

冷板式 | 浸没式 | 东数西算

喷淋式 | 热虹吸 | 高性能计算



随着计算能力和性能需求的提高,AI 人工智能、物联网和机器学习等技术进步,数据中心基础设施和 IT 设备的温度不断上升。更多的计算意味着更多的能量,更多的能量意味着更多的热量,更多的热量意味着需要更多的冷却,而冷却又消耗更多的能量,如此循环往复。


鉴于传统空气冷却系统的低效率,以及注重可持续性的设计目标、国家政策管控、不断上升的电力成本以及冷却 CPU 和 GPU 的技术需求,对更高效、更低功耗的冷却系统的需求是显而易见的。


有专家预测液冷解决方案将是高性能计算散热的未来。预计到 2026 年全球浸没式液冷市场将从今年的 2.43 亿美元增长至 7 亿美元。这是由于越来越多的数据中心的建设以及对经济高效和环保的冷却解决方案的需求不断增长。


液体冷却是计算机冷却中的新兴技术,具有可以处理更大的功率密度、运行干净,安静、成本远低于传统的空气冷却等优势。研究表明,高性能计算领域在浸没式液冷市场中占据了第二大份额。



液冷散热的方式有哪些?

传统服务器利用空气带走机箱内发热元件发出的热量,冷却能耗高、噪音大、设备密度低。风冷所不能解决的高能耗、低性能的问题,液冷技术可以得到显著的改善。


冷板式液冷散热

即利用工作流体作为中间热量传输的媒介,将热量由热区传递到远处再进行冷却。在该技术中,工作液体与被冷却对象分离,工作液体不与电子器件直接接触,而是通过液冷板等高效热传导部件将被冷却对象的热量传递到冷媒中,因此冷板式液冷技术又称为间接液冷技术。该技术将冷却剂直接导向热源,同时由于液体比空气的比热大,散热速度远远大于空气,因此制冷效率远高于风冷散热,每单位体积所传输的热量即散热效率高达 1000 倍,可有效解决高密度服务器的散热问题,降低冷却系统能耗及声噪。


蓝海大脑液冷服务器 HD210 H 系列突破传统风冷散热模式,采用风冷和液冷混合散热模式——服务器内主要热源 CPU 利用液冷冷板进行冷却,其余热源仍采用风冷方式进行冷却。通过这种混合制冷方式,可大幅提升服务器散热效率,同时,降低主要热源 CPU 散热所耗电能,并增强服务器可靠性。经检测,采用液冷服务器配套基础设施解决方案的数据中心年均 PUE 值可降低至 1.2 以下。



冷板式液冷服务器特点:

  • 节能性更优:整体机房空调系统能耗降低 70%;服务器风扇功耗降低 70%~80%;液冷系统可实现全年自然冷却,PUE<1.1,整体机房风液混合冷却系统 PUE<1.2

  • 器件可靠性更高:CPU 满载运行核温约 40-50℃,比风冷降低约 30℃;服务器系统温度比风冷降低约 20℃

  • 性能更优:CPU 和内存工作温度大幅降低,可实现超频运行,计算机集群性能可提高 5%

  • 噪声更低:液冷散热部分水循环噪音极低,风冷部分风扇转速降低,噪音减小,降低约 30dB,满载运行噪音<60dB。

  • 功率密度提升:单机柜功率密度可达 25KW 以上,相比风冷散热方式大幅提升。


浸没式液冷散热

浸没式相变液冷服务器,在浸没式液体相变冷却系统中,将服务器主板、CPU、内存等发热量大的元器件完全浸没在冷媒中,在工作状态下,各发热部件会产生热量,引起冷媒温度上升。当冷媒温度升高到系统压力所对应的沸点,冷媒工质发生相变,从液态变化为气态,通过汽化热吸收热量实现热量的转移,这种通过冷媒吸收热量冷却的技术即相变液冷技术。浸没式相变液冷技术利用液体相变将热量直接带走,减少了传热过程的热阻,相比冷板式液冷,浸没式液冷技术具有更高的传热效率,是液冷之中最节能、最高效的新兴制冷模式。



热虹吸散热

由密度、高度差产生介质循环流动动力,通过介质的蒸发、冷凝实现热流的传输与转换。

技术特点

  • 传热效率高,利用介质的相变,通过工质的蒸发和冷凝传递热流,不需外加动力

  • 等温性能优

  • 结构简单适应性好,可进行分离式结构设计,进行远距离热传输

  • 性能测试,不同风量下的热阻测试,便于不同服务器的节能优化设计

关键技术

  • 蒸发器强化换热结构设计

  • 介质选用及灌装

  • 焊接密封



液体冷却的优点

将液体冷却用于各个领域的原因各不相同,如支持更高的功率密度;降低数据中心的成本;提高能源效率等。


可扩展电源范围

在数据经济中,IT 资源往往超出可用能力,浸没式液冷降低功耗并提高计算能力。液体冷却装置使用更少的功率,并且可以使服务器本身更有效地运行,同时还可以容纳更多的计算机,减少构建数据中心的需求。


减少资本支出

构建传统风冷数据中心的前期成本很高:从建筑设计到空气处理器和冷水机组的安装,高架地板以及其他要求可能会使新的数据中心构建困难。通过消除对传统风冷数据中心的所有空气处理基础设施的需求,液体冷却可以将资本支出减少一半。同时由于占地面积更小,还可以减少构建数据中心本身的资本支出。



更高的能源效率

能源效率是数据中心功能的最终决定因素,使用液体冷却比使用空气要高得多。现在,许多正在获得动力的服务器应用程序都是 GPU 密集型的,超出了可用功率的限制。浸没式液冷技术可以将能耗减少一半,大大提高了数据中心的效率,开辟了新的可能性途径。更高效地利用电源可以节省资金,增加服务器密度,并保护环境中的稀缺资源。


液体冷却的误区

公众对浸没式冷却的看法尚未赶上该技术本身的发展。围绕这项技术的误区有很多,这些误区影响着关于部署哪种冷却解决方案的决策。


液体冷却比传统冷却更昂贵

事实恰恰相反。液体浸泡实际上比传统冷却便宜得多。研究表明使用液体解决方案在数据中心和能源上节省了数百万美元的部署费用。


通过浸没式液冷,即使是服务器本身的运行成本也更低。它们沐浴在冷却液中,不需要低效的风扇。除了从基础架构中节省的资金外,这还将运行服务器的成本降低了约五分之一。节省的成本从安装开始,初始要求较低,然后在整个冷却系统的运行过程中继续累积。资本支出和运营支出在流动性方面都明显较低。冷却成本比空气低 95%。



一种复杂的解决方案

虽然浸没式液冷与传统的空气系统不同,但它在机械上要简单得多,而不是更复杂。如,GRC 的浸没式液冷系统几乎没有移动部件,与高磨损空气冷却相比,这极大地简化了维护手段。


此外,浸没式液冷的优雅设计使技术人员能够轻松访问服务器以进行热插拔等。它还使整个数据中心更简单,无需冷热通道,高架地板,冷水机组,湿度控制,空气处理器以及空气冷却所需的大部分电气设备。


使用的冷却液非常昂贵

液体冷却虽然冷却能力是空气的 1200 倍,但不需要更多的成本。相反,整个系统的成本远远低于空气冷却。


很难与传统数据中心集成

液体冷却在传统数据中心的效果非常好。使用其现有基础架构升级较旧的数据中心,甚至可以在运行中的风冷设施中加入一个高性能液冷服务器区域。液体冷却系统的安装非常简单,可以根据需要将其安装到传统数据中心。



液冷散热的应用


液体冷却已经广泛应用于传统风冷很难充分冷却,并涉及到高密度计算各个领域,已经巧妙地展示其价值。


超级计算

高性能计算(HPC)对处理器本身以及冷却都需要大量的能量。传统的数据中心噪音通常大到需要保护听力,液体冷却在可以无声地运行的同时还节省了大约一半的基础设施成本。



人工智能和机器学习

由于人工智能使用强大的处理器需要进行大量并行计算,大量使用电力设备并产生热量,耗电量是平均水平的几倍。因此,AI 数据中心需要变得更大以适应这些需求。AI 的实时处理将处理器推向极限,液体冷却超出了这些限制,从而实现更快、更智能的计算。



区块链和加密货币

区块链正在迅速扩展到加密货币以外的领域。如用于验证数据的扩展网络需要大量的计算;复杂的数学计算产生的热量通过液体冷却更有效地消散。为了产生利润,区块链应用程序需要最大限度地减少其运行位置的功耗。


总结


空气冷却与液体冷却

虽然空气冷却和浸没式冷却都使用介质(空气或液体)将热量从组件中带走,但在机械功能,成本效益以及可以支持的计算能力方面存在巨大差异。


空气冷却通过一系列设备从外部推动空气,包括空气处理器和机房空调(CRAC)。冷却的空气通过高架地板进入冷通道,然后通过服务器,在那里它吸走热量,然后进入热通道。从那里,空气返回空气处理机以重新开始其旅程。


相比之下,浸没式液冷需要直接将服务器浸入流体中,这种流体的热量传递效率是空气的一千倍以上。这种液体通过冷却分配单元(CDU)循环,该单元通过热交换器散热,使液体返回到启动状态。


空气冷却通过复杂的机制推动热量,这些机制在金钱和空间上花费很多。这与浸泡在非蒸发液体中形成鲜明对比。由于液体冷却系统中的热量由设施的冷却剂处理,因此废热甚至可以重复使用来加热建筑物的水和空气。


液体浸入方法具有更简单的机制,只需要三个活动部件。这极大地帮助了运行数据中心的各个方面。构建液体冷却数据中心更容易,成本更低,设备故障频率更低,并支持更高的计算密度。


性能

在性能方面,空气冷却的最高功率约为每机架 30 千瓦,效率损失约为其一半。相比之下,液体冷却可以处理每个机架超过 100 千瓦的功率,在某些情况下是其两倍。数据中心越来越多地运行能源密集型负载,如人工智能和加密。这些通常采用功耗成倍增加的专用处理器。



位置

空气冷却将数据中心限制在空气过滤和其他基础设施适合的某些位置,而液体冷却的要求较少,可以安装在任何地方。


防止环境危害

服务器设备通常会经历环境磨损,从而逐渐降低可靠性。暴露于这些元素的数据中心,如边缘计算站点,面临着额外的压力。空气中含有水分和小颗粒,会干扰系统的完整性。浸没式冷却液将电子设备装在“盔甲”中,以应对这些威胁。浸入式冷却器中的油可作为防尘、氧化、腐蚀、振动和许多其他风险的保护外壳。计算机设备保持安全,冷却液连续作用以保持较低的工作温度。


相比之下,空气冷却会引入含有污染物的空气,这些污染物可以中和 IT 设备。由于缺乏保护液,传统系统的平均故障间隔时间(MTBF)变短。昂贵的湿度控制系统、维护和其他资源只能提供有限的覆盖范围。空气冷却使服务器面临影响稳定性的风险,而液体冷却则提供环境保护。



总结

空气冷却无法跟上不断增长的数据中心需求。液冷正在流入以修复事物。不仅解决了空气的所有关键问题,而且远远超出了范围。液冷散热处理更高的服务器密度,同时减少噪音和功耗。除了其卓越的冷却能力外,液体冷却还具有其他几个优点,如位置独立性和低成本。总而言之,液体冷却比空气冷却具有足够的优势,使其成为一种不平衡的比较。

用户头像

还未添加个人签名 2021.11.25 加入

深度学习GPU液冷服务器,大数据一体机,图数据库一体机

评论

发布
暂无评论
冷板式、浸没式、喷淋式液冷散热能否引领高性能计算发展?_蓝海大脑GPU_InfoQ写作社区