算力需求持续爆发,「能耗大户」如何滴水必争?

摘要

随着人工智能(AI)产业快速发展,企业部署大模型的门槛不断降低,带动应用端加速渗透,各行业对算力的需求也持续爆发。

随着人工智能(AI)产业快速发展,企业部署大模型的门槛不断降低,带动应用端加速渗透,各行业对算力的需求也持续爆发。目前已有多家上市公司相继披露大额算力服务合同,推动人工智能数据中心(AIDC)进入高速建设期。

但一个客观现实是,作为一个高耗能产业,AIDC 的建设也会带来能源和水资源需求的增加。有数据显示,到 2030 年,与人工智能相关的增长预计将消耗相当于印度年需求量的电力 [1],以及与美国全年饮用水需要相当的水量 [2]。

「这表明水危机不再是一个抽象的未来问题,而是在 AI 时代变得愈发紧迫。全球的企业比以往任何时候都需要保护水资源。」艺康集团执行副总裁兼大中华区总裁孔听云表示,AI 时代,滴水必争。

更关键的是,考虑到当前消费者在可持续方面的消费心理和消费需求,可以确信的是,保护水资源、高效利用水,也会带来一个企业潜在的增长机会。

算力井喷,带来绿色发展新挑战

AI 产业的快速发展推动了算力需求的井喷,但随之而来的即是数据中心对散热有了更高需求,也为数据中心的绿色发展带来了新挑战。

因为数据中心是典型的耗能大户。2024 年 7 月,国家发展改革委联合有关部门印发《数据中心绿色低碳发展专项行动计划》(下称《专项行动计划》)提出,数据中心是支撑新质生产力发展的重要基础设施,也是当前我国能源消耗增速较快的领域之一。

随着单机柜性能大幅提升,数据中心能耗持续攀升。国际数据公司(IDC)与浪潮信息) 联合发布的《中国人工智能计算力发展评估报告》(下称《报告》)预测,2024 年人工智能数据中心 IT 能耗达到 55.1 太瓦时,2027 年将增长至 146.2 太瓦时,5 年间实现 6 倍增长。

在近日召开的「2025 年能源经济预测与展望研究报告发布会」上,北京理工大学发布的《数据中心综合能耗及其灵活性预测报告》称,到 2030 年,我国数据中心用电负荷将达 1.05 亿千瓦,全国数据中心总用电量约为 5257.6 亿千瓦时,用电量将占到全社会总用电量的 4.8%。

然而,数据中心不仅耗电,还费水。谷歌发布的 2023 年环境报告显示,其 2022 年消耗了 56 亿加仑(约 212 亿升)的水,相当于 37 个高尔夫球场的水。其中,52 亿加仑用于公司的数据中心,比 2021 年增加了 20%。

破解水耗之困,需要创新冷却方案

冷却系统是数据中心水耗的主要来源之一,贡献了超过 95% 的 WUE(水利用效率),以华东某数据中心主要用水点年用水量分布显示,97% 的用水为冷却水补水。

据了解,数据中心的水耗包括由冷却系统用水等产生的直接水耗,以及电力生产用水产生的间接水耗。

其中,数据中心的服务器等设备运行时会产生大量热量,通常会用水来冷却散热。一个小型的一兆瓦数据中心,若采用传统冷却方法,每年的水耗量会超过 2500 万升。一些大型数据中心,其冷却系统每天的用水量甚至能达到 500 万加仑(约 1892 万升)。除了冷却,数据中心还会用到水进行加湿、消防系统以及设施维护等,产生较大的水耗。

此外,数据中心需要大量电力来维持运转,以火力发电厂为例,其在蒸汽生产等过程中会用到很多水。据估算,全球火力发电厂每生产一兆瓦电力,平均水足迹在 220 升到 5076 升。

因此,随着芯片功耗以及数据中心单机柜功率密度持续攀升,叠加各地 PUE(电能利用效率)、WUE 的日渐严格要求,数据中心的冷却方式也正在不断革新。

上述《报告》中提出,面对较大的能耗压力,传统风冷技术已难以支撑,促使越来越多的数据中心转向使用液冷技术。相较而言,液冷(冷板式液冷、浸没式液冷)技术以其冷却效率高、PUE 及 WUE 低、集成度高、可靠性强和运维方便等优势,受到了越来越多的关注。

IDC 预测,到 2028 年,60% 的数据中心将采用微电网、定制硅芯片、液体冷却和加固结构等创新解决方案,以应对电力短缺和日益增长的可持续性要求。

中国信通院的预测则是,2023—2027 年期间,中国液冷数据中心市场将以 59% 的复合增长率持续蓬勃发展。到 2027 年,中国液冷数据中心市场规模有望突破 1000 亿元。

新方案遇上稳定性新挑战,风险可控成关键

但是,液冷技术也给数据中心带来了泄露风险、验证复杂、维护成本高等新的挑战。

有业内人士表示,液冷是直接到芯片的冷却,冷却效率更高,但一旦泄露或循环系统故障,容易导致宕机风险更高,所以对液冷机房的稳定性要求更高。

具体来说,在液冷系统中,二次侧冷却液是至关重要的一个部分,它能够快速吸收服务器等设备产生的热量,并将其传导至冷却系统。与空气相比,液体的热传导系数更高,能更高效地将热量从高温的电子元件传导出去,确保设备在安全温度下运行。但冷却液一旦发生泄漏,可能会对电子设备造成严重损坏,甚至引发安全事故。

同时,由于换热系统结构的特殊性,尽管处于冷却系统的闭路中,作为冷却液介质的水依然会因为水质、设计和材质方面的问题产生腐蚀、结垢、沉积及微生物等问题,造成冷板内部堵塞,传热效率下降,从而直接造成对服务器的损害而导致严重的宕机事故与资产损失。

因此,在液冷技术中,选择冷却液与冷却水处理方案时,既需要考虑传热性能的长期稳定性和高效性等,也更需要考虑其与冷板、CDU(冷液分配装置)的适配性以保证运营的安全性。

此外,作为一种相对较新的技术,液冷系统的验证过程比传统的风冷系统更为复杂,需要更多的认证程序。同时,液冷系统的维护需要专业的技术人员和设备,维护成本相对较高。而且,由于液冷系统与 IT 设备直接相连,一旦出现问题,可能会影响数据中心的正常运行,导致停机时间增加。

纳尔科液冷数据中心全生命周期水管理方案

纳尔科是艺康集团(纽交所代码:ECL)旗下专注于水处理和工艺改进的品牌,作为专业的水管理公司,纳尔科以二次侧冷却液管理方案作为切入点,聚焦液冷整体解决方案,助力数据中心的节能降耗与运营安全,从而为客户实现经济与环保目标的双赢。

针对液冷技术的上述新挑战,纳尔科全新的数据中心液冷管理方案,通过从设计,制造到运输,安装,维护的全生命周期管理,保障数据中心的安全性,避免因冷却液泄露导致的服务器损坏,以及传热效率下降而引发的宕机风险。

其中,在设计环节,纳尔科可以与数据中心设计部门一起评估现有和未来的设计,以避免冷却液相关的挑战。在制造环节,与世界各地的制造工厂合作,确保在冷板的组装过程中,冷却液避免出现结垢,腐蚀,微生物等问题,进而确保冷却液系统在交付终端客户之前,有了一张「合格证书」;在运输环节,提供运输指导,确保产品在到达交付地时,依旧有质量保证;在安装环节,则会提供操作指导,确保安装过程的干净、连续、易操作;在维护环节,共同起草维护性方案,通过数字化在线监测方案,致力于保障设备的正常运行,简化终端用户的操作,并致力于可持续发展。

此外,对于二次侧冷却液的选择,纳尔科有水基与醇基两种方案,以全面覆盖液冷数据中心的需求。

其中,纳尔科水基冷却液中的新型微生物抑制组分,解决了传统水基冷却液微生物造成的风险与运维成本高的问题。而纳尔科低毒性醇基冷却液,配合数字化在线检测方案,避免了醇基冷却液有效成分的衰减与泄露。

艺康集团纳尔科大中华区轻工业事业部地区副总裁周谧介绍说,纳尔科的数据中心液冷管理方案,能够助力解决液冷数据中心稳定性的风险,在保障液冷数据中心节能降耗的同时,确保运营的安全性。

「我们也充分理解液冷数据中心各环节厂家验证相对复杂的痛点,与主流 CPU,GPU 厂家进行了联合实验与验证,并获得了优异的结果。」周谧说。

目前,纳尔科的解决方案已被世界知名的处理器公司推荐,并在国内外数据中心有了成熟的应用。

在人工智能时代,艺康保护重要资源并实现业务增长的使命比以往任何时候都更为关键。通过优先考虑智能水资源管理,艺康正在帮助企业实现绩效提升,同时构建一个更具韧性和积极的未来。

[1] Bloomberg Law,「AI Computing on Pace to Consume More Energy Than India, Arm Says,」April 2024. https://news.bloomberglaw.com/artificial-intelligence/ai-computing-on-pace-to-consume-more-energy-than-india-arm-says.↵

[2] 艺康对来自 Lei, N., & Masanet, E. (2022) 和 Goldman Sachs (2024) 的数据的分析。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。