中国储能网讯:随着人工智能(AI)在绿色低碳领域的迅速发展和广泛应用,数据中心规模和算力均呈快速增长的趋势。2024年5月,国务院将“加快数据中心节能降碳改造”要求列入《2024—2025年节能降碳行动方案》,被一度视为“电老虎”的数据中心将迎来减碳大考。PUE(电能利用效率)作为现阶段关键的数据中心节能指标,在碳中和大环境下存在哪些局限?数据中心减碳的关键在哪里?AI又如何加速数据中心的变革升级?
2023年是人工智能发展的重要转折年,AIGC技术取得了突破性进展,大模型训练、大模型应用等新业务正在快速崛起。作为智能算力的载体,数据中心也已经从数据机房、通算中心、云计算中心,发展到现阶段的超算中心和智算中心。据统计,全国已有超过30个城市正在建设或提出建设智算中心,巨大增长的算力需求吸引了众多企业进入算力领域,2023年开始我国算力基础设施已经进入了多样化发展的繁荣期。
今年5月,国家数据局发布的《数字中国发展报告(2023年)》中显示,截至2023年底,全国在用数据中心机架总规模已经超过810万标准机架,算力总规模达到230EFLOPS,居全球第二位,算力总规模近5年年均增速近30%。
在高质量、绿色、可持续发展的大前提下,在算电协同、源网荷储等大趋势下,一方面AI等新技术结合数据中心传统的BA等系统,解决了制冷系统中最佳控制点选择的问题,可以最大降低40%的制冷能耗。另一方面,AI等高算力需求也带来高的电力需求,2023年我国在用算力中心总耗电量约为1500亿千瓦时,同比增长15%。
如何更好的利用AI去助力实现碳中和,也许应该重点关注能源到算力的转换效率这个指标。
1
数据中心碳中和更应该关注 IT系统
数据中心的碳中和,一定不是使用了100%清洁能源的电中和,一定是整个数据中心与外部自然界的中和,其终极目标是一个新数据中心建成,气体排放、污染物、碳排放等对当地无影响,与自然界和谐共处。这不是某个行业能推动实现的,需要整个数据中心产业上下游形成多行业联动,才能达到这种平衡状态。
以节能为例,数据中心前期节能更多是围绕基础设施建设和运维开展,以实现降低PUE为目标。实际上数据中心产业对碳中和最大的支持不是节约能耗,而是提升能耗算力的转化效率,这就需要全产业的支持。
重点应该改变的是占比达到80%的 IT 行业,而不是占比只有20%的基础设施行业。由于各种现实原因,相关行业自身改变的意愿并不强烈,而相应的行业政策和数据中心服务商也没有制定相关鼓励策略推动这方面的转变。
当然,这并不是说PUE不重要。实际上,PUE和能源到算力的转换效率是两个相辅相成的指标。一个高效的数据中心应该同时追求低PUE和高能源到算力的转换效率。然而,在权衡这两个指标时,数据中心应该更加关注于后者,因为它更直接地反映了数据中心在提供计算能力方面的能效。
2
PUE 在碳中和的大环境下存在局限
PUE作为现阶段关键的数据中心节能指标,并没有关联到算力输出上。PUE只是关注数据中心整体能耗与IT设备能耗之间的比例关系,而对IT设备自身的能源转换情况并不掌握。PUE存在更关注整体、无法体现总电量、无法体现电价、缺少对IT能耗的评价等局限性,无法全面真实的评价数据中心绿色节能情况。
结合PUE衍生的CUE的定义可能会误导碳中和重点是利用可再生能源,实际上,碳中和是排放零碳,并不一定要通过使用零碳能源来实现,更需要生产方式、生产结构和生产技术的变革。
从PUE的角度看,数据中心基础设施自身只消耗1.X中0.X的能耗,随着PUE越来越小,IT设备消耗的能耗已超数据中心总能耗的75%。公开资料显示,通用IT设备耗电97%都转换成了热能,只有3%真正用于计算,而这部分热能还需要数据中心通过制冷去中和,整个数据中心能源到算力的转换效率非常低,现阶段数据中心产业虽然在大力推广液冷等技术,但这些技术更多是实现如何降低PUE,能源浪费情况仍然存在,因此需要新的指标来对能源使用进行综合评判,数据中心在生产侧变革势在必行。
一个低PUE的数据中心可能在能源利用上较为高效,但如果其最终算力输出不高,那么从整体来看,其在能源方面将比高PUE的数据中心更加浪费。
3
能源如何高效的转化为算力才是关键
我们来理解一下能源到算力的转换效率。这个指标衡量的是数据中心在消耗一定能源的情况下,能够产生多少有效的算力。提升这一效率意味着在同样的能源消耗下,数据中心可以提供更多的计算服务,或者提供同样计算服务的情况下,消耗更少的能源。
*标准的业务系统和实际业务系统24小时能耗曲线
以业务系统为例,从上图可以看到,多数业务系统在运行时,会更多的关注负载均衡、响应时间等性能指标,以及QOS和SLA等商务指标,忽视了对能耗的控制,全天每小时的能耗并没有随业务系统负载的变化而发生太大变化。可以通过AI将算力与业务动态的关联,提升能源到算力的转换效率。
4
数据中心如何借助AI做好提升?
在实现数据中心碳中和的过程,除了引入绿色能源、购买CCER等能源侧的变革之外,更应该深入开展的是产业变革、架构变革、技术变革、业务变革和运维变革,可以加大对AI等技术的应用。
从移动数据中心的实践看,AI不仅可以结合BA等系统实现对能源的精准调控,还可以助力数据中心实现自动驾驶,通过运维自动,5分钟完成2000机柜巡检。通过能效自优,1分钟内从140万个算法组合中推断出最佳冷却策略,实现从制冷到“智”冷。通过运营自治,能够最大化挖掘资源价值。
从碳中和视角看,数据中心园区应该作为一个整体考虑。从土地到建筑再到设备、从用水到用电再到网络,整个园区呼入能源、输出算力、排放碳和热。而这个过程中要实现零碳的排放,一方面需要呼入绿色能源,另一方面更应该从架构上提高基础设施、网络和IT设备的能源利用率,提升数据中心整体能源到算力转化效率,而不是仅仅降低PUE。
数据中心各子系统应该作为一个整体考虑,数据中心各机房应该作为一个整体考虑,数据机柜一样也应该作为一个整体考虑,现阶段随着液冷技术的深入发展,机柜既服务器的概念已经应运而生,IT设备商将数据机柜做为一台大服务器去整体设计,将服务器内配电、制冷和运算整体布局,能极大提升单机柜的效率,既可以提升算力,又可以提升能耗利用率。
数据中心实现碳中和是一个长期的过程,不是数据中心运营商通过自建、购买绿电等方式简单实现,也不是数据中心运营商独自能实现的。需要从数据中心行业整体思考,通过产业上下游共同努力,不断的变革以提升能源到算力的转换效率,并可以借助AI建立类似海绵城市和稻田养鱼的自循环体系,实现数据中心和自然的充分融合。