中国储能网讯:
摘要:随着人工智能技术的快速发展,智能算力需求呈爆发式增长态势,智算中心能耗问题当今备受关注。深入分析了国内外智能算力总体情况,探讨了人工智能时代智能算力迅猛发展所带来的能源消耗急剧增长、能源供应不稳定以及能源利用效率有待提高等方面的问题,并提出相应的对策建议,旨在为应对智能算力的能源挑战提供全面且具有实践价值的指导,促进人工智能产业与能源的可持续协调发展。
关键词:人工智能;智能算力;能源消耗
0 引言
2024年底,中央经济工作会议提出要开展“人工智能+”行动,积极运用数字技术、绿色技术改造提升传统产业。随着以深度求索(DeepSeek)、聊天机器人模型(ChatGPT)、人工智能(Artificial Intelligence,AI)文生视频大模型为代表的生成式AI时代的到来,AI技术在工业、医疗、交通、金融等众多领域得到广泛应用,基于图形处理器(Graphics Processing Unit,GPU)芯片的智能算力需求呈现出爆发式增长态势[1-2]。从深度学习模型训练到复杂的AI推理任务,智能算力作为支撑AI发展的核心资源,其重要性不言而喻[3]。然而,智能算力的大幅提升也带来了严峻的能源挑战。相关研究机构预测,全球数据中心的能源消耗将持续增长,而其中相当一部分用于满足AI训练和推理任务的算力需求[4]。如何在满足AI发展需求的同时实现能源的高效可持续利用,已成为亟待解决的问题。本文梳理分析了全球智能算力发展的现状,探讨了智能算力激增可能带来的智算中心能耗上升、能源成本持续攀升、能源效率有待提升以及能源供应稳定性要求高等方面的挑战,并基于挑战提出推动政策支持与产业协同降耗增效、加强技术创新研发、优化能源精细管理等方面的对策建议,旨在充分发挥AI正面效应,有效应对AI时代的能源需求。
1 国内外智能算力发展总体情况
1.1 全球算力规模快速增长,智能算力国际竞争日益激烈
近年来,全球算力总体规模呈现快速增长趋势。据统计,截至2023年底,全球算力总规模达到910 EFLOPS,同比增长40%,增长态势显著[5]。其中,通用算力规模为551 EFLOPS,智能算力规模为335 EFLOPS,超算算力规模为24 EFLOPS。与此同时,全球智能算力需求随着非结构化数据(文字、图片、语音、视频等)急剧扩增呈现持续增长态势。《中国算力发展报告》数据显示,截至2023年底,全球智能算力规模同比增长超过一倍,其增速远超算力总规模增速,智能算力逐渐占据重要地位[6]。
随着AI技术的发展,全球各国对智能算力的重视程度不断提高,纷纷加大在智能算力基础设施建设、AI芯片研发等方面的投入,智能算力的国际竞争日益激烈[7]。美国在智能算力领域处于领先地位,拥有强大的技术实力和产业基础,如谷歌、微软、亚马逊等在AI研发和应用方面投入巨大,推动了智能算力的快速发展。例如,谷歌的TPUS等专用芯片为AI训练和推理提供了高效的算力支持。欧洲也在积极推进智能算力的发展,如英国发布了《国家人工智能战略》,旨在提升英国在AI领域的竞争力,包括加强智能算力基础设施建设。日本在智能算力的发展上注重与本国产业的结合,如在制造业、医疗等领域应用智能算力提升生产效率和医疗服务质量。此外,日本的科技企业在AI芯片和机器人等领域也具有一定的技术优势。
1.2 我国稳步推进算力设施建设,智能算力市场爆发式增长
近年来,我国政府出台了包括规划引导数据中心建设、支持AI芯片研发等一系列支持智能算力发展的政策。例如,工业和信息化部为促进计算、网络、存储和应用协同创新,出台了《算力基础设施高质量发展行动计划》,旨在构建全国枢纽、区域中心、本地边缘协同发展的多层次算力基础设施体系,提升算力高效运载能力,推动算力基础设施高质量发展,同时提出2025年我国智能算力达到105 EFLOPS、智算比例达到35%的目标。此外,我国在芯片设计与制造、服务器生产、数据中心运营、AI软件开发、生成式AI、大模型训练以及多模态AI等多环节的智能算力产业生态正在逐步完善,且发展速度迅猛,成为推动国家智能算力增长的主要驱动力。
截至2023年底,我国在用数据中心标准机架超过810万架,算力总规模近5年年均增速近30%,位居全球第2位,达到230 EFLOPS,是2020年的3倍[5]。与此同时,随着AI应用的快速发展,中国智能算力市场迎来爆发式增长。根据工业和信息化部的公开数据,截至2024年底,我国智能算力规模达到90 EFLOPS,占比达到算力总规模的32%。同时,相关研究也表明,2024年中国智能算力市场规模突破190亿美元,同比增长86.9%,这一增长趋势进一步表明我国在AI领域的强大实力和国际竞争力。
2 智能算力带来的能源挑战
2.1 能耗急剧增长,成本持续攀升
能源消耗急剧增长。一方面数据中心能耗日益凸显。数据中心作为智能算力的主要承载平台,近年来其能源消耗呈现出惊人的增长速度。据统计,全球数据中心的电力消耗已占到全球总电力消耗的约1%~2%,并且这一比例还在不断上升[8]。以大型互联网企业和科技公司为例,其数据中心的规模不断扩大,服务器数量成千上万,为了维持这些服务器的持续运行以及冷却设备的正常工作,需要消耗大量的电能。例如,某知名科技公司的数据中心每年的电费支出高达数亿元,而这仅仅是一个企业的数据,全球范围内众多数据中心的能耗总和更是惊人。另一方面,AI训练与推理能耗较高。在AI训练过程中,尤其是深度学习模型的训练,需要大量的计算资源来处理海量的数据。例如,训练一个大型的语言模型(如GPT-3),其参数量达到1 750亿,训练过程需要在强大的GPU集群上运行数周甚至数月,消耗的电能极为可观[9]。而在AI推理阶段,随着AI应用的广泛部署,大量的设备和终端需要实时进行推理计算,这也导致了能源消耗的持续增加。例如,在智能安防领域,大量的摄像头需要对视频图像进行实时分析和识别,这需要边缘计算设备具备一定的算力,而这些设备的持续运行也消耗了大量的能源。
能源成本持续攀升。智能算力的提升直接导致能源消耗量的增加,进而使能源成本成为企业和机构部署AI解决方案时不可忽视的重要因素。对于大型科技企业而言,数据中心的电费支出已占据运营成本的相当大比例。以某知名互联网公司为例,其数据中心每年产生巨额度的电费支出,并且随着 AI 业务的拓展和算力需求的增长,能源成本还在持续上升。对于中小企业和新兴的AI创业公司来说,高昂的能源成本更是可能成为限制其发展的瓶颈。除了电费本身,为了保障数据中心的稳定运行,还需要投入大量资金用于建设备用电源系统、冷却系统等基础设施,以及支付相应的维护费用,这些都进一步加重了企业的能源成本负担。
2.2 能源利用效率有待提升
服务器利用率不均衡。在许多数据中心,服务器的利用率存在不均衡的现象。部分服务器可能长期处于高负载运行状态,而另一部分服务器则处于闲置或低负载状态。这种不均衡的利用率导致了能源的浪费。例如,在一些传统的企业数据中心,由于缺乏有效的资源调度和管理机制,服务器的平均利用率可能仅为10%~20%,这意味着大量的能源被消耗在维持这些低效运行的服务器上,而没有得到充分的利用[10]。
冷却系统的能源浪费。数据中心的冷却系统是能源消耗的大户之一,通常占数据中心总能耗的30%~40%[10]。为了确保服务器在合适的温度下运行,数据中心需要采用高效的冷却技术。然而,目前许多数据中心的冷却系统存在能源浪费的问题。例如,一些传统的冷却系统采用的是风冷技术,其冷却效率较低,需要消耗大量的电能来驱动风扇和空调设备。此外,数据中心内部的气流组织不合理也可能降低冷却系统的效率,部分区域出现过冷或过热的现象,进一步增加了能源的消耗。
2.3 能源供应稳定性要求高
数据中心要求较高的电力供给系统。为了保证服务器的正常运行和数据的安全,数据中心通常需要不间断供电。一旦发生断电或波动,可能会导致服务器宕机、数据丢失等严重后果。因此,数据中心常设有包括市电、备用发电机、不间断电源(Uninterruptible Power Supply,UPS)等在内的复杂供电系统。但随着数据中心规模越来越大,算力需求越来越大,对电力供应稳定性的要求也日益提高。部分地区由于电网基础设施老化或电力供应能力不足,导致数据中心运行风险加大,数据中心高负荷用电需求难以满足[11]。
可再生能源供应的间歇性带来挑战。许多数据中心为了减少对传统化石能源的依赖,开始尝试采用太阳能、风能等可再生能源。但可再生能源的供给是间断性的,而且存在不稳定性。例如,受天气和昼夜变化的影响,以及风力资源的分布和强度的影响,太阳能发电和风能发电的供给与需求之间存在着诸多不确定性,难以保证稳定可靠的能源供给。数据中心在可再生能源供给不足的情况下,需要依赖传统的能源供应来补充电力缺口,使得能源供应系统的复杂性和管理难度大大增加。与此同时,大规模接入可再生能源也可能对电网稳定性造成影响,储能和智能电网等技术问题也将成为未来亟需攻关的重点领域[12]。
3 应对智能算力能源挑战的建议
3.1 政策支持与产业协同降耗增效
加强政策与资金支持。出台一系列优惠政策,对采用高效节能技术和设备的数据中心给予税收减免、财政补贴等,以提升智算中心能源利用效率。与此同时,鼓励智算中心参与电力市场交易,通过与电网签订直购电协议,降低用电成本[13]。此外,政府还可以加大对可再生能源发电项目的投资和补贴力度,在数据中心推广应用可再生能源,减少数据中心对传统能源的依赖,促进可再生能源在数据中心的应用。例如,某地方政府对采用高效冷却技术的数据中心给予一次性财政补贴,鼓励企业进行绿色低碳技术改造,提高能源利用效率。
推动产业协同发展。通过建立产业联盟或合作平台,促进AI产业与能源产业在技术研发、标准制定、项目示范等方面的合作,实现协同发展合作共赢。例如,能源企业与AI企业共同研发适用于数据中心的高效能源存储和转换技术,双方还可以共同研制数据中心能源管理标准和规范,提升信息通信领域的能源管理水平,降低能耗。另外,通过产业协同合作实现资源共享和优势互补,可降低企业的能耗和研发费用。有实践表明,某能源企业和AI企业合作开展数据中心储能项目示范,通过技术和资源的共享,实现了项目投资成本和运营成本的降低。
3.2 技术创新提升能源利用效率
创新研发高效能AI芯片。增加对AI芯片研发的投入,鼓励企业和科研机构开发具有更高性能功耗比的芯片。比如7 nm、5 nm甚至更小的制程,通过采用先进的制程工艺,使得芯片的能耗明显降低。与此同时,探索存算一体架构的新型芯片,将存储单元和计算单元融合在一起,从而使得数据传输过程中减少能耗,进而提高计算效率。另外,针对不同的AI应用场景,设计专用芯片(Application-Specific Integrated Circuit,ASIC),可以按照特定的任务进行优化,实现能源利用效率最大化。以智能安防领域为例,可以设计专门用于视频图像识别的ASIC芯片,相比通用芯片,其在特定任务上的能效比可提高数倍。
完善优化数据中心架构与冷却技术。采用模块化数据中心架构,服务器模块根据实际算力需要灵活地配置,从而提高服务器利用率。同时通过采用冷热通道分离、热通道封闭等技术来优化数据中心的布局和气流组织,进而降低冷热空气的混合,提高冷却效率降低能耗。另外,开展浸没式液冷技术等新型冷却技术的研发和应用,将服务器浸没在冷却液中,通过液体的相变带走热量,相比传统的风冷技术,将会大幅提升冷却效率,实现数据中心能耗的降低。实践表明,通过采用浸没式液冷技术,某数据中心冷却系统的能耗降低了50%以上,能源利用的整体效率得到了明显提高[9]。
3.3 能源管理优化保障供应稳定性
建立完善的能源管理系统。通过安装智能电表、传感器等设备,基于物联网等数字技术,建立完善的能源管理系统,进而实现实时监测服务器、冷却设备、供电设备等的能耗情况,以及数据中心内的温度、湿度等环境参数。同时运用大数据分析以及AI技术对相关能源或碳排放数据进行实时分析、预测,及时发现不必要的能源浪费和潜在的供电风险,进而制定科学合理的能源管理规划。有研究显示,基于能源管理系统的应用,通过服务器负载动态调整供电和冷却资源分配调节,可实现精细化、动态化的数据中心能源管理,在降低运营成本和风险的同时还使得能源利用效率提高了20%~30%[14]。
采用多能源混合供应方式。数据中心可采用多能源混合供应方式,将传统电网供电与可再生能源发电相结合,以应对可再生能源供应的间歇性问题。与此同时,可通过配置电池储能、超级电容器等储能系统,在需要时储存可再生能源发电的多余能量,以增加能源供应的稳定性及可靠性,以达到蓄能发电的目的[15]。通过智能能量管理系统实现能源的自我管理和优化调度,并根据数据中心的负荷需求和外部电网情况,灵活调整能源供应模式,实现与大电网的互动和协同运行。例如,为减少对传统电网的依赖,同时降低能源成本,某数据中心采用多能源混合供应模式后,其可再生能源利用率提高了30%以上。
4 结束语
AI时代,智能算力的快速发展给能源领域带来了严峻的挑战。然而通过技术创新研发、能源管理优化以及政策支持与产业协同等方面多措并举,可以有效提升能源利用效率、保障能源供应稳定性以及降低能源成本,不仅有助于推动AI产业的绿色低碳可持续发展,而且对能源结构优化、环境保护等方面都有很好的促进作用。未来发展中,各政府、行业、企业需紧密合作,为构建AI时代的美好未来奠定坚实基础,共同探索更加高效、绿色的智能算力能源解决方案。