中国储能网讯:AI的尽头是能源?除了行业应用本身外,AI大模型是近两年能源圈和人工智能行业最紧密的连接点。2024年12月31日,国家发展改革委、国家数据局、工信部联合印发《国家数据基础设施建设指引》,提出推进算力与绿色电力融合,加强大型风光基地和算力枢纽节点协同联动,把绿色电力转换成绿色算力。在发展数字经济和碳中和目标任务的双重驱动下,加强绿色电力和算力的协同融合发展,正在从概念走向实践。
结合当前AI大模型的技术发展路线,《南方能源观察》(以下简称“eo”)专访了香港中文大学(深圳)理工学院教授、英国工程技术学会会士(IET Fellow)、深圳人工智能与机器人研究院研究员赵俊华。他认为,AI大模型未来最重要的“战场”必然是在各行各业,当前算力的缺口仍然较大,特别是绿电需求,正在成为核心城市发展AI产业面临的痛点,而已有的省内和跨省跨区电力市场、绿证及CCER等机制与工具值得加强利用,促进算力消费绿电。
01
AI大模型就像第二次工业革命的内燃机
eo:自OpenAI和DeepSeek等AI大模型上线后,技术研发领域的竞争仍在持续。目前有哪些发展路径?
赵俊华:大模型的形成通常有固定步骤。首先是预训练,这是构建底层能力的核心,需要互联网公开数据等组成的海量语料和万卡级别的超大规模算力。例如,GPT-4训练成本约为6300万美元,依赖5万张以上高端显卡。但在基础底座形成后,数据质量开始遇到瓶颈,一味扩大算力规模可能造成低信息密度的语料降低模型精度。
这个时候有三种方法可推进迭代:一是“微调”,这是提升大模型在垂直领域精度的关键。例如,电力调度场景需要构建“问题—答案”的配对语料库,通过监督微调优化模型。二是“强化学习”,依赖奖励模型(Reward Model)模拟人类反馈,即针对模型给予的回答,用奖励模型来判断反馈其回答的质量,降低人工标注成本。三是推理技术,通过思维链(Chain-of-Thought)、搜索增强(如GPT-4联网检索)等技术,在不调整模型参数的前提下提升推理能力,成本仅为预训练的1/100。
目前我们可以看到的开源模型技术突破包括以下几种:以DeepSeek(670亿参数)为代表的模型采用混合专家架构(MoE),可以把训练效率提升10倍;低精度浮点运算(FP16/FP8)优化显存占用,使千亿级模型可在千卡集群运行;通义千问等通过算法优化,将训练成本从百亿级压缩至十亿级,推动行业应用落地。
个人预计,短期内,技术突破会集中在小样本微调和轻量化推理,如模型蒸馏,而不是参数规模的扩张。长期来看,需要突破Transformer架构的限制,探索类脑计算、脉冲神经网络等新范式。
AI就像第二次工业革命时期的内燃机,只有投入实际使用,才能产生效益。因此,大模型加入一个完整的系统,结合智能体在各个行业落地,是必然趋势。
02
算力总体紧缺,电算协同仍处于初级阶段
eo:我们可否推测,大模型算力需求增量可能将从训练转向推理?
赵俊华:从训练侧看,按目前国外用得比较多的英伟达A100来估算,单卡功率为400瓦,1万张的日能耗约为96兆瓦时,数据中心PUE1.5测算,单日预训练算力需求约为15万千瓦时,行业应用还会导致训练频次增加,总需求仍然会攀升。而推理侧将成为耗能主力,但尚未测算出权威可信的具体数据。
eo:您如何看待美国科技公司为了支撑大模型发展和应用,与能源新创公司联手开发核电?
赵俊华:个人认为这是由于美国电网本身不够强大,在基础设施方面远不如中国,需要借助核电提供比较稳定的电力供应。如果大电网足够强大、稳定、便宜,没必要单独“绑定”电源直供,而且目前核电技术和成本并没有新的重大突破,联手开发核电可能只是迫不得已的选择。
eo:早在大模型“火”起来之前,国内就提到“电力—算力协同”,现在如何理解它?
赵俊华:我们主要的能源资源在西部,产业和算力需求主要在东部。站在AI需求的角度讲,实时性要求不高的一部分算力确实是可以移动到西部的,比如,训练模型的网络通信时延容忍度较高,大于100毫秒,可以在西部部署算力。但具体的行业应用有不同的算力需求,例如,金融交易对时延的容忍度很低,小于1毫秒,就需要在东部部署算力。
华北电力大学和阿里云合作的项目已经试点了“算力负载迁移”,在京津唐电网夏季高峰时段,将非紧急任务迁移至张家口数据中心,降低东部峰值负荷5%—10%,同时提高了绿电占比。宁夏风电光伏直供数据中心通过“储能+算力”动态调节,提高了新能源利用率。
不过,总体来说,电算协同还停留在初级阶段,根本原因在于,算力无论在哪个应用领域都仍处于紧缺状态,可调节的空间十分有限。算力供给从短缺进入整体过剩的阶段后,调节的空间就会变大。
03
需打通现有机制,支持高载能产业发展
eo:国家加速推进经济社会绿色发展,对电解铝等高耗能行业提出了强制使用绿电的要求,数据中心对绿电的需求越发迫切。您认为在这方面,数据中心面临哪些瓶颈?
赵俊华:像“北上广深”这样的核心城市,要新建一个数据中心特别难,原因除土地资源稀缺之外,更重要的是能耗指标稀缺。2024年,国务院办公厅印发《加快构建碳排放双控制度体系工作方案》,“十五五”时期,碳排放总量和强度将代替能耗总量和强度作为国民经济和发展的约束性指标。碳排放“双控”政策有望于今年在各地落地。
对数据中心来说,这意味着提升绿电使用比例成为其落地建设的决定性因素。部分省区,如江苏、山东等,综合考虑欧盟电池法案等国际贸易约束条件和国内当前的能耗约束,先后出台绿电直连政策,但绿电直连面临物理、经济和权责等诸多方面的挑战,推进起来难度不小。
从实现国内经济社会绿色发展目标来看,我们不应该局限于欧盟的思路,而需着眼于转化、衔接、推广已有的工具。相比于绿电直连,跨省跨区或者省内绿电交易、强制配额或者CCER、绿证交易等一系列机制应用来支撑高载能负荷发展,试错成本更低,像深圳等本地新能源资源相对匮乏的城市正在高度关注其可行性。