编者按
随着人们对生产生活舒适度要求的提高,同时由于极端天气频发、广发,使得温度敏感负荷不断攀升,负荷峰值不断刷新纪录,电力保供压力逐渐增加。2022年11月国家能源局发布《电力现货市场基本规则(征求意见稿)》,要求推动虚拟电厂等新兴市场主体参与电力现货交易,充分激发和释放用户侧灵活调节能力。国家能源局2023年3月发布的《关于加快推进能源数字化智能化发展的若干意见》强调要进一步提高负荷预测精度。上海的密集商业楼宇虚拟电厂中温度敏感负荷占比较大,准确的温度敏感负荷预测为虚拟电厂制定需求响应方案、参与电力市场交易提供了必要的参考依据,尤其是在迎峰度夏/度冬期间的极端高温、寒潮时,是虚拟电厂调峰的重要场景。但目前对于极端气象场景的预测精度往往较低,准确把握温度敏感负荷大小能够帮助虚拟电厂在发电侧综合评估区域内分类分布式发电机组的攀峰响应能力,在用电侧可以及时下达需求响应邀约以降低部分负荷,缓解紧张的供需形势。
《中国电力》2024年第1期刊发了周颖等人撰写的《面向虚拟电厂运营的温度敏感负荷分析与演变趋势研判》一文。文章为支撑虚拟电厂运营,精准预测虚拟电厂在寒潮天气下的负荷大小,通过对负荷的分解,提取出温度敏感负荷,提高气象因素与负荷的相关性,并采用改进的时间序列生成对抗网络,扩充寒潮期间温度敏感负荷数据,增加样本训练量,最后采用卷积-长短时记忆神经网络对寒潮期间的日最大负荷进行预测。
摘要
随着极端天气频发,温度敏感负荷用电逐年攀升,温度敏感负荷作为虚拟电厂优质的调控资源,亟须分析气象变化对于此类负荷的影响,由于叠加极端高温、大规模寒潮等异常天气的影响,温度敏感负荷波动剧烈,常规分析预测方法难以适应极端气象场景。针对寒潮天气下温度敏感负荷样本数据及预测精度不足的问题,提出寒潮天气小样本条件下的温度敏感负荷日最大负荷预测方法。该方法先采用时序对抗生成网络(TimeGAN)扩充寒潮期间小样本数据,再采用卷积-长短时记忆神经网络(CNN-LSTM)对寒潮期间的日最大负荷进行预测。以国内某省近两年迎峰度冬期间数据进行模型验证,结果表明所提模型优于其他模型的预测结果,在验证集上日最大负荷的预测精度为99.5%。
1 温度敏感负荷分解与影响因素分析
1.1 温度敏感负荷分解方法
温度敏感负荷采用“基线法”,将区域秋季平均温度处于20 ℃左右,未发生大规模降雨和其他异常天气以及非法定节假日作为典型日选取范围,并在此范围内选取负荷较为平缓的周期,设定为典型日。基于典型日负荷每日96点数据,将典型日按各类型日(指自然周周一到周日)进行分配,并做平均计算,最终得到每个类型日共7条基线Pbase,k。
式中:Pbase,k为第k类典型日基线负荷(k=1, 2, ···, 7);Pact,i,n为秋季第n周第i天负荷(n=1, 2, ···,N,i=1, 2, ···, 7);N为秋季总周数。
此外,为确保得到的基线负荷更具有科学性、严谨性、普遍性,需要尽可能拓宽典型日的选取周期,以保证各类型日基线负荷均由3~5个典型日计算得出。
温度敏感负荷Ptem,m可表示为
式中:Pm为度冬期间第m天实际负荷。
1.2 影响负荷的气象因素选取
为分析多种气象因素对于负荷的影响程度,本文采用皮尔逊相关系数法将负荷数据序列(P)与气象因素序列(X1,X2, ···,XJ)进行分析,其相关系数rj计算公式为
式中:Pγ为负荷序列的第γ个数据;Xj为第j个气象因素序列;Xj,γ为序列Xj的第γ个数据;q为序列长度。
相关系数rj越大,表明该气象因素对负荷的影响越大。人们的感受取决于多个气象因素的综合影响,而单一的气象指标往往无法准确地衡量人体的实际感觉,本文采用体感温度、寒湿指数、人体舒适度等综合气象指标构建预测模型。
1)体感温度
体感温度(AT)即人体感官对外界环境的身体或精神感受,受气温、风速、空气湿度等多重因素影响,其计算公式为
式中:T为气温,℃;RH为相对湿度,%;v为风速,m/s;e为水汽压,hPa。
2)人体舒适度
人体舒适度(K)是指不同气候环境下人体舒适感从气象角度的评价,类似于体感温度,其计算公式为
3)寒湿指数
寒湿指数(Ee)是考虑到中国南方冬季受大陆季风气候的影响,湿度较大,即使气温处于高位,仍给人一种阴冷的感觉,即所谓的湿寒。其计算公式为
1.3 日类型处理
每日负荷与日类型变化也有关系,通常情况下,工作日的负荷通常大于休息日负荷,一周内最大负荷往往发生在星期三或星期四。负荷存在一定周期性,本文在预测时将考虑日类型的影响,为使日类型特征间的距离计算更加合理,将一周七天分别进行独热编码(one-hot encoding)。
2 极端天气小样本条件下负荷短期预测
2.1 基于TimeGAN的寒潮负荷、气象数据扩充
根据寒潮天气标准,大多数区域全年一般发生2~4次寒潮,属于小样本事件,神经网络在小样本预测中精度往往较低。因此,先要根据寒潮数据特性,生成相关负荷、气象数据。在数据生成领域,生成对抗网络 (generative adversarial networks,GAN)常用于图像识别,在音频、电力负荷这类序列数据上的应用可以看作是这些方法的扩展。该算法通过生成器与判别器的博弈,从随机分布的数据逐渐学习真实样本数据的特征分布,使得判别器最终无法区分生成对抗网络输出生成样本与输入的真实样本。TimeGAN(time-series generative adversarial networks)是在GAN的基础上,结合自回归模型,不仅可以模拟初始数据的分布,还能保留数据的动态时序相依特性。TimeGAN通过滑动窗口的方式,可将二维时间序列,切片为一系列的三维样本空间。TimeGAN由嵌入函数、恢复函数、序列生成器和序列鉴别器组成,前2个组件组成自编码器,后2个组成对抗网络,如图1 a)所示。时序数据有静态特征与动态特征之分,前者不会因为时间而改变的特征,例如用户身份信息;后者随着时间而改变,例如体温、血压、气温等。考虑到负荷与气象数据均为动态特征,本文将损失优化函数中的静态特性相关项去除,得到改进的TimeGAN,如图1 b)所示。实线表示对应函数计算,虚线表示重复计算过程,橙色线表示损失计算,其神经网络学习过程为
图1 TimeGAN架构及本文改进的TimeGAN架构
Fig.1 The TimeGAN architecture and the improved TimeGAN architecture in this paper
式中:LR为自编码器的损失值,需优化至满足约束的最小值;E[⋅]表示向量间的欧式距离,用于计算原始样本与生成样本的距离;p为原始样本的时序条件分布;xt为实际的时序数据;图片为随机数据通过自编码器学习得到的时序数据。
样本时序依赖关系的学习过程为
式中:LS是监督损失函数,也需要对其优化令其尽可能小;ht为映射在潜在空间的隐藏层向量;eχ为递归计算的嵌入函数;gχ表示学习时序特征的循环网络;zt表示高斯分布的随机向量。
对抗网络参数优化过程为
式中:LU为无监督损失函数;yt为判别器对真实样本的分类;图片为判别器对合成样本的分类;图片为合成样本的时序条件分布。
自编码器的参数优化过程为
对抗生成网络中参数的优化过程为
式中:θe、θr、θg和θd分别为嵌入函数、恢复函数、序列生成器和序列判别器中的参数;η和λ为平衡对抗网络和自编码器中损失函数的超参数,η和λ取值大于0,TimeGAN对这2个超参数并不敏感,本文算例中η=10、λ=1。
2.2 基于CNN-LSTM的负荷预测模型
2.2.1 卷积神经网络(CNN)
卷积神经网络(convolutional neural network,CNN)是一种深度学习模型,CNN因其具有高效的特征提取能力,在电网故障智能识别、非侵入检测等领域已有大量应用。卷积层和池化层是CNN的核心组成部分。卷积层通过共享权重和局部连接的方式,可对电力负荷数据进行有效的非线性局部特征提取,而池化层则扮演着降低特征维度的角色,以生成更为关键的特征信息,提高模型的鲁棒性和泛化能力。
2.2.2 长短时记忆神经网络(LSTM)
相较于循环神经网络(recurrent neural network,RNN),LSTM通过引入遗忘门、输入门和输出门的逻辑控制单元进行网络中神经元的状态保持与更新,自动调整信息的流动,避免信息的丢失或重叠。LSTM架构中,输入门图片用于控制有多少新信息可以进入LSTM单元;遗忘门ft用于控制前一个记忆单元的输出是否传递到当前时刻的记忆单元中;输出门ot控制记忆单元的输出状态,通过输出门,LSTM可以有选择地输出记忆单元中的信息,灵活地提供给后续的层或模型使用。LSTM通过学习负荷及气象数据的时间相关性,加快网络收敛速度,有助于提高短期电力负荷预测精度。LSTM网络计算步骤如式(12)所示。
式中:输入门图片由输入xt、前一时刻的隐藏层输出gt−1和激活函数σ共同决定,通过激活函数输出一个介于0和1之间的值;Wi、Ui和bi,Wf、Uf和bf,Wo、Uo和bo分别为输入门、遗忘门、输出门的训练参数;tanh为激活函数。
2.2.3 TimeGAN-CNN-LSTM模型结构
本文所设计的TimeGAN-CNN-LSTM结构如图2所示。首先,数据经过关键特征筛选后,进入TimeGAN进行寒潮数据扩充,随后通过包含1层卷积层的卷积神经网络(CNN)进行特征提取,每层包含3×3个卷积核,步长为2。接着,使用1层池化层对数据进行筛选,并使用1层Flatten层将数据扁平化。经过筛选和处理后的数据输入包含1层LSTM网络层的LSTM网络中进行模型构建和训练。在LSTM层中,本文设置了20个神经元,滑动窗口大小设为7。使用全连接层对数据特征进行增强,并将增强后的结果输出。为了调节模型参数,选择均方根误差作为损失函数,并结合Adam优化器使用验证集数据进行优化,更好地调整模型参数,以提高模型的准确性和性能。
图2 TimeGAN-CNN-LSTM模型流程示意
Fig.2 The TimeGAN-CNN-LSTM model flowchart
3 算例分析
本文采用的数据为2021-11-15—2022-02-15与2022年12月某省的负荷数据和气象数据(来自气象网站),气象指标采用地市每日用电量的加权平均,合成该省气象指标,具体步骤为:将各地市售电量与全省售电量的占比作为权重,对各地市的每日气象数据求加权平均,以省日最低气温Tmin为例,可表示为
式中:EC,φ为第φ个地市级公司售电量;Ep为省公司售电量;TEM,φ为第φ个地市级公司所在地的最低温度;d为该省的地市级公司个数。
气象数据时间颗粒度为一日一点。将数据集划分为训练集、验证集、测试集,其中以小样本扩充的数据与2021-11-15—2022-01-15数据作为训练集、2022-01-16—2022-02-15数据作为验证集、以2022-12-13—12-20该省寒潮期间的数据作为测试集。本文模型的训练及验证均在TensorFlow2.0深度学习框架实现。
为了验证本文所提算法的有效性,分别计算总负荷、基础负荷以及温度敏感负荷与各气象指标的相关系数。各因素与日最大负荷的相关性如表1所示。
表1 各气象指标与不同负荷相关系数
Table 1 The correlation coefficient between meteorological factors and different loads
由表1可知,通过负荷分解得到的温度敏感负荷与气象的相关性较总负荷与气象的相关性普遍升高,因此,本文选择与负荷相关性最大的2种二次气象指标(体感温度、人体舒适度)以及平均温度作为预测模型气象输入参数。
3.1 生成数据分析
本文通过Q-Q图检验生成数据和原始数据是否满足同一分布,若图中的散点分布在对角线的周围,表示生成数据和原始数据的分布接近,同时根据对生成数据和原始数据的分布数据进行高斯函数拟合,可直观看到分布差异。
本文对2021-11-15—2022-02-15数据中满足寒潮条件的样本进行筛选,得到4轮寒潮数据,每轮寒潮大概影响5~7天的负荷,因此得到寒潮样本数据为23天,每天数据包括日敏感负荷、平均温度、体感温度、人体舒适度、独热编码的日类型数据。采用TimeGAN算法对各类数据扩充至552组,图3、图4为平均温度、用电负荷的Q-Q图和真实值与生成值的概率分布情况。原始数据与生成数据的分布大致相同,说明TimeGAN算法成功地对气象特征和温度敏感负荷特征进行了学习,并生成带有真实样本特征的新样本。
图3 平均温度的合成样本与真实样本分布情况
Fig.3 Distribution of synthetic and real samples of average temperature
图4 负荷的合成样本与真实样本分布情况
Fig.4 Distribution of synthetic and real samples of load
3.2 预测精度分析
为验证预测精度,本文采用平均绝对百分比误差(EMAP)、平均绝对误差(EMA)作为评价指标,相关公式为
式中:s为样本数目;pδ为第δ个样本的真实电力负荷值;图片为第δ个样本的预测电力负荷值。
为进一步说明本文模型在寒潮期间负荷预测中的优势,对2022年12月中旬的一次寒潮期间的负荷进行预测。图5是采用不同预测算法直接对总负荷进行预测的对比结果,图6是温度敏感负荷+基础负荷的预测结果,同时为了证明本文所提算法有效性,将本文模型与目前常用方法对比。各模型在训练集上的误差对比如表2所示。
图5 不同算法对总负荷的预测结果
Fig.5 The prediction results of each algorithm for total load direct prediction
图6 对各算法温度敏感负荷预测值+基础负荷的预测结果
Fig.6 The prediction results of each algorithm with the predicted value of temperature sensitive load + basic load
表2 误差分析
Table 2 Error analysis
预测结果表明,通过将总负荷分解为温度敏感负荷与基础负荷,可提高各类算法对于总负荷的预测精度,5种预测模型的平均绝对误差平均降低了27.70%,百分比误差平均降低了27.13%,验证了负荷分解在提高短期预测精度上的有效性;在数据扩充之前,其他算法由于寒潮样本不足,对于寒潮期间负荷的攀升速度预测过低,本文所提算法在寒潮期间平均绝对误差仅为39.98万kW,平均绝对百分比误差为0.46%。
4 结论
本文基于多类型气象指标,提出一种基于负荷分解及小样本生成的CNN-LSTM网络模型,以中国某省数据进行模型训练。得到以下结论。
1)采用负荷分解得到的温度敏感负荷与体感温度、人体舒适度等二次气象指标的相关性普遍大于总负荷与此类指标的相关性,并高于与单一气象的相关性。通过负荷分解与二次气象指标,选择与温度敏感负荷相关性较高的指标,可进一步提升温度敏感负荷的预测精度。
2)采用TimeGAN算法对学习寒潮期间的负荷及气象数据的时序特征,并对样本进行扩充,从生成数据与原始数据的概率分布和实际预测精确度效果可知,生成数据在保留原始数据分布特征的基础上,弥补了寒潮期间负荷样本过少、预测模型难以学习其时序特征的不足。
3)本文选用的基于CNN-LSTM预测模型在输入多维特征参数下可以充分考虑温度敏感负荷的时序特性,提高对历史负荷、气象参数的利用率,提高在短期电力负荷预测中的预测精度,有利于虚拟电厂提前安排运营计划。
4)未来随着极端天气的频发,温度敏感负荷占比逐年升高,将愈发成为虚拟电厂中重要的调控资源,可在负荷预测的基础上,进一步研究极端天气下温度敏感负荷可调节潜力,支撑虚拟电厂调控资源的挖掘。
注:本文内容呈现略有调整,如需要请查看原文。