中国储能网讯:
摘 要 实车动力电池的健康状态(state of health,SOH)评估存在数据质量差、工况不统一、数据利用率低等问题,本文面向阶梯倍率充电工况构建多源特征提取及SOH估计模型。首先,通过数据清洗、切割、填充,获取独立的充电片段;其次,基于不同电流阶段计算容量,实现原始数据利用率达96.9%,并与单独限定SOC范围计算容量的方法相比,误差降低48.1%以上;然后,从当前工况、历史累积两个维度提取多个健康因子,对于当前工况特征值,通过灰色关联度及干扰性随机森林重要度分析双重筛选。对于历史累积特征值,利用Spearson相关性分析和核主成分分析方法(kernel principal component analysis,KPCA)降低信息冗余;最后,对门控循环单元网络模型(gated recurrent unit,GRU)引入注意力机制和龙格库塔优化算法(Runge Kutta optimizer,RUN),建立RUN-GRU-attention模型,基于实车运行数据集与现有5种模型进行对比,实验结果表明,无论是包含单阶段还是多阶段电流的测试样本,优化模型的估计精度更佳,误差不高于0.0086,并且随着充电循环次数增加表现出良好的误差收敛性,可有效预测SOH波动趋势。
关键词 实车动力电池;阶梯倍率充电;健康状态估计;多源特征提取;龙格库塔优化算法;机器学习
随着电动汽车的大规模普及,精准评估电池健康状态,对续航预测、确保运行安全、及时更换电池具有重要意义。目前对电池健康状态的定义主要是基于容量或内阻,其估计方法大致分为直接法和间接法。其中直接法即通过实验直接测量,并计算与标称数值的比值,这种方法测试周期长、不支持实车场景在线估计。间接法又包含模型分析法、数据驱动分析法。其中,模型分析法分为三类:①经验模型,基于SOC-OCV曲线、SOC估计多项式、优化半经验老化模型等方法估算电池健康状态;②等效电路模型,通过测量内阻或交流阻抗谱,基于最小二乘法、滤波器观测器等算法建立等效电路模型用以描述电池系统特征;③电化学模型,通过量化内部电化学反应过程,根据活性物质消耗等信息估计电池SOH。模型分析法可解释性强,但辨识求解过程复杂导致在线计算损耗大,并且信号异常或噪声干扰会给估计结果带来较大误差。数据驱动法忽略电池内部变化,包含“提取特征-处理特征-建立评估模型”三大环节,由于其泛化性强、计算简单、适应在线的特点,逐渐成为评估SOH的广泛研究方法。
在提取特征方面,陆楠等、Guo等基于直接参数法提取不同宽度区间电压平均值、区间容量、电流/温度时间积分值、电压/电流曲线最大斜率等参数作为SOH特征值;陈吉清等基于微分参数法进行容量增量分析,提取IC曲线峰值、电压位置、面积、斜率等共计8个特征值,又由于这类分析方法容易受噪声影响,因此Schiffer等、Wang等通过S-G滤波、小波滤波、高斯滤波等方法对特征值进行加强处理;Richardson等基于行为参数法提取电压、电流、温度分布特征,打破传统提取特征局限于恒流充放工况的限制。在特征处理方面,陈媛等、赵旭、Ma等采取Pearson或Sperman系数计算特征值与SOH之间的线性相关性。在模型评估方面,目前的主流模型有高斯回归模型、支持向量机、神经网络、决策树等,近年来,不少学者利用智能算法或集成算法对模型进行参数优化和性能改善。例如朱振宇等建立CNN-GRU、CNN-LSTM混合神经网络用于估计电池SOH剩余寿命,对比基线模型,模型的精度显著提高;Sun等提出基于耳廓狐算法(Fennec Fox)优化混合极限学习机(HELM)的电池SOH估计模型,可在多工况和较少训练样本条件下保持较高估计精度;Javaid等提取放电数据特征,构建深度神经网络模型(DNN),并基于迁移学习算法实现对其余电池的SOH快速估计。
然而,实车动力电池SOH评估仍然面临以下问题:一是实车数据由于设备受限或运行噪声干扰,普遍存在采样频率低、关键数据缺失或异常等现象;二是不同于实验室在统一工况下测得的循环寿命实验数据,实际充放电工况受驾驶员行为影响变得复杂,尽管采集的原始运行数据量庞大,但传统基于限定荷电范围内提取数据样本的方法,在实车充放电起止荷电状态随机的条件下,提取到的统一工况片段数量较少,且未能充分考虑电流对容量的计算误差;三是实车采样频率普遍在10 s及以上,数据稀疏问题导致容量增量等方法极易错失特征峰值。同时,目前提取SOH特征值仅考虑当前工况状态,忽略挖掘历史损伤累积特征信息。此外,仅通过线性相关性分析无法确保特征的典型性,并且采用过多的特征值建模可能存在信息冗余,导致模型估计精度降低。
鉴于此,本文提出一种适用于阶梯倍率充电工况的实车动力电池健康因子提取和SOH估计方法。首先,通过数据预处理获取较为统一、完整的充电片段;其次,兼顾样本数目和数据质量,基于不同电流阶段获取容量样本;然后,从当前工况、历史累积两个维度提取SOH健康因子,分别开展灰色关联度、随机森林双重筛选及KPCA降维处理;最后,构建RUN-GRU-attention模型实现SOH估计,一方面设计实验验证本文容量计算方法的有效性;另一方面在单阶段和多阶段电流样本集上,与现有5种模型对比,验证了所提方法的适用性。
1 实车数据预处理
本文数据来源于广东某批电动汽车实际运行数据,采样时间为2022年1月—2023年2月,采集间隔为20 s,每辆车采集车辆、驱动电机、可充电储能装置三部分数据,包含数据时间、车速、车辆状态、总电压、总电流等24项数据类型。由于受到行驶工况不稳定或噪声干扰等问题影响,原始数据存在较多缺失和异常等问题,下面以1#车辆为例进行详细的预处理说明。
1.1 异常数据清洗
异常数据包括车辆状态匹配异常、时间匹配异常、数据重复或超限。清洗异常数据的步骤如下:①利用逻辑判别删除重复或无效数据、纠正匹配错误数据;②利用四分箱型图剔除超限值数据。最终修改并删除异常数据721帧,剩余有效数据43489帧。
1.2 充电片段切割
由于行驶工况复杂,制动回收电量使得电流正负交替变化大,难以完整提取行驶片段。因此以充电数据为重点,将其切割成较为统一完整的工况片段,步骤如下:①筛选充电状态(车辆状态为熄火、充电状态为充电、电流<0);②以6 min为阈值初次切割;③合并缺失时间较长的充电片段;④删除采样时间过短(<2 min)的片段。经处理,1#车辆的有效充电片段共328个。
1.3 缺失数据填充
数据在采集、传输、存储过程中存在缺失现象,导致采样周期不均匀,进而引起容量及特征值的计算误差。缺失数据填充的步骤如下:①查询缺失段落;②采用均值插补法进行数据补充。经查询328个充电片段中存在1184段缺失数据,平均缺失时间小于5 min,填充后数据增加5939帧。图1为第93次充电片段数据填补前后的电流、电压数据。
图1 充电片段数据填补前后电流、电压对比
2 充电片段数据分析
2.1 充电深度分析
如图2所示,充电深度受用户行为影响表现较为随机,起始SOC多分布在50%以下,终止SOC多分布在80%以上。可以看出相较循环老化实验数据,实车工况非满充满放,甚至起止SOC都相差较大。
图2 充电深度及起止SOC分布
2.2 充电模式分析
1#车辆模式可大致分为以下3种:恒流充电、递减倍率充电、阶梯倍率充电。其中,恒流及递减倍率充电模式样本总数占比仅4%。重点关注占比最多的阶梯倍率充电模式,图3(a)作出其电压-电流-SOC数据分布,可以看出该车辆的4个阶梯电流分别在110 A、97 A、46 A、14 A附近(后文简称“Ⅰ、Ⅱ、Ⅲ、Ⅳ”阶段),4个阶梯对应电压范围依次是326~357 V、357~368 V、368~379 V、379~380 V,对应的SOC范围依次是0~67%、67%~80%、80%~97%、97%~100%。进一步对阶梯电流类型进行统计,结果如图3(b)所示,由于充电行为较为随机,主要存在Ⅰ-Ⅱ-Ⅲ-Ⅳ、Ⅰ-Ⅱ-Ⅲ、Ⅰ-Ⅱ、Ⅰ、Ⅱ-Ⅲ、Ⅱ共6种充电模式,分别占比20.1%、40.6%、5.4%、12.5%、9.8%、8.5%,其余模式仅占3.1%。
图3 阶梯充电模式分析结果
在此基础上,筛选其中深度充电片段(充电深度≥80%),作出其电流-SOC数据分布,如图4所示。从图中可以看出存在3种异常电流分布情况:一是低荷电状态的电流波动(SOC低于40%);二是倍率突变的电流波动;三是数据填补产生误差,即缺失数据片段刚好位于电流突变处,人为预处理产生异常电流,第三种情况可以通过优化数据填补逻辑来避免,第一、二种电流波动会给容量计算带来误差。
图4 深度充电工况下电流-SOC分布
3 实车动力电池SOH定义与样本筛选
3.1 实车动力电池容量计算方法
利用式(1)计算实车电池容量:
式中,Q为当前充电最大容量;Δt为前后两帧数据时间差;I(t)为t时刻充电电流;ΔSOC为SOC变化量。
3.2 容量样本筛选
以往的研究大多限定SOC范围计算容量,依照这种思路,分别选取ΔSOC≥15、ΔSOC≥30、ΔSOC≥45、ΔSOC≥60计算当前充电最大容量,图5作出容量数据分布箱型,从样本数目、离散度、累积里程回归度三个角度评价容量数据,结果见表1。可以看出,当ΔSOC≥15增大至ΔSOC≥60,样本量减少60%;箱型图中上下线距离、箱体长度都在减小,对应极差、四方位差减小,说明随着ΔSOC减小,容量数据分布变异性变小;由于累积里程可间接表征电池老化程度,因此建立当前充电最大容量与累积里程的回归模型,结果表明随着ΔSOC增大,模型决定系数R2先降低后增加,其中ΔSOC≥30时,两者线性相关性最低。不难看出,当选取的SOC范围较小时,信号噪声或电流波动导致当前容量的计算误差较大,但当充电深度较高时又会导致训练样本量不足。此外,以上计算方法未考虑电流不一致对容量造成的计算误差。
图5 不同计算方法下容量数据分布箱型
表1 不同计算方法下容量数据评价指标对比
剔除倍率突变时电流异常波动阶段数据,同时限定充电倍率类型和起止荷电状态,分别在45%~65%、70%~80%、85%~95%、97%~100%SOC区间内计算Ⅰ、Ⅱ、Ⅲ、Ⅳ四个电流阶段对应的当前充电最大容量,其容量数据分布箱型图及指标如图5和表1所示,可以看出:Ⅳ阶段的中位值容量数据几乎是其余阶段的两倍,这是由于Ⅳ阶段电流对应SOC在97%以上,SOC变化缓慢导致计算误差较大;Ⅲ、Ⅳ阶段容量数据的极差和四方位差是其他计算方法的3倍以上,并且与累积里程几乎不存在明显负线性相关性(R2<0.2);同时,相较Ⅰ、Ⅱ阶段,Ⅲ、Ⅳ阶段的数据样本数目减少40%以上。由此说明,Ⅲ、Ⅳ阶段对应容量数据样本个数少、集中度差、与累积里程线性相关性弱,不宜作为容量计算条件。此外,所有方案中,Ⅰ阶段计算容量的数据集中度和与累积里程线性相关性最佳,极差、四方位差、R2分别为0.1653、0.0495、0.6985,说明包含多阶梯电流的充电片段,会由于电流不一致或异常波动将导致容量数据的分散和波动。尽管Ⅱ阶段的计算容量也避免了电流误差,但由于充电深度较低,数据长度较短,偶然的噪声对容量的影响会被放大,其容量数据的集中度和与累积里程的线性相关度与“ΔSOC≥60”方案相当。
综上分析,传统限定SOC范围计算容量的方法,较难同时兼顾样本数目和计算精度。本文分阶段电流计算容量,筛选出Ⅰ、Ⅱ阶段样本共同构建数据模型,这种方法可以最大程度降低电流对容量的计算误差,同时可以充分利用原始数据,即1#车辆的有效充电片段共328个,筛选出的容量样本共318个,数据利用率达到96.9%。
3.3 实车动力电池SOH计算方法
由于1#车辆动力电池初始最大容量未知,利用式(2)的计算电池SOH:
式中,Q、Q1分别为当前充电最大容量和初始充电最大容量,ΔSOC、ΔSOC1分别为当前充电和初始充电SOC变化值。
以其前10次充电片段的容量平均值作为电池初始容量,假定初始状态电池SOH=1。经计算,Ⅰ、Ⅱ阶段初始充电最大容量分别为1.31 Ah、1.35 Ah。
4 实车动力电池SOH特征值提取
本文将从当前工况和历史累积两个维度提取SOH特征值:其中,当前工况特征包含电压相关特征值、电流相关特征值、SOC相关特征值;历史累积特征包含时间累积特征、工况累积特征、不一致性累积特征。下面以1#车辆进行详细的特征值提取说明。
4.1 当前工况特征值提取及相关性分析
电压相关特征值选择等电压上升时间HF1、等电压上升充电容量HF2、等电压曲线斜率HF3、PDF峰值HF4[计算公式见式(3),式中ksdensity表示概率密度函数]、PDF峰对应电压位置HF5;SOC相关特征值选择等SOC区间电压标准差HF6、等SOC区间电压最小值HF7、等SOC区间电压最大值HF8;电流相关特征值选择恒流充电时间HF9。以Ⅰ阶段样本为例,其等SOC区间为45%~65%,等电压范围为343.6~353.1 V。
进一步,对当前工况特征值进行相关性分析,由于其样本数量少、规律不明显,首先对特征值进行灰色关联分析,分辨系数设为0.6,关联系数计算结果见表2,以0.8为系数关联阈值(高度相关)筛选出HF3、HF5、HF6、HF7、HF8、HF9;其次,采用添加特征干扰的随机森林模型对以上特征值进行二次筛选。定义特征重要度如式(4)所示,式中,ERROOB1和ERROOB2分别为无噪声、添加噪声条件下袋外样本误差。设置决策树数目为100,最小叶子节点数为8,随机打乱样本顺序,将80%作为训练集,20%作为测试集,对10次特征重要度计算结果求平均作为最终结果。逐次改变引入各特征数据的白噪声比例,计算模型的平均绝对误差(mean absolute error,MAE)、平均绝对百分比误差(mean absolute percentage error,MAPE)、方均根误差(root mean square error,RMSE)、决定系数R2,结果如图6所示。基于偏离程度对Ⅰ、Ⅱ阶段样本特征重要度进行统计,重要度排序热力图如图7所示,可以看出Ⅰ阶段样本当前工况特征值的重要度排序依次是:HF9>HF6>HF3>HF5>HF7>HF8;最终,选择排名靠前的HF9、HF6、HF3、HF5作为Ⅰ样本的当前工况特征值。依照相同思路,筛选HF9、HF6、HF5、HF7作为Ⅱ样本的当前工况特征值。
表2 当前工况特征值灰色关联度计算结果
图6 对各特征值引入不同噪声后模型误差指标对比
图7 当前工况特征值随机森林重要度计算结果
4.2 历史累积工况特征值提取及相关性分析
时间累积特征包含累积里程(HF10)、循环充电次数(HF11)。其中,累积里程可通过实车数据实时采集,循环充电次数可通过式(5)计算,式中SOCi,START和SOCi,END为某次充电片段起止SOC。工况累积特征包含低放电截止电压次数(HF12),即统计放电截止电压低于15%总电压的次数;不一致性累积特征包含:累积电压不一致性(HF13)、累积温度不一致性(HF14)。其中,累积电压不一致性即单体最高和最低电压最大差值的累积,见式(6)所示,式中Ui,dmax和Ui,dmin为同一时刻电池单体最高和最低电压;累积温度不一致性即单体最高和最低温度最大差值的累积,见式(7)所示,式中Ti,max和Ti,dmin为同一时刻电池单体最高和最低温度。
易知,历史累积特征值随里程增加而单调递增。利用Spearman相关系数进行相关性分析,结果如图8所示,可以看出历史累积特征与容量存在趋向强相关,但部分互相关系数较大,表明特征值间存在较大信息冗余。采用可提取数据高阶关系的KPCA方法降低特征值冗余,选取核函数σ2=10000的高斯径向基核函数,计算相应主成分贡献率系数及负荷向量V,结果表明Ⅰ、Ⅱ阶段历史累积特征值的第一主成分贡献率均超过99%,最终根据式(8)计算特征值HF15,以此替代5个历史累积工况特征信息。最终,1#车辆Ⅰ、Ⅱ阶段样本的SOH特征向量分别为{HF3,HF5,HF6,HF9,HF15},{HF6,HF7,HF9,HF5,HF15}。
图8 历史累积特征值与容量的Spearson相关系数
5 实车动力电池SOH估计模型构建
5.1 基于循环神经网络的实车动力电池SOH估计模型
循环神经网在处理当前样本的同时,会接受前一刻隐层状态信息,因此对于电池健康度这类具有显而易见时间序列特性的数据,循环神经网络更具处理优势,其中的典型结构为长短期记忆网络(LSTM)和门控循环单元网络(GRU)。
5.1.1 长短记忆网络(LSTM)
LSTM网络结构如图9(a)所示,引入记忆结构C完成线性信息传递,并将非线性信息输出给隐含层ht,该过程引入输入门it、遗忘门ft、输出门ot。计算过程如式(9)~式(13)所示,式中,下标t和t-1表示当前和上一时刻,ct和图片分别为t时刻内部状态和候选状态,xt、ht-1分别为当前时刻的输入和上一时刻隐含状态,σ(∙)为Losgistic函数。it为输入门,用于保存当前时刻候选状态图片的部分信息;ft为遗忘门,用于遗忘上一时刻内部状态ct-1的部分信息;ot为输出门,用于输出当前时刻内部状态ct的部分信息给外部状态图片。
5.1.2 循环神经网络(GRU)
GRU传递结构图如图9(b)所示,引入更新门zt来代替LSTM网络的输入门和遗忘门,如式(14)、式(15)所示,当zt=0时,当前状态ht和前一时刻状态ht-1为非线性关系,当zt=1时,两者为线性关系,式中图片为当前时刻候选状态,通过引入重置门rt重置上一时刻部分隐层信息进行求解,如式(16)、式(17)所示。
图9 LSTM和GRU网络架构Fi
5.2 GRU网络优化
5.2.1 自注意力机制
传统GRU网络对各输入特征的连接程度相同,这限制了模型对重要特征信息的捕捉和表达,导致信息混淆甚至产生梯度消失。在GRU模型中加入自注意力连接层,采用“查询-键-值”模式来动态调节连接权重,实现给予相关性强的特征更大关注度,计算过程如图10所示。对于输入向量X,首先将其映射至查询空间Q、键空间K、值空间V,空间维度分别为q×n、k×n、v×n;其次利用查询空间及键空间生成注意力打分函数;最终采用缩放点积运算得到输出向量Y。
图10 自注意力模型计算过程Fig. 10 Th
5.2.2 RUN优化算法
GRU网络包含神经元数量、初始学习率、正则化系数等初始参数,其中初始学习率控制网络的收敛速度,正则化系数和隐藏节点数决定网络复杂度和拟合度。表3列出12种初始参数设置方案,图11绘制不同方案下SOH的估计结果,灰色区域表示SOH估计结果的波动范围,可以看出模型结果受初始参数的影响较大,最大差异可达到15%。此外,不同初始参数对模型运行时间也有一定影响,其中方案1训练耗时最短(2.916 s),方案12训练耗时最长(11.253 s)。
表3 初始参数设置方案
图11 不同参数设置的GRU模型对SOH的评估结果
本文采用龙格库塔优化算法(Runge Kutta optimizer,RUN)算法寻找隐藏节点、学习率、正则化系数最佳组合,算法流程如图12所示。其中,搜索策略如式(18)所示,式中XRK为四阶龙格库塔系数加权值,ΔX为位置增量,两者与每个粒子的最优位置和当前位置相关。更新策略如式(19)所示,式中,XE、XM、SM分别为种群探索子、种群领导子、搜索策略,r为方向因子,g和u为[0,2]内随机数,SF为平衡因子,与迭代次数有关;此外,当更新程度较低时,在原有更新策略基础上,依式(20)产生第二代新的粒子,其中R为方向因子,取值为1、-1、0,μ和ω为与迭代次数相关的自适应因子,Xave为某个粒子所有迭代中的平均位置,Xnew1与Xave和当前全局最优解相关。若第二代粒子适应度不佳,同理再依式(21)产生第三代粒子。
图12 RUN寻优算法流程
设置RUN算法种群数目为10,迭代次数为30,种群粒子轨迹如图13(a)所示,可以看出,受到平衡因子影响,在迭代初期,种群搜索范围较大,可有效避免陷入局部最优值,在末期逐渐缩小搜索范围,保证模型稳定度。图13(b)标注出某个粒子不同迭代次数的轨迹,可以看出该粒子沿梯度方向搜索,并在5、7、12代通过强化个体质量快速调整方向完成收敛。进一步地,为验证RUN算法寻优效果,与近年来提出的黏菌优化算法(slime mould algorithm,SMA)和非洲秃鹫优化算法(African vulture optimization algorithm,AVOA)进行适应度对比,限定3种算法相同的种群数目和迭代次数,结果如图13(c)所示,可以看出SMA算法在搜索初期速度最快,但在后期接近最优解时由于振荡搜索能力减弱出现搜索停滞,最终停留在局部最优区域;AVOA算法由于仅根据最佳群体信息更新,忽略个体信息,导致收敛速度较慢,迭代末期才接近最优解;RUN算法在25代搜索到最优解,适应度和收敛性均表现最佳。
5.3 RUN-GRU-attention模型构建
引入attention机制合理分配特征学习权重,引入RUN算法对GRU网络部分初始参数进行寻优,最终构建RUN-GRU-attention模型,算法流程和模型参数设置(1#车辆)如图14所示。主要步骤如下:①实车数据预处理。②限制SOC范围和电流阶段计算容量并获取SOH标签。③提取SOH特征值。其中当前工况特征值经灰色关联度析、随机森林重要度分析双重筛选;历史累积特征值经Spearson相关性分析和KPCA分析进行降维;④基于RUN-GRU-attention算法构建实车动力电池SOH评估模型。对于单阶段电流充电片段,直接输出SOH估计结果。对于包含多阶段电流的充电片段,需将不同电流阶段对应的SOH估计结果进行加权求和,其中加权系数由不同电流阶段训练样本估计值的决定系数R2确定。
图13 RUN算法粒子轨迹及不同优化算法适应度曲线对比
图14 RUN-GRU-attention模型流程
6 实验结果与讨论
6.1 容量样本计算方法与模型估计结果分析
为了验证容量样本计算方法对模型估计精度的影响,基于1#车辆数据,设计4种方案进行实验,为保证结果可比性,所有方案均采用相同的特征值提取方法并使用RUN-GRU-attention模型,电池初始容量均为各方案前10次充电片段的容量平均值,除了特征值具体数值及RUN算法获取的最优初始参数组合不同外,其余参数设置相同。训练集和测试集样本数目为4∶1。采用MAE、MAPE(mean absolute percentage error,平均绝对百分比误差)、RMSE、R2评价模型估计精度。SOH估计结果见表4和图15所示,其中方案4在两个电流阶段计算容量,因此包含两个电流阶段的SOH真值和估计值,误差指标为两个电流阶段样本的综合统计结果。
表4 基于不同容量样本筛选方法的SOH估计结果比对
图15 不同容量样本计算方法的SOH评估结果
从图中可以看出不同容量样本计算方法得到的样本数目和SOH真值不同,当充电深度从60%下降至15%时,样本数目减少近50%,较高的充电深度导致训练样本严重不足,方案3的误差指标和模型回归度最差;方案1虽然较方案2样本数目更多,但数据区间内异常电流波动较多,导致计算容量数据离群点多(例如第291次和300次),一定程度上降低了模型精度;方案2避开了倍率突变阶段,样本数量和容量数据集中度较为均衡,模型精度稍高于方案1和方案3;方案4在方案2的基础上,进一步增加训练样本数目,有效平衡样本质量和样本数目,得到较高的估计精度。
6.2 现有模型估计结果分析
基于1#、2#车辆运行数据(训练集和测试集样本数目均为4∶1),与LSTM、GRU、GRU-attention、SMA-GRU-attention、AVOA-GRU-attention模型进行SOH估计比对,原始数据信息及模型参数见表5。为排除运行随机性的影响,对10次实验的估计结果和运行时长取平均,每次实验计算的误差指标为两个电流阶段样本的综合统计结果。
表5 原始数据信息及模型参数
不同模型估计结果如图16和表6所示。估计精度方面,LSTM和GRU模型属于记忆网络,擅长抓取数据时序特征,对SOH变化趋势能较完整表达,但随着充电次数的增加估计误差逐渐增加,例如1#数据集第293次、2#数据集第790次充电片段后,估计值偏离真实值的程度逐渐变大,并且出现估计延迟或异常振荡,这一现象在2#数据集上表现更明显;LSTM模型精度略低于GRU模型,这是由于在处理并非过于复杂的序列数据时,同样训练样本数目下,包含权阈值更多的LSTM模型容易出现过拟合现象;GRU-attention模型由于引入注意力机制,强化特征值权重分配,对突变数据的变化趋势的表征更精确,但由于网络初始参数随机生成,导致部分测试样本的每次估计结果差距较大;SMA-GRU-attention、AVOA-GRU-attention、RUN-GRU-attention增加了网络初始参数自动寻优模块,其中SMA-GRU-attention、RUN-GRU-attention模型精度提升较大,AVOA-GRU-attention模型精度提升程度较弱,这一现象在1#数据集上表现更明显。根据表5可知SMA算法和RUN算法所求的最优参数组合相近,但与AVOA算法寻优结果差距较大,而AVOA-GRU-Attention模型估计精度明显低于其余两种模型,是因为隐藏节点数目过低导致网络没有学习到足够信息产生欠拟合。综合来说,RUN-GRU-attention在两个样本集上误差指标和模型回归度表现最佳,以1#样本数据为例,MAE、MAPE、RSEM指标相较GRU模型分别降低了52.9%、53.4%、56.0%,相较GRU-attention模型分别降低了38.3%、38.5%、44.0%,相较AVOA-GRU-attention分别降低了36.6%、35.9%、38.7%,相较SMA-GRU-attention模型分别降低了21.1%、21.9%、25.7%,决定系数R2相较以上模型分别提高了22.1%、11.4%、7.8%、2.5%。
图16 不同模型在单阶段电流样本上SOH评估结果
表6 不同模型在单阶段电流样本上SOH评估误差对比
计算耗时方面,同样以1#样本数据为例,GRU模型运行时间比LSTM模型节省约63%;SMA-GRU-attention、AVOA-GRU-attention、RUN-GRU-attention模型运行耗时较长,其中寻优模块占总运行时长的97%以上,去除寻优模块后与GRU-attention模型运行时长相当,考虑到网络训练完成后一段时间无需重复训练,因此增加寻优模块不限制模型应用。此外,相较依赖于“隐喻”优化器的群智能优化算法,RUN算法采用无隐喻种族寻优模式,以“微分方程迭代求解”方式代替烦琐的仿生搜索过程,与SMA算法和AVOA算法相比寻优更加精准高效,运行时长分别降低了41.4%、24.0%。
上文在两个数据集的单阶段电流样本集上,对不同模型的估计精度进行了对比分析。1#、2#数据集测试样本数目分别为64个、317个,其中包含多阶段电流的样本数目分别为30个、138个,根据图14的计算流程,若包含多阶段电流样本,则根据训练集R2进行加权求和得到最终SOH估计值,计算方法如式(22)所示。例如对于1#数据集的Ⅰ、Ⅱ阶段训练样本,RUN-GRU-attention模型的R2分别为0.971和0.907,即Ⅰ阶段样本训练集估计精度略高于Ⅱ阶段样本,因此认为Ⅰ阶段估计值对最终SOH估计结果贡献更高。不同模型的估计误差见表7和图17,可以看出,由于2#数据集的样本数目较多,相较1#模型的估计误差更低。综合来看对于多阶段充电片段,RUN-GRU-attention仍表现出良好的估计效果,MAE、MAPE、RSEM指标分别不超过0.0067、0.0072、0.0086,R2高于0.9128,同时随着充电循环次数增加RUN-GRU-attention模型误差收敛性更佳,可有效适应对容量再生和波动趋势,具备更高的应用价值。
表7 不同模型对包含多阶段电流样本的SOH评估误差对比
图17 不同模型对包含多阶段电流样本的SOH评估结果
7 结 论
围绕实车电池健康状态评估面临数据质量低、缺乏有效样本、特征不典型、模型精度有待提高等问题,本文基于RUN-GRU-attention模型建立了一种可适用于阶梯充电的实车动力电池SOH估计模型,主要结论如下。
(1)针对阶梯充电工况分阶段电流计算容量,实现原始数据利用率达96.9%,并与单独限定SOC范围计算容量的方法相比,可实现误差指标降低48.1%以上,决定系数R2提高25.9%以上,该方法可以同时兼顾样本数目和数据质量。
(2)从当前工况、历史累积两个维度提取实车动力电池SOH特征值,对于非线性相关的当前工况特征值,联合灰色关联度分析和干扰性随机森林重要度模型进行双重筛选;对于高度线性相关的历史累积特征值,利用Spearson相关性分析和KPCA分析降信息冗余,最终筛选出5个特征值作为模型输入向量。
(3)对传统GRU模型引入注意力机制合理分配特征权重,利用RUN算法自动获取网络最优的隐藏单元数目、初始学习率和正则化系数组合,构建RUN-GRU-attention模型实现实车动力电池SOH估计。利用两辆实车运行数据集,分别在其单阶段、多阶段电流的测试集上,与其余5种模型进行对比,实验结果表明RUN-GRU-attention模型估计精度更高,MAE、MAPE、RSME、R2指标分别优于0.0071、0.0075、0.0086、84.1%,并且随着充电循环次数增加表现出良好的误差收敛性,可有效预测SOH波动趋势。