基于机器学习的钠离子电池剩余使用寿命预测

2023-08-24 08:56史永胜翟欣然胡玙珺
关键词:钠离子决策树峰值

史永胜, 翟欣然, 胡玙珺

(陕西科技大学电气与控制工程学院, 西安 710021)

锂电池因其高能量密度、高功率密度和长寿命而成为电动汽车的主流储能系统,但随着锂离子电池市场的迅速发展,锂资源短缺问题也越来越突出[1-2],同时锂离子电池的安全性以及价格飞涨问题也限制了其在储能系统上的应用[3]。与锂离子电池相比,钠离子电池因成本低、性价比高、低温性能优异等优势在中低速电动车和大规模储能等领域展现出广阔的应用前景,所以它是非常理想的锂离子电池替代品[4]。然而,钠离子电池在实际应用过程中,会产生各种副反应导致容量退化、性能降低,如果不在钠离子电池寿命终止之前及时替换会引发严重的安全事故。因此,针对钠离子电池特性,开发钠离子电池的剩余使用寿命(Remaining Useful Life,RUL)预测方法对于延长电池使用寿命、保证使用安全具有重要意义[5-7]。

现有的电池RUL预测方法主要包括基于物理学模型、基于统计学方法、基于机器学习的方法等[8],其中基于物理学模型的方法需要对电池的物理特性进行建模和深入研究,但是建模过程复杂、计算量大,同时考虑到电池复杂的非线性行为和耦合效应,其预测精度有限[9]。基于统计学的方法主要采用统计模型来处理电池的历史数据,但是受到数据质量和采样频率的限制,预测精度受到一定程度的影响。

基于机器学习的方法则是利用机器学习技术对电池的历史数据进行学习和建模,以实现电池的RUL预测[8,10]。该方法能适应电池复杂的非线性行为和耦合效应,并且具有较高的预测精度和实时性。常用的机器学习算法包括支持向量回归(SVR)、人工神经网络(ANN)、高斯过程回归(GPR)等。徐佳宁等[11]开发了一种结合SVR的蚁狮优化算法(IALO),它利用了间接健康因素,能够更精确地预测电池RUL。CHEHADE等[12]开发了基于GPR模型的电池容量预测方法,通过引入不确定性度量来交叉关联不同电池单元的容量趋势。然而,由于自充电和容量再生,电池衰退轨迹具有多模态特性,SVR或GPR等传统预测模型无法准确表征这种多模态。

针对以上问题提出了集成算法(EL),EL算法集成了多个单体算法,并加入了有效的策略。与单一算法相比,EL具有预测精度高、泛化能力强、不易陷入过拟合等优点,在预测方面具有无可比拟的优势[13]。EL主要包括梯度提升回归树(GBRT)和随机森林(RF)[14]。ROMAN等[15]采用了机器学习管道的方式对电池健康状态进行了评估,证明了RF在考虑不确定性评估指标时,RF很难校准,并且在预测中过于乐观。因此本文选用GBRT模型,GBRT模型能更好地处理电池衰减过程中的非线性特征,并具有适应复杂关系和多模态的能力。此外,GBRT模型具有高预测精度、鲁棒性和抗过拟合能力,通过组合多个决策树来减少过拟合风险,提高模型的泛化能力。

机器学习的方法具有很好的性能,但它需要有效的训练和大量的实验数据[16]。电池的容量衰减与端子电压的变化密切相关。增量容量分析(ICA)是一种有效的非破坏性分析方法,可以将内部电化学反应导致的电压平台转换为IC峰值[17]。

基于以上分析,本研究制造并测试了一种钠离子电池。从IC曲线提取可以表征电池衰减的健康指标(HI),通过提取的电池HI来预测电池的寿命,使用自测实验数据验证了GBRT模型的有效性。为了提升预测准确性,采用麻雀搜索算法(SSA)确定最佳的超参数,以此来提高算法的性能,并有效防止过度拟合。结果表明,SSA-GBRT模型的预测效果优于当前流行的决策树、RF、SVM、GPR等机器学习技术。平均测试MAE约为9.24,MAPE约为2.76%,RMSE约为13.5,预测误差小于50个周期的计数率可以达到99%。

1 实验部分

1.1 超参数优化算法

麻雀搜索算法(Sparrow Search Algorithm, SSA)是于2020年提出的一种新的群体智能优化算法,其灵感来自麻雀的觅食和反捕食行为。该算法具有全局搜索能力强、稳定性好、收敛速度快的优点。

麻雀在觅食过程中的行为可以抽象为具有侦察和警告机制的生产者-觅食者模型。生产者具有较高的适应能力和较宽的搜索范围,可以引导鸟群进行搜索和觅食。为了提高身体素质,拾荒者跟随生产者觅食。与此同时,一些拾荒者监视生产者进行食物竞争或觅食,以提高自己的捕食率。当整个鸟群受到捕食者的威胁或意识到危险时,它会立即采取反捕食行动。

(1)

麻雀算法的适应能力可描述为

(2)

其中适应度函数f(x)为预测结果与实际数据之间的RMSE。

1.2 梯度提升回归树

梯度提升回归树(Gradient Boosting Regression Tree,GBRT)是一种基于决策树的集成学习算法,通过构建多个决策树对样本进行分类或回归。GBRT通过结合boosting技术来增强传统的决策树方法,其核心思想是聚合一组“弱”模型,形成一个单一的“强”模型,而不是建立一个优化模型。在GBRT中,通过最小化残差生成新的决策树。这种顺序模型构建过程基本上是函数梯度下降的一种形式,即通过在每一步添加一棵新树来优化预测,以最小化损失函数。在GBRT中,平方损失函数因其简单性和一致性而被用于回归问题:

(3)

其中x和y分别为输入特征和响应寿命。L(y,F(x))是预先选择的可行损失函数,用于衡量预测寿命F(x)与真实寿命y的偏差。

假设将构建M个决策树,GBRT框架从初始模型F0(x)开始。对于每次迭代m=(1,2,…,M),补偿残差相当于优化展开系数ρm和αm:

(4)

得到

Fm(x)=Fm-1(x)+ρmh(x;αm),

(5)

根据梯度下降的思想,可以使用最小二乘法求解最优αm:

(6)

其中,β是权重因子,ri是使用先前模型评估的负梯度。

(7)

(8)

新评估的残差模型将根据式(3)添加到先前的模型中。

1.3 对比实验

为了展示本文预测模型的优越性,与其他模型进行对比实验,包括SVR、RF和GPR等预测模型。

SVR是一种基于支持向量机的回归算法,通过在输入特征空间中找到一个超平面,最小化函数间隔之和,并控制预测结果与真实值之间的误差。

RF是一种集成学习方法,通过组合多棵决策树的预测结果来进行回归。它利用随机抽样和特征选择,增加模型的多样性,并通过投票或平均的方式整合各个决策树的预测结果。

GPR是一种非参数的回归方法,利用高斯过程建模,并通过对函数进行采样和后验分布更新来预测新数据点。它能够灵活适应不同数据特征,并提供预测的不确定性估计。

通过对比实验可以评估这些模型在预测任务上的性能表现,以证明本文提出的模型在性能上的优越性。

2 电池老化实验与特征提取

2.1 电池老化实验

对钠离子电池进行了长期循环实验。将组装的Na4Fe3(PO4)2P2O7电池静置10 h,促进稳定的SEI层形成。实验在30 ℃恒温环境中进行,实时监测电压、电流等参数(图1)。活化阶段进行了0.1C倍率的充放电循环,随后分别进行了1.0C、1.5C和2.0C倍率的充放电循环。充电阶段:以0.128 mA的电池恒流充电至3.8 V,转入恒压充电直到电流降至0 mA,搁置5 min。放电阶段以0.128 mA的电流放电至1.8 V,搁置5 min,如此循环。图2展示不同倍率下钠离子电池的容量衰减曲线,在2.0C、1.5C和1.0C倍率下分别循环1 156、1 717、1 955次。

图1 充放电策略

图2 钠离子电池的容量衰减曲线

2.2 老化特征提取与分析

2.2.1 容量增量分析 容量增量分析(Incremental Capacity Analysis,ICA)作为一种有效的非破坏性电池分析方法,已被广泛用于了解电池老化机制。ICA将电压平台转化为增量容量(IC)峰值,间接反映了内部化学反应的平衡过程。通过建立内部电化学特性和IC峰值的对应关系评估电池容量和内部相变。选择ICA方法研究钠离子电池的老化特性,通过IC曲线评估老化状态和观察活性材料的嵌入和脱嵌过程(图3~图5)。

图3 未滤波处理的IC曲线

对IC曲线数据进行微分计算:

(9)

其中,Q代表容量,V代表终端电压,It表示t时刻的电流。

钠离子电池的IC曲线基于实验测量(电压和电流)。因此,IC曲线的形状对于测量噪声非常敏感,特别是在引入导数运算符的情况。图3为未滤波处理的IC曲线。使用文献[18]提供的方法进行平滑和滤波,即Savitzy-Golay滤波器。窗口的点数设置为10,多项式阶数设置为2,电压间隔为20 mV。图4为滤波后2.0C倍率下钠离子电池的首次充放电曲线,IC曲线电压平台与IC峰值一一对应。

图4 电压平台与IC曲线

在不同充放电倍率下测试放电过程的IC曲线,实验结果如图5所示,随着循环次数的增加,IC曲线的峰值、对应电压和峰值面积减小,而斜率增大。这表明电池逐渐老化,容量下降,内阻增加,电池的衰减速度加快。因此,IC曲线中的峰值、电压和峰值面积提供了关于电池容量和衰减速度的重要信息。

图5 放电IC曲线

综上所述,本文选用IC峰的变化数据来预测电池RUL。

2.2.2 健康指标 根据前文的IC曲线分析,选择放电过程中的IC峰值、峰值对应的电压值、峰值面积以及峰值斜率这4个变量作为电池的老化健康指标(Health indicators, HI),分别简化为HI1、HI2、HI3和HI4。

采用灰色关联分析来表征所提出的HI与钠离子电池RUL的相关性。

ξi(k)=

(10)

其中,ρ为分辨系数,取值范围[0,1]间,本文取0.5,其中i代表特征量,k为剩余循环次数,x0(k)和xi(k)分别是计算关联度所需变量。

各个HI与容量衰减相关强度如表1所示,4个老化指标HI1、HI2、HI3和HI4与RUL的ξ均超过0.7,这表明指标之间存着非常强的相关性,而且HI1、HI2、HI3的ξ均超过0.8,这证明选用HI预测钠离子电池RUL具有可行性。

表1 HI与RUL的相关系数

2.2.3 基于主成分分析的HI降维 机器学习方法容易受冗余信息的影响,可能导致过拟合。因此,在提取HI数据后,采用主成分分析(Principal Components Analysis,PCA)进行降维,以减少维度。

选择IC峰值、峰值电压、峰值面积和峰值斜率这4个变量作为电池老化的HI指标(4维数据),并进行PCA降维。每N个周期(N为1 156、1 717、1 955,分别对应2.0C、1.5C、1.0C倍率),提取HI并组成4维特征矩阵。对输入的样本变量矩阵进行归一化处理,确保数据一致性。

归一化方法公式:

(11)

协方差矩阵Σ公式:

(12)

贡献率Ci和累积贡献率C的计算公式:

(13)

(14)

其中p是负载向量的数量。

本实验选择保留2个主成分,即PCA降维后,数据从原来的四维向量变成了降维后的二维向量。这意味着,选取的2个主成分包含了原始数据中大部分的信息。通过这种方式,可以减少对HI的监测量,同时仍保留了足够的信息来对电池的健康状态进行判断。

3 结果与讨论

钠离子电池RUL预测具体实现过程如图6所示。使用SSA算法优化GBRT模型的超参数,以提高模型的预测精度。在GBRT模型中,需要优化的超参数包括决策树数量、决策树最大深度和学习率。因此,SSA算法的变量维度为3。SSA算法的参数设置见表2。

表2 SSA参数设置Table 2 Parameter settings for SSA

图6 钠离子电池RUL预测流程

由SSA优化算法的适应度曲线(图7)可知,在第8次、第10次和第6次迭代时,适应度已经达到最小值。通过SSA算法寻优,确定了GBRT模型的最佳参数设置(表3)。

表3 GBRT参数设置Table 3 Parameter setting for GBDT

图7 SSA迭代曲线

为了验证电池RUL预测方法的性能,使用训练好的模型对测试数据集的不同电池进行预测。将电池的SOH量化为参考第一个周期的容量衰减率

(15)

其中,Ci表示第i个周期的容量,C1是通过完整的充放电操作测量的第一个周期的容量[10]。

电池的放电性能随着不可逆的电化学降解而下降,接近寿命的终点。当电池实际容量下降到初始容量的80%时,通常需要更换电池[19]。

实际运行中的电池RUL公式:

RUL=nEOL-nt,

(16)

其中,nEOL表示电池的充放电循环总次数,nt表示经过时间t的充电和充电循环数。

基于式(16)对钠离子电池进行RUL预测。图8展示了3个测试电池的RUL预测结果。黑色实线表示真实的RUL值,彩色线条表示采用SSA-GBRT、SVR、RF和GPR预测模型的结果。预测结果显示良好的拟合吻合度,MAPE最低为3.9%,准确性为96.1%。直方图分析显示本文的预测误差小于50个周期的计数率高达99%。

图8 RUL预测结果对比以及误差分布

误差计算公式:

(17)

(18)

(19)

图9展示了不同模型下多次运行的MAE、MAPE和RMSE的箱线图,其中横线和红点表示中值误差和平均误差。SSA-GBRT方法在3个电池的预测结果中表现最低,具有较小的误差范围和异常估计值。图10显示了所有测试单元的平均指标,SSA-GBRT方法相对于SVR、RF和GPR方法,具有更低的MAE、MAPE和RMSE,分别为9.24、2.76%和13.5,进一步验证了其稳健性和优越性。

图9 评价指标对比

图10 评价指标平均值

4 结论

本研究制造并测试了一种钠离子电池,对其进行长期循环老化实验,对电池老化数据经过滤波处理后使用SSA-GBRT预测模型对电池进行剩余使用寿命(RUL)预测,主要的结论如下:

(1)对IC曲线进行平滑和滤波,选择20 mV的电压间隔,减少噪声干扰,所提取的IC曲线能够和充放电的电压平台良好对应,IC曲线峰值所包含的信息可以表征电池老化衰减。

(2)从所获得的老化实验数据中选择了IC峰的峰值、峰值对应的电压值、峰值面积以及峰值斜率作为HI,通过灰色关联分析证明了所选取的HI与钠离子电池容量衰减有较强的相关性。

(3)使用PCA方法可以将HI数据从高维空间降到低维空间中,减少了数据间的冗余性,提高了预测模型的精度和稳健性。

(4)通过实验数据验证了SSA-GBRT钠离子电池RUL预测的准确性及有效性。与传统方法相比,SSA-GBRT方法在预测RUL时表现出较高的准确性,并具有良好的稳健性,RMSE、MAPE和MAE分别在15.2、7%、11.2以下。

猜你喜欢
钠离子决策树峰值
“四单”联动打造适龄儿童队前教育峰值体验
SWAN在线钠离子分析仪的使用及维护研究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
基于决策树的出租车乘客出行目的识别
宽占空比峰值电流型准PWM/PFM混合控制
基于峰值反馈的电流型PFM控制方法
钠离子通道与慢性心力衰竭
钠离子电池负极材料研究进展
还原氧化石墨烯/TiO2复合材料在钠离子电池中的电化学性能