数据驱动的新能源公交车能耗预测

2024-03-21 05:54胡杰杨光宇何陈朱雪玲
机械科学与技术 2024年2期
关键词:公交车注意力能耗

胡杰 , , ,杨光宇 , , ,何陈 , , ,朱雪玲 , ,

(1.武汉理工大学 现代汽车零部件技术湖北省重点实验室,武汉 430070;2.武汉理工大学 汽车零部件技术湖北省协同创新中心,武汉 430070;3.新能源与智能网联车湖北工程技术研究中心,武汉 430070)

为提倡生态文明与绿色出行,新能源公交车的应用日益广泛,准确预估新能源公交车交通能耗不仅可以保证新能源公交车安全、可靠的运行,还可为后续的充电需求测算、生态轨迹规划和电池参数匹配等方面奠定研究基础。

国内外对电动车能耗相关已有一定研究,主要分为3 个方向:其一是通过分析电池的充放电效率、开路电压、等效电阻等特性,使用MATLAB、Simulink 等软件,建立电池模型和车辆能耗模型进行仿真分析[1-2],其二是根据车辆过去一段时间的行驶状态、电池剩余容量及电量消耗率建立数学模型进行能耗预测[3-4],其三是由数据驱动的,从多维度对车辆、电池、工况等参数进行研究,使用大数据、统计学或机器学习的方法预测能耗[5-9]。第一种方向基于实验室条件,但实车运行时电化学反应迅速,工况复杂多变,这种方式过于理想化,很难用于实车能耗预测,第二、第三种方向基于测量的实车数据建立预测模型,但能耗影响因素众多,数据采集困难,因此目前大都方案只对少部分因素作针对研究,预测的准确度也存在不足。

因此,为能充分考虑各种能耗影响因素,对实车能耗进行准确的预测,本文基于1/15 Hz 的低频北京市51 路公交车的运行数据,提出一种基于数据驱动的能耗预测方法,构建包括电池信息、时间信息、行驶工况和驾驶行为信息等6 类特征,建立驾驶行为评价体系,对工况片段进行聚类后分别建立引入注意力机制的LSTM 能耗预测模型,最终实现了对能耗的准确预测。

1 新能源公交车数据及问题分析

1.1 新能源公交车数据分析

本文所用数据内容可包括国标GB/T 32960-2016 中提供的所有可用数据。车辆类型为北京10 辆51 路新能源公交车,数据采集时间跨度为2020 年5 月1 日至2021 年5 月1 日,采样周期为15 s,共采集10 辆车共688 万余条数据,数据信息如表1 所示。

表1 数据采集表Tab.1 Data collection form

1.2 能耗预测问题分析

新能源公交车的能耗预测流程如图1 所示。首先对数据集内的异常值和缺失值进行预处理,然后根据拟定的规则将数据划分为行程片段与工况片段,接着基于工况片段构建电池、时间、行驶工况、驾驶行为等六类特征,最后根据对工况聚类的结果构建基于注意力机制的LSTM 能耗预测面模型,并与传统LSTM、LGBM 等模型进行对比分析。

图1 基于注意力机制的LSTM 能耗预测Fig.1 Energy consumption prediction based on attention mechanism LSTM

2 预处理

2.1 数据预处理

在实车运行中,传感器因技术缺陷或使用环境等因素将导致部分数据的延迟、报错或者缺失,使收集到的数据发生异常,例如停车充电时车速大于0,车辆状态标记为4(无意义)或车辆熄火后一段时间后总电流和车速才降为0。因此需要对数据集进行数据预处理以免除异常数据或缺失数据的影响。

原始数据中还存在一定程度的缺失现象,本文对大段数据整行缺失的情况作删除处理,一些能够根据某些逻辑关系进行填补的如总电流、SOC 等直接进行填补,不能的则利用皮尔逊相关系数法确定与被填补特征相关性系数最高的5 个特征,然后使用随机森林算法填充进行联合填补,填补完成后使用五折交叉验证的方式验证准确度,结果如表2所示。

表2 随机森林填补结果Tab.2 The results of filling with random forests

2.2 行程片段划分

原始数据中含有大量无用或异常数据,先剔除掉一部分无用数据,有助于提高数据的预处理效率,还能为后续的能耗分析与预测提供便利。将包含行驶、停车充电以及停车静止3 种工况的片段称为一个完整的行程片段,具体划分规则如下:1)车辆状态不变;2)充电状态不变;3)前后数据时间差小于240 s。划分后数据样本量小于20 条的片段,分析的意义不大且占用计算资源,对其作删除处理。

2.3 工况片段划分

新能源公交车的运行路径固定,但受部分路段路况或交通流量影响,车辆行驶速度慢且驾驶员需要频繁进行加速或制动操作,将导致车辆能耗剧烈升高。为考虑不同道路工况的能耗差异,根据速度、加速度的周期性变化规律、结合道路信息,将行程片段按里程值划分为5 个小片段,并将之称为工况片段。

图2 为经纬度、速度和加速度变化趋势图,其中为方便分析,将经纬度归一化后画在一张图中,工况片段划分情况如图中虚线所示。按里程值划分的工况片段能一定程度上体现行程片段内部的差异性,为分析行驶工况、驾驶行为提供了极大的便利,但也存在主观性与不准确性,后文将对这些工况片段进一步处理。

图2 速度和加速度随着经纬度变化图Fig.2 Variation of velocity and acceleration with latitude and longitude

3 特征构建

3.1 电池容量计算与修正

电池是电动车的全部能量来源,电池电量的变化能直接反映能量的消耗量,是重要的能耗预测特征。本文通过安时积分法计算当前电池容量,计算公式为

电池内部的化学反应与温度、放电电流大小强烈相关,如低温环境下电池内阻增大,在放电电流相同时,内阻的焦耳热增加,此时电池的能量利用效率降低,可用容量减少,即通过安时积分法计算得到的剩余电量并不代表真实的剩余电量,为保证能耗预测精度,需要对电池容量进行修正。根据文献[10]中所述的流程及公式将电池容量值修正至25 ℃与标准电流时的容量值。修正过程如下:

式中:T为该片段平均温度;CT为温度修正系数;CI为电流修正系数;C和C1分别为修正前、后的电池容量值。

3.2 时间信息

如图3 所示为车辆某连续3 天的能耗变化趋势,可见新能源公交车的能耗具有强烈的时间周期性和渐变性,有必要对时间信息进行深入挖掘。

图3 新能源公交车能耗变化趋势Fig.3 The change trend of new energy bus energy consumption

直接将代表时间的字符串或类别特征输入模型往往学习不到时间周期的共性特点,因此本文提出时钟循环编码,既能保证能耗随时间变化的周期性的渐变性,又能避免独热编码带来的维度爆炸。本文使用时钟循环编码构建季度、周数、天数、该天第几小时、第几刻钟等6 种数值型特征,使用独热编码构建是否高峰期、周末、节假日3 种类别型特征。如图4 所示为该天第i个小时表示方法, 首先,将特征的数值范围首尾相接变成圆形,将数值范围等间距地排列在圆上,在圆心处建立坐标系,此时,圆上任何数据点均可通过二维坐标来表示。

图4 第 i 个小时的式中循环编码表示方法Fig.4 Clock cycle-coded representation of the i hour

式中:因51 路新能源公交车运行时间为早5:30 至晚23:00,因此n=19;ti表示第i个 小时;xi、yi分别表示当前第i个 小时的x轴 、y轴时钟循环编码。此时仅通过二维坐标便可表示任意范围的数据中的每个点,极大减少了特征空间,有助于提升模型的性能。

3.3 环境信息

不同的天气条件对车辆的能耗也有巨大的影响,如雨天雾霾时行车缓慢、冬夏季节车内空调开启,都将显著增加车辆能耗[11-12]。本文使用爬虫技术,获取北京市每天每小时的温度、湿度和风速信息构建环境特征。

3.4 行驶工况

为研究新能源公交车在不同的道路交通情况下行驶工况对能耗的影响[13-14],本文提出一种基于箱线图确定工况阈值的方法构建行驶工况特征。箱线图能反映数据分布的中心位置、散布范围和离散程度。如图5 所示为加速度箱线图,以加速度绝对值的90 百分位数区分急加(减)速。

图5 加速度90 百分位箱线图Fig.5 90th percentile box of acceleration

以同样的方法统计高、中、低、匀、怠速时长、等待时长与占行程片段的比例,以及等时间间隔内加减速的次数等,如此构成行驶工况信息特征。

3.5 驾驶行为

根据相关研究成果可知驾驶员的操作特性与车辆能耗强烈相关[15-16],驾驶特性可以利用踏板开度等信息进行研究。因本文数据为采集频率为1/15 hz的低频数据,无法直接且准确地描述驾驶员的操作行为,对分析驾驶行为与能耗的内在联系造成困难,因此,除构建基本驾驶行为特征如踏板平均状态、加速踏板变化率、踏板保持率等,本文提出一种基于熵权法的驾驶行为评价体系,以评分的方式较为宏观地分析各小片段内的驾驶行为信息,弥补低频数据难以对驾驶行为作准确描述的缺点。

熵权法[17]的核心思想是利用信息熵计算各指标的权值。本文选取与能耗的皮尔逊相关性系数最大的8 项指标,包括速度变化率方差、急加速比、急减速比、踏板保持率、急踩踏板比、怠速比、匀速比、高速比,利用熵权法计算各指标权重,最终得到各工况片段驾驶行为得分。熵权法驾驶行为评价体系建立过程如下:

式中:i=1,2,···,5;j=1,2,···,12;为第i个工况片段中第j个指标数据标准化后的值,根据与能耗的正负相关性选择具体公式;yi j为第i个工况片段中第j个指标的比重;ej为第j个 指标的信息熵;K=1/lnm为常数;aj为最终第j个指标的权值;

驾驶行为评价指标权值如表3 所示。

表3 驾驶行为指标权值Tab.3 Index weights of driving behavior

最终第i个工况片段的驾驶行为得分xi为

3.6 特征库

无用的特征不仅占用大量计算资源,还会降低模型性能,因此需要进行特征筛选。本文使用基尼系数作为评价指标,剔除冗余特征。

式中:mgni为第m个特征的基尼系数;k为特征个数;pmk为节点m中k类别所占比例。

选取特征贡献度较大的前30 个特征作为特征库如表4 所示。因特征数量较多,表4 中仅对特征作简要说明。

表4 特征库Tab.4 Feature list

4 典型工况片段聚类

因特征维度众多,时间因素、工况因素繁杂,模型的学习难度增大。为提高模型预测效果,本文对这5 小段工况片段进一步聚类,对每类分别构建一个子预测模型,各子预测模型预测值相加即为最终的能耗预测结果。

随数据维度的上升,数据点空间密度越来越高,数据与数据之间的距离开始趋向于一个相同的值,此时基于距离的聚类方法开始失效,直接将上述所有特征输入聚类算法中得到的聚类效果很差。为避免维度灾难, K-means 的输入仅包括速度、加速度变化率及标准差、驾驶行为评分以及环境信息共7 维,聚类效果由轮廓系数评价。

对某样本p来说,轮廓系数计算方法为

式中:a(p) 为样本p到同簇其他样本的平均距离,a(p) 越小即样本p的簇内不相似度越小;b(p)为样本i到其他簇所有样本点的平均距离,b(p)越大即簇间不相似度越大;s(p) 为样本p的轮廓系数,s(p)越接近1,说明样本聚类越合理。

通过计算可知k=4 时,轮廓系数最大,此时聚类结果轮廓图如图6 所示,图中虚线为轮廓系数均值。

图6 轮廓系数图Fig.6 Silhouette Coefficient

5 能耗预测模型的构建与结果分析

5.1 LSTM 神经网络

长短时记忆神经网络(LSTM)是一种特殊的RNN,能有效避免后者梯度消失和梯度爆炸等问题,且在时间序列中具有良好的表现,而新能源公交车的运营时间、路程固定,具有很强的时空周期性,因此构建适合解决这类问题的LSTM 能耗预测模型。

5.2 注意力机制

虽然LSTM 在解决长时间序列问题时能通过细胞状态存储历史信息,达到较好的效果,但因LSTM 的输入序列一致,导致模型不能区分长时间序列中各种特征的重要性程度,将在一定程度上忽略某些关键信息。本文引入注意力机制[18],通过对神经元分配不同的权重概率,使模型能选择并学习到重要信息,有助于提高建模性能。注意力机制的结构简图如图7 所示。

图7 中,H1,H2,···,HN,为隐藏层;s1,s2,···,sN为注意力得分;G1,G2,···,GN为注意力权值。相似度得分si(Hi,q) 、 注意力权值Gi及最终输出向量计算方式如下:

式中:q为最后一个隐藏层输出状态;d为输入信息的维度;si为第i个 隐藏层与q的 相似度得分;Gi为第i层注意力权值;c为注意力机制层的输出向量;vi为隐藏层状态。

5.3 LSTM 能耗预测模型

最终构建的模型结构如图8 所示。

5.4 模型预测效果

为探讨聚类和注意力机制对模型建模效果的影响,分组进行5-fold 交叉验证并评估效果,评价指标选用平均绝对百分比误差(MAPE)和均方根误差(RMSE)。结果如表5 所示。

表5 LSTM 模型效果对比Tab.5 Comparison of LSTM model effects

结果显示:LSTM 神经网络的建模效果远好于LGBM、XGBoost 等模型,与此同时,聚类后分别建模和注意力机制的应用均能显著提升模型效果,说明本文提出方法有效,最终的LSTM 能耗预测模型平均绝对百分比误差为2.1%,均方根误差为0.015,如图9、图10 所示的为最终预测模型评价指标的分布。

图9 测试集平均绝对百分比误差图Fig.9 MAPE of test sets

图10 测试集均方误差图Fig.10 RMSE of test sets

6 结论

本文深入分析基于工况片段划分的多源信息如电池信息、时间信息和行驶工况及驾驶行为信息等,建立熵权法驾驶行为评价体系弥补低频数据评估困难的问题,将工况进行聚类以提高各类特征与复杂多变的运行工况的关联度以提升模型预测效果。本文构建的引入注意力机制的LSTM 能耗预测模型能在长时间序列中捕捉关键能耗影响因素,显著提升了预测精度。经5-fold 交叉验证以及其他传统模型的对比分析,最终预测模型效果优秀,其测试集平均绝对百分比误差为2.1%,均方根误差为0.015,最终实现了新能源公交车能耗的准确预测。

猜你喜欢
公交车注意力能耗
120t转炉降低工序能耗生产实践
让注意力“飞”回来
能耗双控下,涨价潮再度来袭!
你们认识吗
探讨如何设计零能耗住宅
日本先进的“零能耗住宅”
公交车上
公交车奇妙日
“扬眼”APP:让注意力“变现”
城里的公交车