基于数据挖掘和LSSVM的电量大数据多维感知方法

2024-01-12 04:39岳宝强杨波李彪曲小康魏飞
微型电脑应用 2023年12期
关键词:电量数据挖掘负荷

岳宝强, 杨波, 李彪, 曲小康, 魏飞

(国网山东省电力公司临沂供电公司, 山东, 临沂 276000)

0 引言

由于电网处于动态运行状态,电网产生的电量大数据也处于实时变化的状态,因此需要对电量大数据进行实时多维感知,及时发现电网出现的故障以及异常情况[1]。

文献[2]提出了基于边缘计算的电力数据感知自适应处理方法,设计了基于计数Bloom滤波器的边缘节点数据自适应感知机制,能够自动识别电力数据类别与对应字段,还设计了可移植的文件尾识别插件,能够对数据副本管理系统的边缘节点进行感知和自适应处理,但该方法的感知敏感度较差。文献[3]提出了基于智能感知的电力多元数据处理方法,利用电力数据智能感知设备采集基础电力数据,以数据集成整合的方式获得电力多元数据集群,挖掘热点信息数据,通过聚类、迁移等方式处理电力多元数据集,但该方法的感知结果不够准确。

为了解决以上研究成果的不足,本文提出基于数据挖掘技术和LSSVM算法的电量大数据多维感知方法。本文的创新点在于数据挖掘技术和LSSVM算法的融合与应用,基于数据挖掘技术处理的数据,利用LSSVM算法的高维模式识别优势,弥补传统单维预测方法的不足,采用经验风险极小化准则,用核函数来求解非线性回归问题,从而获得准确度较高的感知结果,提升电量大数据的感知性能,进而增强电量大数据的应用价值。

1 电量大数据多维感知方法设计

1.1 利用数据挖掘技术建立多维电量数据模型

图1为关联规则数据挖掘过程。

图1 多维电量数据挖掘流程图

按照图1在给定的数据集中发现关联规则,其任务就是发现事物之间的相关性。关联规则可以表示为

(1)

式(1)中,Ai和Bi分别表示不同维度的数据规则。由电量数据挖掘的内容确定聚类量,进而构造相似矩阵,对隶属度矩阵和加权指数进行初始化,直至达到式(2)所表示的约束条件。

(2)

式(2)中,变量uij表示第j个电量数据属于第i类的隶属度。根据实时数据挖掘的结果随机选择聚类中心,并更新聚类中心矩阵[4-6]。当达到最大迭代次数时,停止聚类并输出新的电量数据矩阵,最终根据结果由隶属度矩阵确定数据对象的所属类别,以此作为电量数据的多个维度。进行数据感知时,要求按地区和月、年进行分析,所以在创建多维数据集时要加上地区维和时间维,且两维度均为共享维[7]。通过数据的分类存储,以及数据维度的添加,得出电量数据多维模型的构建结果。

1.2 多维电量大数据预处理

1.2.1 填补缺失数据

由采集的原始用电数据集确定因变量和自变量,提取缺失数据位置前后5个数据,并将10个数据组成一组,利用式(3)对电量数据中缺失的所有数据依次进行插值填补。

(3)

式(3)中,x和xi分别表示电量数据的均值和缺失值,yi表示非缺失电量数据,Ln(x)表示缺失电量数据的插值填补结果。将挖掘的所有电量数据按照式(3)进行处理,保证挖掘数据的完整性。

1.2.2 修正错误数据

定义电量数据错误的判定条件如下:

(4)

式(4)中,变量y(t-1)、y(t)和y(t+1)分别表示在t-1、t和t+1时刻的数据挖掘结果,χ1和χ2表示设置的判定阈值。若待处理数据满足式(4)的判定条件,则将其代入式(5)进行错误修正处理。

(5)

根据式(5)的处理方式,将前后正常数据的平均值赋值给错误数据,完成对错误数据的修正处理。

1.2.3 数据标准化

为避免出现计算饱和现象,按照式(6)对初始数据进行归一化处理。

y′(t)=lg(y(t))

(6)

最终得出的结果y′(t)即为标准化处理后的数据。通过对异常数据的修正与标准化处理,最终完成对多维电量大数据的预处理。

1.3 提取电量数据特征

由于电量数据时间上具有周期性的特点,需要按照周期对该时间序列进行特征提取,因此通过分析电量数据在时序上的特点,分别从趋势性指标、变动性指标及负荷特征指标等3个方面对其进行特征提取。其中,电量上升与下降趋势特征的量化提取结果如下:

(7)

式(7)中,at和bl分别表示低于或高于标准值的电量数据,l表示数据总量。变动性指标是指用户用电模式前后的差异度,主要包括前r日和后r日电量平均值之间的差异,以及目标时间前后快速傅里叶变换的系数序列差,计算公式如下:

(8)

式(8)中,Y1和Y2分别表示前后r日的快速傅里叶变换系数序列。负载特性指标主要包括每天不同时段的用电数据的峰谷差、峰期负荷率、平期负荷率、谷期负荷率等,峰谷差反映了电网的调峰能力,峰期负荷率、平期负荷率和谷期负荷率分别反映了峰期负荷、平期负荷和谷期负荷的变化。以日峰谷差为例,特征指标提取结果如下:

(9)

式(9)中,Loadmax和Loadmin分别表示日电量负荷的最大值和最小值。同理可以得出其他负载特性指标的量化提取结果。

1.4 利用LSSVM算法预测多维电负荷变化量

电量数据具有增长和季节性两种趋势,影响因素众多且不确定。对于季节波动数据,在未引入其他变量的情况下,单纯依靠单一的电量数据建立预测模型进行预测,不能全面反映电网内外相关因素与售电量的关系,因此本文利用LSSVM算法弥补单维预测方法的不足。LSSVM算法采用经验风险极小化准则,用核函数来求解非线性回归的问题,对于给定的数据集(xi,yi)(见图2),若能准确地由某一超平面分离,则该超平面的距离最大,称为最优超平面。

图2中,L表示最优超平面。由此,可以将原始最优化问题量化表示为

(10)

式(10)中,ω、δ和ε分别表示多维电量数据特征的权重、偏移量和误差,κ表示算法训练过程中的惩罚参数,N表示提取的电量特征量。通过定义不同于标准SVM的损失函数,LSSVM将不等式约束转化为等式约束,得到了拉格朗日函数构造的结果:

(11)

式(11)中,αi表示拉格朗日乘子。通过定义LSSVM算法的核函数得出最小二乘支持向量机的函数估计为

(12)

式(12)中,H(x,xi)表示核函数,用来解决原始空间中不能线性回归的问题。根据上述LSSVM算法的预测与迭代原理,在多维电负荷变化量的预测过程中,对相关参数进行优化后,将所提取的多维电量特征数据和最佳参数导入LSSVM算法,通过训练得到相应的预测模型,再输入测试数据,得到最终的电量变化预测结果为

(13)

式(13)中,Ele(t)和Ele(t+1)分别表示前后2个时刻的电量值。以式(13)的计算结果作为电量大数据的多维感知条件,与用户的电量上限阈值进行对比,若电量感知值高于电量阈值,则判定当前存在电量越限情况,即用户用电存在异常,否则判定该用户处于正常用电状态,可以执行下一时刻的数据感知。最终,将包含电量感知数据以及运行状态的感知结果以可视化的形式输出。

2 算例分析

为了测试本文方法的感知性能,以国网山东电力数据中台、“网上电网”PIS2.0系统、临沂供电公司能源大数据中心、山东公共数据开放网作为数据来源设计测试实验。截至2021年10月,供电网的供电总面积达到了502 km2,涉及供电居民数量约41.35万人,2021年城市最高用电负荷为1 140 000 kW,平均月供电量为61 500 kW。

2.1 准备实验样本数据集

根据供电网电量的数据统计信息,以日为单位建立多维样本数据集。在时间维度上,收集研究期间各个时刻的实际电量数据,并生成波动曲线,如图3所示。

在空间维度上,分别选择供电区域内的4个用电用户的用电量数据,如图4所示。

图4 各区域电量变化示意图

将图4的电量数据与图3的时间维度数据融合,得到多维数据样本,并平均分成4个组别,每个组别包含的电量数据量相同,以此作为验证电量大数据多维感知是否正确的对比标准。

2.2 设置实验运行参数

由于优化设计的电量大数据多维感知方法应用了数据挖掘技术和LSSVM算法,因此需要在开始实验之前在实验环境中分别设置数据挖掘和LSSVM算法的运行参数。设置样本数据的连续挖掘时间为2 h,挖掘时间间隔为1.0 s。LSSVM算法中数据偏移量δ取值为0.5,惩罚参数κ取值为0.8,核函数选择的是高斯径向基核函数。此外,为了判定当前电量是否存在异常,设置用户的电量上限阈值为1800 kW。

2.3 选择感知性能评价指标

合理全面的拟合误差和敏感度分析便于有效评判电量大数据多维感知方法的性能,因此选取拟合误差作为感知性能的评价指标,其数值结果如下:

(14)

(15)

式(15)中,ΔT表示电量大数据多维感知的时间开销。从式(15)可以看出,时间开销与感知敏感度之间存在负相关关系,因此统计得出的时间开销越大,证明对应感知方法的敏感度越差。

2.4 实验过程与结果分析

将本文方法应用到研究环境中,得出测试时段的数据感知结果,其中实验组别1的感知输出结果如图5所示。

图5 电量大数据多维感知结果

同理可以得出其他组别的电量大数据多维感知结果。为了体现本文方法的性能优势,将传统的基于聚类算法的电量大数据感知方法作为实验的对比方法,并保证在实际运行过程中2种方法的运行环境与处理样本数据相同,以此控制实验变量唯一。将2种感知方法的输出结果与准备的样本数据进行对比,得到反映感知精度的对比结果如图6所示。

(a) 研究区域1

从图6可知,本文方法得出的数据更接近设置的实际数据。将图6中的数据代入式(14),可以得出对比方法与本文方法的平均拟合误差分别为15.6 kW和7.2 kW,即本文方法的感知精度更高。这是因为本文通过填补缺失数据、修正错误数据和数据标准化等3个步骤对数据进行了预处理,从趋势性、变动性及负荷等3个方面提取电量数据特征,为准确感知提供了优秀的数据基础,并利用LSSVM算法预测多维电负荷变化量,根据经验风险极小化准则,从而获得精度较高的感知结果。

2种方法的感知敏感度测试结果如表1所示。

表1 感知敏感度性能测试数据表

通过式(15)的计算,可以得出对比方法的敏感度指数为0.207,本文方法的敏感度指数为0.595。

3 总结

为了进一步丰富供电公司电量感知方法,提高感知准确性和规范性,本文在数据挖掘和LSSVM的技术支持下,实现电量大数据多维感知方法的优化,为供电网建设提供了有益的补充,进一步加强了电网企业经营指标控制、预测研判,为供电经营决策提供了参考。

猜你喜欢
电量数据挖掘负荷
电量越低越透明的手机
探讨人工智能与数据挖掘发展趋势
四川2018年7月转让交易结果:申报转让电量11.515 63亿千瓦时
基于并行计算的大数据挖掘在电网中的应用
电量隔离传感器测试仪的研制
防止过负荷时距离保护误动新判据
主动降负荷才是正经事
一种基于Hadoop的大数据挖掘云服务及应用
负荷跟踪运行下反应堆一回路控制系统仿真与验证
北斗通信在小型水电厂电量采集中的应用