基于随机森林的智能电网多源数据异常检测

2024-04-13 06:54王金忠吴焰龙
电子设计工程 2024年7期
关键词:传输速率电网森林

王金忠,吴焰龙

(国网宁夏电力有限公司宁东供电公司,宁夏银川 750411)

随机森林是一种分类器结构,可以利用树状节点组织实施对样本数据的训练与预测处理。在机器学习领域中,一个随机森林分类器同时包含多个决策树组织,且数据样本输出类别可由决策树节点指标取值直接决定[1]。一个稳定的随机森林模型能同时面对多种不同的数据样本,并在判断样本信息所属类别时,确定评估变数指标的取值范围。与其他类型的分类器结构相比,随机森林模型不需要平衡数据样本之间的误差关系,只要数据样本之间的亲近度关系满足随机性原则,就可以认定这些样本信息属于同一个数据集合[2]。决策树组织作为随机森林模型的核心应用结构,其对于数据样本的承载能力决定了随机森林模型对于数据信息参量的实时处理能力。

智能电网是一种新型的电力应用网络,为了实现高度智能化的电网调度,需要不断完善电力设备之间的连接关系,一方面提升输电信号的瞬时传输速率,另一方面避免电网多源异常数据出现过度堆积的情况[3]。随着智能电网多源数据输出量的增大,常规数据、异常数据会混合在一起,但由于二者之间传输速率的差异相对较小,智能电网主机面临难以精准检测多源异常数据的问题。基于多尺度低秩模型的检测方法通过定义隐含异常数据的方式,确定数据样本的实时传输速率[4]。然而此方法并不能在保证常规数据传输速率的同时避免异常多源信息出现快速传输的行为。为解决上述问题,设计基于随机森林的智能电网多源数据异常检测算法。

1 暂态稳定性评估

1.1 随机森林构建

随机森林模型的构建包括样本极值求解、表达式总结两个处理环节[5-6]。对智能电网多源数据而言,基于随机森林模型的样本极值由极大值与极小值组成,求解如下:

式中,χ表示智能电网多源数据样本的统计系数,e表示随机向量的初始赋值,r表示多源数据样本的编码向量,qr表示基于r向量的数据样本特征,ir表示数据样本的多源定义系数。设α、δ为两个随机选取的数据样本模系数,u^ 为智能电网多源数据的暂态度量特征。联立式(1)、(2),可将随机森林模型表达式定义为:

为实现智能电网多源数据的准确分类,在构建随机森林模型时,要求系数α、δ的取值恒不相等,且系数样本的取值量随智能电网多源数据累积量的增大而增大。

1.2 评估指标的选取

评估指标的选取是基于随机森林模型检测智能电网多源异常数据,可以将异常多源信息与常规传输数据区分开来,从而帮助智能电网主机准确辨别待测对象。由于智能电网空间对多源数据的存储能力极强,所以在实施评估指标选取时,必须按照随机森林模型准确定义异常样本参量的传输能力[7-8]。设γ为多源数据参量的异构系数,在智能电网环境中,γ≠0 的不等式条件恒成立。

基于随机森林模型的评估指标选取表达式为:

式中,φ表示异常信息样本置信度系数的初始赋值,i1、i2、…、in表示n个不同的智能电网多源异常数据存储特征,β表示基于随机森林模型的数据样本辨别系数。在智能电网环境中,n系数取值越小,就表示异常多源信息的实时存储量越少。

1.3 暂态稳定裕度

暂态稳定裕度可以用于评估智能电网的运行稳定性,在评估指标选取结果保持恒定的情况下,稳定裕度指标的求解数值越大,就表示智能电网的运行稳定性越强[9-10]。在随机森林模型中,对于暂态稳定裕度指标的计算需要同时考虑评估指标度量值与异常多源信息的表征参量。评估指标度量值可表示为φ,在求解暂态稳定裕度表达式时,要求系数φ的取值必须大于自然数1。异常多源信息表征参量可表示为λ,随着智能电网多源数据存储量的增大,系数λ的取值也会不断增大。联立上述物理量,可将暂态稳定裕度表达式定义为:

②多信道:配置了亚洲4号、3G(电信、联通)、亚洲 5 号(预留)等多种通信信道,实现多信道互备,提高了应急通信的可靠性。

式中,k表示暂态标记系数,k→表示异常多源数据的存储向量。规定在检测异常智能电网多源数据时,存储向量的最小取值结果只能为1。

2 异常检测算法

在随机森林模型的支持下,构建Hadoop 检测框架,再按照多源数据负荷特征求解、异常值检测系数计算的处理流程,实现智能电网多源数据异常检测算法的应用。

2.1 Hadoop检测框架

Hadoop 框架是实现智能电网多源数据异常检测的关键应用结构,框架包含Spark SQL、Spark Streaming、MLlib、Graphx、MapReduce 五类节点。RDD 模块作为核心检测设备,可以接收智能电网主机输出的多源数据样本;Spark SQL 节点负责混合数据的存储;MLlib 节点可以将常规数据从混合样本中分离出来;Spark Streaming 节点可以将异常数据从混合样本中分离出来;Graphx 节点负责传输常规数据样本;MapReduce 节点负责传输异常数据样本[11-12]。完整的Hadoop 检测框架结构如图1 所示。

图1 Hadoop检测框架结构

为将常规数据样本与异常数据样本准确区分开来,在将混合数据样本反馈至各级节点组织之前,RDD 模块需要对智能电网输出的多源数据样本进行多次重复辨别。

2.2 多源数据负荷特征

负荷特征是表示异常智能电网多源数据分布密集程度的量化参数[13]。在智能电网环境中,一般不直接计算整个区域内的电信号负荷密度,而是将整个检测区域按照功能属性的不同,分成多个子区域,再利用随机森林模型,完成对异常多源数据参量的单独预测。在随机森林模型的认知中,异常负荷特征具有可迁移的特性,随着智能电网多源数据输出量的增大,特征指标的计算结果也会不断增大[14]。设为常规电网多源数据的度量向量,为异常电网多源数据的度量向量,且的不等式条件恒成立,联立式(5),可将基于随机森林的异常智能电网多源数据负荷特征表达式定义为:

其中,κ表示电信号负荷系数。智能电网检测区域划分标准的不同,会导致多源数据负荷特征求解结果出现差异性。

2.3 异常值检测系数

异常值检测系数决定了智能电网主机对异常多源数据信息的处理能力。在已知多源数据负荷特征求解结果的情况下,计算异常值检测系数既要考虑随机森林模型的约束作用能力,又要参考多源信息节点的实际定义形式[15-16]。设g1、g2、…、gn为n个随机选取的多源数据节点定义系数,μ为异常值指标的检测度量系数,f为异常智能电网多源数据的选择参量,j为常规数据定义项,j′为异常数据定义项。联立上述物理量,可将异常值检测系数求解结果表示为:

至此,实现对各项指标参量的计算与处理。在不考虑其他干扰条件的情况下,完成基于随机森林的智能电网多源数据异常检测算法的设计。

3 实例分析

3.1 前期准备与实验步骤

选择S11-M 型变压器设备作为实验对象,将其置于220 V 的电路环境中,闭合控制开关,调节变阻器、逆变器等多个设备元件,使变压器设备保持相对稳定的工作状态。利用7090MT 主机捕获变压设备输出的多源数据信息,借助Linux 软件将常规传输数据与多源信息异构体分离开来,并分别对这些数据对象进行后续处理。

表1 反映了实验所选设备的具体型号。

表1 实验设备选型

按需连接表1 中的各个电路元件。首先利用基于随机森林的智能电网多源数据异常检测方法控制数据处理主机,记录电量表示数值,将所得数据作为实验组变量;然后利用基于多尺度低秩模型的检测方法控制数据处理主机,记录电量表示数值,将所得数据作为对照组变量;最后对比实验组、对照组变量数据,总结实验规律。

3.2 实验结果

在智能电网环境中,数据传输速率可以用来描述电网主机对于多源数据样本的检测能力,故该次实验以多源电网数据传输速率作为研究对象,记录在实验组、对照组检测方法作用下,常规数据传输速率、异常数据传输速率的数值变化情况。在常规数据传输速率保持较高水平的情况下,异常数据传输速率越慢,电网主机对于这一类信息样本的检测能力也就越强。

表2 记录了实验组、对照组检测方法作用下,常规数据传输速率的数值变化情况。

表2 常规数据传输速率

分析表2 可知,在实验组检测方法作用下,常规数据传输速率均值为5.64 MB/ms,与标准数值相比,下降了0.02 MB/ms,二者差值相对较小;在对照组检测方法作用下,常规数据传输速率均值为5.34 MB/ms,与标准数值相比,下降了0.32 MB/ms,差值远高于实验组。

图2 反映了实验组、对照组异常数据传输速率的数值变化情况。

图2 异常数据传输速率

分析图2 可知,在智能电网环境中,异常数据传输速率呈现出先增大、后减小的数值变化状态。整个实验过程中,实验组数据传输速率最大值为2.36 MB/ms,与对照组最大值3.79 MB/ms 相比,下降了1.43 MB/ms。

综上可知,在基于多尺度低秩模型的检测方法的作用下,常规数据传输速率与标准传输速率数值相比明显下降,且异常数据的传输速率水平也没有得到有效控制;在基于随机森林检测算法的作用下,常规数据传输速率依然保持在较高的数值水平,而异常数据的传输速率却得到了有效控制,说明此方法在一定程度上能够促进电网主机对多源数据样本检测能力的增强。因此可得,基于随机森林的智能电网多源数据异常检测算法更符合精准检测电网多源异常数据的实际应用需求。

4 结束语

为提升智能电网多源数据异常检测的准确性,提出基于随机森林的智能电网多源数据异常检测方法。根据随机森林模型,选取关键评估指标,通过求解暂态稳定裕度系数的方式,计算多源数据负荷特征与异常值检测系数。实验结果表明,该算法能够在保证常规数据传输速率的同时,避免异常多源信息出现快速传输的行为,可以提升智能电网主机对于电网多源异常数据的检测能力。

猜你喜欢
传输速率电网森林
穿越电网
跨山通信中频段选择与传输速率的分析
哈Q森林
哈Q森林
数据传输速率
哈Q森林
哈Q森林
电网也有春天
一个电网人的环保路
电网环保知多少