基于时序信号图像编码和生成对抗网络的配电网台区数据修复

2023-01-12 03:11刘科研周方泽
电力系统保护与控制 2022年24期
关键词:台区时序配电网

刘科研,周方泽,周 晖

基于时序信号图像编码和生成对抗网络的配电网台区数据修复

刘科研1,周方泽2,周 晖2

(1.中国电力科学研究院有限公司,北京 100192;2.北京交通大学电气工程学院,北京 100044)

受不可抗力影响,配电网低压台区数据中普遍存在缺失值,整体数据质量较差,限制了台区的精益化管理水平。传统的数据修复方法忽略了数据的周期性和时序性,修复精度较低。提出了一种基于图像编码和生成对抗网络的台区缺失数据修复方法。首先引入了一种一维时序信号编码图像预处理方法,将原始的时序信号转换为格拉姆角场图像,然后利用卷积神经网络在图像特征提取上的强大优势构建了生成对抗网络模型。结合像素损失和相似性损失的双重约束条件增强了生成图像的质量。整体流程由数据驱动,无需先验知识的分布假设与显式物理建模。最后的算例结果表明,该方法能够较为精确地实现台区缺失数据的修复。

配电网;缺失数据修复;生成对抗网络;格拉姆角场

0 引言

在“碳中和,碳达峰”的能源革命大背景下,配电网作为支撑经济社会发展的重要基础设施,是支撑“双碳”目标实现和智慧电网建设的关键性环节[1-2],利用大数据技术来指导电网运行和管理已经成为一种共识[3-4]。台区分布广泛,设备众多,数据在采集、测量、传输、转换等各个环节都可能出现故障或干扰,导致数据出现缺失,严重影响了台区的精益化管理[5],缺失数据的精确修复对提升台区管理水平有着重要意义。

传统的缺失值处理方法可以分为基于回归的方法和基于机器学习的方法。前者的思想是利用无缺失的历史数据来对缺失值进行预测,如文献[6-7]分别使用ARIMA模型和支持回归向量机来对缺失值进行修复。这种方法的缺点是仅仅利用了缺失值之前的信息,损失了缺失值之后的可利用数据信息,且不适用于数据缺失量太大的情形。后者的思想是将时间序列数据视为结构化的数据,通过挖掘数据间蕴含的相关性完成缺失数据的修复,如文献[8]使用矩阵分解方法。这些方法往往依赖于严格的假设,且没有考虑到数据中的时序相关信息[9]。

随着计算机技术的发展,基于深度学习的方法[10-11]在数据修复的问题上展现出了超越传统方法的优越性,这是因为基于深度学习的方法具备挖掘时序信息时隐藏信息的能力[9]。在2014年,Goodfellow提出了生成对抗网络[12](generative adversarial network, GAN),这一模型能够估测数据样本并在潜在分布中生成新的样本,在缺失图像修复和高分辨图像重建上取得了丰硕的成果[13]。在电力系统领域,GAN已经在样本生成上得到了成功的应用[14-15],这说明GAN能够精确地提取电网数据的潜在特征并生成符合真实分布的样本。文献[16]提出了将GAN用于电力系统量测缺失值的修复问题,且在大量数据缺失的情况下仍能保持较高的修复精度。文献[17]对GAN的结构进行了改进,为判别器额外设计了提示机制。文献[18]结合了门控循环单元和GAN两种模型,对波动性较大的光伏出力数据进行了修复。

上述研究虽然取得了一定成果,但大多是基于原始的一维信号通过一维卷积网络或全连接网络生成新数据。传统GAN模型对于一维数据特征的提取能力不足,容易出现特征丢失的情况,导致生成的数据质量较低。且基于一维卷积和全连接神经网络的特征提取方式会使得网络参数数量远多于二维卷积,在训练过程中容易发生模式崩溃(Mode collapse)的问题。

在对抗生成网络的基础上,本文引入了一种一维时序信号编码为二维图像的方式,将传统的一维时序数据修复(Imputation)问题转化为二维的图像修复(Inpainting)问题,利用全卷积神经网络实现图像潜在特征的提取,显著减少了网络参数数量。最后通过生成图像对角线元素的逆编码,实现台区缺失数据的修复。实验结果表明,本文提出的方法在不同的缺失率下均表现出了良好的修复性能。

1 基本原理

1.1 图像编码方法

图1 一维信号编码成像过程

Fig. 1 A one-dimensional signal encodes to image

1.2 生成对抗网络

生成对抗网络是一种深度生成模型,源自博弈论中的纳什零和博弈[22],通过让两个神经网络以相互博弈的方式进行学习。GAN由一个生成网络(generator network)与一个判别网络(discriminator network)组成。生成网络从潜在空间(latent space)中随机取样作为输入,其输出结果需要尽量模仿训练集中的样本。判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能地分辨出来。这两个目标相反的网络相互对抗,不断调整参数,当最后收敛时,GAN达到纳什平衡,此时判别网络再也无法判断出一个样本是来自于真实数据集还是生成网络,即等价为生成网络可以生成符合真实数据分布特征的样本[23]。GAN的模型架构如图2所示。

图2 GAN网络模型

2 数据修复模型设计

2.1 生成对抗网络模型架构

对于台区缺失数据修复问题,本文提出的整体生成对抗网络框架如图3所示,包含了一个生成网络和一个判别网络。其中的网络结构与自编码器(auto-encoder)相似,通过无监督的方式来学习数据的有效编码。编码器学习缺失图像的有效特征表示并将其映射为隐变量,解码器则尝试通过隐变量生成图像的缺失部分。Encoder和Decoder是一个互为逆运算的过程,从而更好地实现重构。采用全卷积神经网络来构建,网络的详细参数见表1。

图3 基于生成对抗网络的缺失数据修复框架

表1 生成器网络结构

的输入为单通道24×24的GAF图像,采用卷积神经网络设计的普适性法则对网络结构进行设计,即在确定输入的维度和通道数后,逐层增加通道数,并对特征维度逐层进行缩减。考虑到原始输入图像的维度较低,为了充分提取图像特征,在C1和C2层增加了通道数,但没有对维度进行缩减。在每个2D卷积层后均添加批归一化(Batchnorm)层,提升神经网络的训练速度[24]。激活函数选择LeakyReLU,避免深度网络中梯度消失的问题[25]。为了充分保留图像的边缘信息,对卷积层的输入进行零填充,padding取值为1。缺失图像在经过编码器后被映射至(1000×1×1)的隐变量空间中。需要指出的是,缺失图像修复不需要自编码器将隐变量还原为原始输入,因而不要求编码器将输入映射至低维空间[26]。解码器(C7—C10)的网络结构与编码器基本类似,区别在于用反卷积层替代了编码器中的卷积层。相似地,在反卷积层(C7—C9)后添加批归一化层,激活函数均选择LeakyReLU,C10的激活函数选择Tanh。各反卷积参数经过人为设计,以确保反卷积操作后的最终输出维度与输入的缺失图像维度一致。

判别器(C11—C14)的网络结构与编码器类似,网络的详细参数见表2。区别在于最后输出层C14的激活函数选择为sigmoid,将输出映射至[0,1]区间,表示判别数据来源于真实数据集的概率。为了进一步提升的判别水平,引入了图像修复领域中的PatchGAN[27],即的输出为一个2×2的矩阵,迫使关注图像的更多区域。

表2 判别器网络结构

神经网络的参数学习是一个非凸优化问题,参数初始值的选取关系到网络的优化效率和泛化能力。对于GAN中的卷积层,均采用均值为0、方差为0.02的高斯分布对每个参数进行随机初始化。

2.2 缺失数据修复流程

该模型的缺失数据修复流程如图4所示,整体可以分为两个阶段,首先基于训练集对模型进行训练,然后将测试集数据输入训练完成的GAN网络,实现缺失数据的修复。

图4 缺失数据修复流程

Fig. 4 Flow chart of missing data imputation

2.3 生成对抗网络优化目标

另一方面,真实性损失则是使得的生成结果更接近实际图像,如式(10)所示。

结合以上两个损失函数,GAN生成缺失图像过程,总损失表示为

3 算例分析

本文使用Intel I7 3.0 GHz CPU,16 GB RAM 配置以及Windows10 64 位操作系统的PC,以Pytorch为深度学习框架编制Python程序,以实际的台区数据对所提算法的性能进行了验证。

3.1 数据预处理

将前300天的数据划分为训练集,后65天的数据划分为测试集。考虑到现实中台区采集数据的缺失位置以及数量不可控,具有极强的随机性与不确定性,实验在设置掩码矩阵时不人为指定固定缺失点,而是在保证缺失数量时随机生成掩码矩阵。如设置数据缺失率为20%时,对于一条有100 个采样点的样本,其缺失值将在20 个采样点上下浮动,以此来量化模型对台区缺失数据的修复效果。

设置数据缺失率为20%,以第301天到第306天共6天的负荷曲线为例,每一天的曲线编码成为一个图像,编码后的无缺失图像和缺失图像分别如图5和图6所示。

由图5可知,编码后的图像具备高度的相似性,这是因为原始的台区负荷曲线具备相似的周期性和形态。所提出的模型对图像中所蕴含的隐式特征进行识别和提取,进而完成对于缺失图像的修复。由图6可知,由于在设置掩码矩阵时随机指定缺失位置,因而呈现出不同的缺失区域。

图5 无缺失图像

图6 缺失图像

3.2 数据修复评价指标

以均方根误差(root mean square error, RMSE)和平均绝对百分比误差(mean absolute percentage error, MAPE)作为衡量数据修复效果的指标。计算公式为

3.3 缺失数据修复结果

同样以第301天到第306天的负荷曲线为例,利用GAN网络实现图像修复后的结果,如图7所示。

将图7与图5进行对比,可以看出修复后的图像与原始的无缺失图像表现出了高度的一致性,这证明了所提出的GAN模型能够取得良好的图像修复效果。

图7 修复图像

图8 台区负荷修复结果

由图8可以看出,修复后的曲线精确地刻画出了台区负荷的周期性,整体拟合性良好。在缺失率为20%的情况下,对于缺失数据的修复精度达到了2.14%。测试集中共有292个缺失点,详细的修复效果如表3所示。

表3 修复数据MAPE误差分析表

由表3可以看出,71.92%的缺失数据修复误差小于2%,数据的整体修复效果良好。仅有2.74%的缺失数据修复精度超过5%,其中最大误差为10.94%,属于可接受的范围。

为了进一步验证模型在不同缺失率下的修复精度,设置测试集的缺失率从20%递增至90%,模型的修复效果如表4所示。

表4 不同缺失率下的数据修复误差

由表4可知,本文提出的修复模型在不同的缺失率下均保持了较高的修复精度,且整体的修复精度并不随缺失率的上升而发生明显下降,平均误差仅为2.39%。从细节上看,在缺失率超过80%时,修复性能较低缺失率情况发生了一定的降低,但是仍然维持在一个较为精准的水平,实验结果证明了本文所提模型在数据修复问题上的优越性。

4 结论

本文提出了一种基于图像化编码和GAN的应用于台区缺失数据的修复方法。该方法首先引入了一种一维信号的图像化编码方法,将传统的一维数据修复问题转换为二维图像修复问题。然后利用GAN无监督的自学能力和卷积神经强大的特征提取能力,利用完整数据进行了数据分布特征的隐式建模,克服了物理建模的表征难题,完全依赖于数据驱动,是一种“端到端”(end to end)的数据修复方法。为了进一步优化GAN的生成性能,提出了像素损失和真实性损失的双重约束。在不同的缺失率下,本文方法均表现出了良好的适应性,证明了该方法在数据修复问题上的优越性。

[1] 黄少雄, 王璨, 孔庆竹, 等. 含短期预测的光伏配电网智能调压策略[J]. 热力发电, 2020, 49(7): 21-27.

HUANG Shaoxiong, WANG Can, KONG Qingzhu, et al. Intelligent voltage regulation strategy of photovoltaic distribution network considering short-term forecasting[J]. Thermal Power Generation, 2020, 49(7): 21-27.

[2] 王赞, 陈光, 董晓, 等. 基于工业互联网的智慧能源服务系统架构研究[J]. 电力系统保护与控制, 2020, 48(3): 77-83.

WANG Zan, CHEN Guang, DONG Xiao, et al. Research on the architecture of smart energy service system based on industrial internet[J]. Power System Protection and Control, 2020, 48(3): 77-83.

[3] CHEN H, WANG X, LI Z, et al. Distributed sensing and cooperative estimation/detection of ubiquitous power internet of things[J]. Protection and Control of Modern Power Systems, 2019, 4(2): 151-158.

[4] 邹昊东, 王鹏飞, 陶晔波, 等. 面向大数据处理的数据中心节能调度策略研究[J]. 电力信息与通信技术, 2021, 19(3): 34-42.

ZOU Haodong, WANG Pengfei, TAO Yebo, et al. Research on energy-saving scheduling strategy of data center oriented to big data processing platform[J]. Electric Power Information and Communication Technology, 2021, 19(3): 34-42.

[5] 赵洪山, 寿佩瑶, 马利波. 低压台区缺失数据的张量补全方法[J]. 中国电机工程学报, 2020, 40(22): 7328-7337.

ZHAO Hongshan, SHOU Peiyao, MA Libo. A tensor completion method of missing data in transformer district[J]. Proceedings of the CSEE, 2020, 40(22): 7328-7337.

[6] JUNGER W L, DE LEON A P. Imputation of missing data in time series for air pollutants[J]. Atmospheric Environment, 2015: 96-104.

[7] SHANG Q, YANG Z, GAO S, et al. An imputation method for missing traffic data based on FCM optimized by PSO-SVR[J]. Journal of Advanced Transportation, 2018(1): 1-21.

[8] 王毅, 李鼎睿, 康重庆. 低秩矩阵分解在母线坏数据辨识与修复中的应用[J]. 电网技术, 2017, 41(6): 1972-1979.

WANG Yi, LI Dingrui, KANG Chongqing. Application of low-rank matrix factorization in bad data identification and recovering for bus load[J]. Power System Technology, 2017, 41(6): 1972-1979.

[9] FANG C, WANG C. Time series data imputation: a survey on deep learning approaches[J]. arXiv preprint arXiv, 2011.

[10] CHE Z, PURUSHOTHAM S, CHO K, et al. Recurrent neural networks for multivariate time series with missing values[J]. Scientific Reports, 2018, 8(1): 60-85.

[11] CAO Wei, WANG Dong, LI Jian, et al. Brits: bidirectional recurrent imputation for time series[J]. arXiv preprint arXiv, 2018.

[12] GOODFELLOW I J, POUGET-ABADIE J, MIRZA M, et al. Generative adversarial networks[J]. Advances in Neural Information Processing Systems, 2014, 3: 2672-2680.

[13] 陈佛计, 朱枫, 吴清潇, 等. 生成对抗网络及其在图像生成中的应用研究综述[J]. 计算机学报, 2021, 44(2): 347-369.

CHEN Foji, ZHU Feng, WU Qingxiao, et al. A survey about image generation with generative adversarial nets[J]. Chinese Journal of Computers, 2021, 44(2): 347-369.

[14] 李辉, 任洲洋, 胡博, 等. 基于时序生成对抗网络的月度风光发电功率场景分析方法[J]. 中国电机工程学报, 2022, 42(2): 537-548.

LI Hui, REN Zhouyang, HU Bo, et al. A sequential generative adversarial network based monthly scenario analysis method for wind and photovoltaic power[J]. Proceedings of the CSEE, 2022, 42(2): 537-548.

[15] 肖雄, 肖宇雄, 张勇军, 等. 基于二维灰度图的数据增强方法在电机轴承故障诊断的应用研究[J]. 中国电机工程学报, 2021, 41(2): 738-749.

XIAO Xiong, XIAO Yuxiong, ZHANG Yongjun, et al. Research on the application of the data augmentation method based on 2D gray pixel images in the fault diagnosis of motor bearing[J]. Proceedings of the CSEE, 2021, 41(2): 738-749.

[16] 王守相, 陈海文, 潘志新, 等. 采用改进生成式对抗网络的电力系统量测缺失数据重建方法[J]. 中国电机工程学报, 2019, 39(1): 56-64, 320.

WANG Shuoxiang, CHEN Haiwen, PAN Zhixin, et al. A reconstruction method for missing data in power system measurement using an improved generative adversarial network[J]. Proceedings of the CSEE, 2019, 39(1): 56-64, 320.

[17] 刘科研, 周方泽, 周晖, 等. 基于改进生成对抗网络的台区采集数据修复[J]. 电网技术, 2022, 46(8): 3231-3240.

LIU Keyan, ZHOU Fangze, ZHOU Hui, et al. Missing data imputation in transformer district based on improved generative adversarial network[J]. Power System Technology, 2022, 46(8): 3231-3240.

[18] ZHANG Wenjie, LUO Yonghong, ZHANG Ying, et al. SolarGAN: multivariate solar data imputation using generative adversarial network[J]. IEEE Transactions on Sustainable Energy, 2021, 12(1): 743-746.

[19] WANG Z, OATES T. Imaging time-series to improve classification and imputation[C] // Proceedings of the Twenty-Fourth International Joint Conference on Artificial Intelligence, July 28-August 1, 2015, Buenos Aires, Argentina: 3939-3945.

[20] 郑炜, 林瑞全, 王俊, 等. 基于GAF与卷积神经网络的电能质量扰动分类[J]. 电力系统保护与控制, 2021, 49(11): 97-104.

ZHENG Wei, LIN Ruiquan, WANG Jun, et al. Power quality disturbance classification based on GAF and a convolutional neural network[J]. Power System Protection and Control, 2021, 49(11): 97-104.

[21] 陈军锋, 王雪, 张效天. 非侵入式负荷识别边缘计算颜色编码研究[J]. 仪器仪表报, 2020, 41(9): 12-19.

CHEN Junfeng, WANG Xue, ZHANG Xiaotian. Non- intrusive load recognition using color encoding in edge computing[J]. Chinese Journal of Scientific Instrument, 2020, 41(9): 12-19.

[22] 袁培, 王舶仲, 毛文奇, 等. 基于多重生成对抗网络的智能开关设备状态感知与诊断研究[J]. 电力系统保护与控制, 2021, 49(6): 67-75.

YUAN Pei, WANG Bozhong, MAO Wenqi, et al. Research on state perception and diagnosis of intelligent switches based on triple generative adversarial networks[J]. Power System Protection and Control, 2021, 49(6): 67-75.

[23] 邱锡鹏. 神经网络与深度学习[M]. 北京: 机械工业出版社, 2019.

[24] SERGEY I O, SZEGEDY C. Batch normalization: Accelerating deep network training by reducing internal covariate shift[C] // Proceedings of the 32nd International Conference on Machine Learning, 2015, Lille, France: 448-456.

[25] XU Bing, WANG Naiyan, CHEN Tianqi, et al. Empirical evaluation of rectified activations in convolutional network[J]. arXiv preprint arXiv, 2015.

[26] PATHAK D, KRAHENBUHL P, DONAHUE J, et al. Context encoders: feature learning by inpainting[C] // Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition, 2016, Las Vegas, USA: 2536-2544.

[27] ISOLA P, ZHU J Y, ZHOU T, et al. Image-to-image translation with conditional adversarial networks[C] // Proceedings of 2017 IEEE Conference on Computer Vision and Pattern Recognition, 2017, Honolulu, USA: 1147-1156.

Missing data imputation in a transformer district based on time series imaging encoding and a generative adversarial network

LIU Keyan1, ZHOU Fangze2, ZHOU Hui2

(1. China Electric Power Research Institute, Beijing 100192, China; 2. College of Electrical Engineering,Beijing Jiaotong University, Beijing 100044, China)

For various reasons, there are generally missing values in low voltage transformer districts, and overall data quality is poor. This limits lean management for a distribution network. Traditional data imputation methods ignore the periodicity and temporality of data and the imputation accuracy is relatively low. This paper proposes an imputation method based on imaging encoding and a generative adversarial network. First, a method for one-dimensional time series encoding to a two-dimension image is introduced, the original signals are transformed to Gramian angular field images. Second, using the powerful advantages of a convolutional neural network in image feature extraction, a generative adversarial network model is constructed. Combining the dual constraints of pixel and similarity loss, the quality of generated images is improved. The overall process is driven by data, does not need the distribution hypothesis of prior knowledge and explicit physical modeling. Lastly, experimental results show that this method could accurately impute missing values in a transformer district.

distribution network; missing data imputation; generative adversarial network; Gramian angular field

10.19783/j.cnki.pspc.220256

国家电网公司科技项目资助“支撑精益化管理的配电大数据分析技术研究与基础平台开发”(52020116000G)

This work is supported by the Science and Technology Project of State Grid Corporation of China (No. 52020116000G).

2022-03-02;

2022-04-27

刘科研(1978—),男,博士,高级工程师,主要研究方向为配电网建模仿真与智能分析;E-mail: liukeyan@ epri.sgcc.com.cn

周方泽(1993—),男,通信作者,博士研究生,研究方向为配电网建模仿真以及深度学习在配电网中的应用;E-mail: zhoufangze@gmail.com

周 晖(1964—),女,博士,副教授,主要从事电力市场运营、电力负荷预测、电力系统经济调度的研究。E-mail: hzhou@bjtu.edu.cn

(编辑 许 威)

猜你喜欢
台区时序配电网
顾及多种弛豫模型的GNSS坐标时序分析软件GTSA
清明
配电台区变-户拓扑关系异常辨识方法
基于不同建设时序的地铁互联互通方案分析
配电网FTU配置优化方法研究
10千伏配电网线损原因与管理策略探析
关于城市10kV配电网自动化实施的探讨
基于FPGA 的时序信号光纤传输系统
降低台区实时线损整治工作方法
10kV变压器台区设计安装技术研究