融合多源异构气象数据的光伏功率预测模型

2024-03-15 09:22康瑞星夏景明

电子与信息学报 2024年2期

关键词：气象要素云图气象

谈玲康瑞星夏景明王越

①(南京信息工程大学计算机学院南京 210044)

②(南京信息工程大学软件学院南京 210044)

③(南京信息工程大学人工智能学院南京 210044)

1 引言

光伏发电受到太阳辐射、云层遮挡、温度变化等多种因素的影响，这使得其输出功率极不稳定，对电力系统的运行和调度带来了巨大的挑战[1]。准确预测光伏发电的输出功率对于提高光伏发电的安全性、可靠性和经济性具有重要意义[2]。短期光伏功率预测是对未来几分钟到几小时内光伏输出功率进行预测，通过精确预测短期光伏功率，可以为电力系统提供更灵活和精准的控制策略，从而降低光伏发电的不确定性对电网的影响[3]，目前是光伏发电领域的研究热点和难点。

传统的光伏功率预测方法主要借助历史光伏功率数据和数值天气预报(Numerical Weather Prediction, NWP)模型来预测光伏功率，这些方法通过数值天气预报模型生成未来的天气状况，再建立气象信息与光伏功率之间的映射关系，以实现光伏功率预测。Gigoni等人[4]评估了天气状况和天气预报对光伏发电预测的影响。Ma等人[5]提出了一种基于辐照度修正和误差预测的短期光伏发电功率预测方法。张俊等人[6]基于日前数值天气预报，建立考虑了季节循环和日循环的统计预测模型，并对原始短期预测值进行修正。尽管NWP数据可提供光伏发电功率所需的关键气象信息，但模型的预测精度依赖于NWP数据的准确性，对于短时间小范围内的天气变化，基于NWP数据的模型往往难以精确捕捉这些变化。

光伏功率受到诸多因素的影响，而NWP数据提供的气象参数类型和精度有限，近年来许多研究者尝试引入深度学习方法，利用多源数据来提升光伏功率预测的准确性。Yao等人[7]提出了一种基于深度学习的新型数据驱动光伏功率预测框架，集成了先进的 U-net和编码器-解码器架构，可协同处理多源数据。Agoua等人[8]提出了一个灵活的时空模型来生成光伏功率预测结果，该模型评估不同时空数据源对预测准确性的影响。师浩琪等人[9]针对单一气象预报源可能存在的误报和偏差问题，提出一种基于多源气象预报总辐照度修正的光伏功率短期预测方法。使用基于多源数据的深度学习方法能够充分考虑多种气象因素对光伏功率的影响，从而有效提升光伏功率预测的精度，但多源数据往往包含异构的数据类型和格式，因此，在整合和处理这些数据时，需要选择适当的方法进行数据订正和预处理。

在诸多影响光伏功率的因素中，云层的遮挡效应对太阳辐射的影响被认为是导致光伏功率波动的主要因素[10]。近年来许多基于云图数据的预测方法被提出，其中，卫星云图由于其广阔的观测范围和便捷的获取途径，在光伏功率预测研究中受到了广泛的关注。Wang等人[11]将多个电站之间的时空相关性、功率和云信息相结合来训练预测模型。Si等人[12]提出一种基于卷积长短期记忆网络 (Convolutional Long Short-Term Memory, Conv-LSTM)的非线性云运动预测模型，并根据太阳位置的变化动态选择卫星图像中遮挡相关光伏电站的云区。白捷予等人[13]提出了一种考虑云遮挡的光伏功率超短期预测方法，通过2维卷积算法及NWP风速预测法预测出未来一段时间云团的移动轨迹。以上算法对气象因素的影响考虑不足，其预测结果易受到极端天气干扰。

现有的光伏功率预测模型在深度学习方法与物理方法的结合方面相对单一，主要存在以下局限性：首先，在云图预测方面存在明显的运动模糊问题，只能预测云层整体的运动趋势，对云层形状和具体分布情况估计的误差较大。其次，这些模型仅使用2维的云图来估计3维的云团对太阳辐射的遮挡作用，没有充分考虑云的3维分布和3维空间中的气象要素对光伏功率的影响。究其原因在于上述模型没有充分利用深度学习方法在多维数据特征提取方面的优势，无法很好地捕捉复杂的空间关系和时序变化趋势。

为了解决以上问题，本文提出一种基于多源异构气象数据的多源变量光伏功率预测模型(Multisource variables Photovoltaic power Prediction Model, MPPM)，通过多源数据融合整合不同来源的信息以增强模型对时间序列数据的理解和建模能力，进而提升预测的可靠性和精确性。时间序列数据通常具有复杂的结构和关联关系，传统的单一模型可能无法有效地捕捉这种复杂关系。因此本文使用不同类型的模型和特征提取方法来处理各种异构数据，并将它们结合起来，使模型可以更好地理解数据。本模型利用深度学习方法融合2维卫星云图和3维气象要素特征，以更好地捕捉多源气象数据对光伏功率的影响，从而提高光伏功率的预测精度。

本文的主要贡献如下：

(1)提出一种用于卫星云图预测的时空条件扩散模型(SpatioTemporal Conditions Diffusion Models, STCDM)，本模型利用时空LSTM提取历史卫星云图和第5代欧洲中期天气预报中心再分析(European centre for medium-range weather forecasts ReAnalysis v5, ERA5)气象数据的时空特征，并结合条件扩散模型生成预测云图的精细纹理，能够有效提升对云运动和云分布情况的预测精度。

(2)提出一种用于多源气象数据特征提取的注意力堆叠长短期记忆网络(Attention Stacked Long Short Term Memory, ASLSTM)。本网络基于3维的天气研究与预报模型(Weather Research and Forecasting model, WRF)数值预报结果，在LSTM的多个层中依次添加不同的变量，并通过交叉注意力网络来捕获多个变量之间的相关性。由于每一层网络可以学习到不同的特征，因此堆叠LSTM网络具有更强的信息提取能力。

(3)针对输入数据维度不匹配的问题，提出一种用于融合不同维度特征向量的多维特征融合模块(Multidimensional Feature Fusion Module, MFFM)。本模块可以有效融合2维卫星云图特征和3维气象要素特征，减少跨维度非线性映射时的信息损失。融合的多维特征向量可以反映不同海拔的云层信息和气象要素信息对光伏发电的影响，从而为光伏功率预测提供更准确的特征信息。

2 方法

2.1 相关技术

多源数据融合方法在深度学习中被广泛应用，旨在将来自不同来源或不同模态的数据合并，以提取更丰富、更有信息量的特征，从而改善模型性能。本文的多源异构气象数据主要包括FY-4B卫星云图数据、ERA5气象数据、历史光伏功率、太阳几何参数和WRF数值预报数据。为了在具有时间序列特性的光伏功率预测任务中实现多源异构气象数据的融合，可以采用级联、拼接、堆叠融合和基于注意力的融合等手段，以更全面地捕捉时间序列数据的潜在模式和关联性。在FY-4B卫星云图生成中，引入了一种时空条件扩散模型。扩散模型是一种图像生成模型，通过学习数据的概率分布从噪声中生成图像[2]，被广泛地用于图像生成和图像修复等任务。本文提出一种改进的条件扩散模型，在传统的扩散模型中引入气象时空特征，主要包括扩散过程和逆扩散过程。扩散过程是对真实图像进行加噪的过程，扩散过程的公式为

其中，z为服从标准正态分布的高斯噪声，σ为概率分布q(yn-1|yn) 的方差，ϵθ为预测噪声向量，ht为t时刻的气象时空特征。逆扩散过程的目标是逐步从噪声样本ytN中恢复出真实样本yt0。经过训练的扩散模型能够学习真实数据集的概率分布，从而可以根据一个随机采样的高斯噪声生成纹理丰富的图像。在生成图像的过程中，扩散模型利用神经网络预测每一次去噪的噪声向量，并对输入的噪声样本进行多次去噪，本文中采用了一个具有4层残差连接的U-net网络来预测噪声向量。总体而言，扩散模型生成卫星云图是一个多步去噪过程，扩散模型中神经网络所预测的噪声可被视为是生成样本与目标之间的误差，通过多次去噪能够逐步缩小这种差距，最终生成清晰的卫星云图预测结果。

2.2 总体架构

本文提出一种基于多源异构气象数据的多源变量光伏功率预测模型(MPPM)，总体框架如图1所示。模型输入包括ERA5气象数据、FY-4B卫星云图数据、历史光伏功率、太阳几何参数和WRF数值预报数据，输出为未来1 h光伏功率预测结果。MPPM模型由3部分构成，包括时空条件扩散模型(STCDM)、注意力堆叠LSTM网络(ASLSTM)和多维特征融合模块(MFFM)。该模型的整体思路是，首先，使用STCDM根据ERA5气象数据和卫星云图数据预测未来1 h卫星云图，并提取2维云特征；然后，利用ASLSTM模型根据历史光伏功率、太阳几何参数和WRF数值预报数据提取3维气象特征，最后，采用MFFM模块融合2维云特征和3维WRF气象特征，并根据加权后的多维融合特征进行光伏功率预测。

图1 MPPM总体架构

2.3 STCDM模型

利用历史卫星云图对未来卫星云图进行预测可以获得云的2维分布，进而预测地面太阳辐射强度。然而，由于云层的形状不固定，并且时刻在大气动力和地球自转力的驱动下进行着复杂的非线性运动，利用历史卫星云图对未来卫星云图进行预测的挑战较大，目前的卫星云图预测方法大多基于循环神经网络(Recurrent Neural Network, RNN)模型或光流法等算法，这类算法的建模依据仅仅是图像本身，而云的运动和生消是与气象要素的3维分布密切相关的，因此，仅仅依靠图像数据集来建模预测卫星云图，其预测准确率难以保障。

为了更准确地预测卫星云图，本文提出一种STCDM模型，其结构如图2所示。STCDM模型的输入包括卫星云图和ERA5气象数据。卫星云图数据维度为1×480×480，ERA5气象数据包括气压、水平风速、垂直风速、风向数据，数据维度为4×10×480×480。为了统一数据维度，本文使用1×1卷积网络将卫星云图数据升维至40×480×480。1×1卷积可以在不改变特征图的空间维度的情况下改变特征通道的数量，这能够有效降低模型的计算复杂度和参数量。虽然1×1卷积的感受野很小，但它引入了非线性变换，从而使神经网络可以学习更复杂的特征组合，提高了网络的表达能力。而后对ERA5数据进行重构，使其维度也为40×480×480，将两组向量在通道维度上拼接，并将其输入STCDM模型。STCDM提取两组数据的时空特征，最终生成预测卫星云图，预测卫星云图的维度为1×480×480。

图2 STCDM模型

首先，使用时空LSTM(SpatioTemporal LSTM, STLSTM)[14]提取卫星云图和ERA5气象数据的时空特征。传统的LSTM只包含1个记忆单元，而STLSTM拥有两个记忆单元，分别为c和m，c在水平方向即同一层的不同时间步之间传递，而m不仅在同一时间的不同隐藏层之间垂直传递也会从前一时间步的最顶层传递给下一时间步的最底层，这样的结构使时空信息流能够同时在水平和垂直两个方向上更新，减少了信息损失并缓解了梯度消失现象，使我们能够更有效地捕捉卫星云图和ERA5气象数据中的时空相关性。STLSTM网络的公式为

其中，xt为t时刻的输入，在本文中为卫星云图和ERA5气象数据。it为输入门，ft为遗忘门，ot为输出门。W和b为每个门对应的权重和偏差，σ为sigmoid激活函数，∗为卷积运算，⊙为Hadamard积。STLSTM的输出为时空特征h，其反映了云层整体的运动趋势，本文可以根据时空特征构建一种从3维气象场到卫星云图形成的非线性映射。

接下来，将时空特征h输入到STCDM中作为约束条件控制模型逐步去噪并生成预测图像。本文在STCDM中引入了3维的气象特征，其中气压、风速、风向直接影响着云的运动方向，时空特征h融合了这些气象特征，使得模型能够更精确地生成预测卫星云图。条件扩散模型的优化目标为

其中，ht为t时刻STLSTM从卫星云图和ERA5气象要素中提取的气象时空特征，n为加噪步数，ytn为经过n次加噪处理后的图像，ϵ为加噪过程中从标准高斯分布中随机采样的噪声向量，ϵθ为预测噪声向量。在传统的扩散模型中，使用神经网络预测噪声比直接预测图像要更容易训练，但在时空序列预测任务其所生成的样本与预测目标存在较大的偏差。在图像生成任务中，使用噪声向量作为优化目标能够生成多样性的样本，但是在时空序列预测任务中我们希望约束这种多样性，使生成的预测图像更加接近预测目标。在此我们将预测目标yt0作为训练优化目标，并提出了一种改进的扩散模型损失函数，使模型在训练过程中更好地收敛，生成的预测图像更接近预测目标。扩散模型的扩散过程如式(1)所示，变换式(1)可以得到

式(7)中神经网络输出的仍然是噪声向量的预测，但由于损失函数中直接加入了目标图像y0的信息，模型能够更好地生成接近目标图像的预测图像。条件扩散模型的训练过程如算法1所示。

2.4 ASLSTM模型

利用STCDM可以实现对2维卫星云图的精确预测，然而如前文所述，云是一个典型的3维结构，仅仅依靠2维的云图不能反映这些3维特征。图3展示了两种天气条件下地面太阳辐射的情况，图3(a)和图3(b)的3维云结构在2维平面上的投影结果是相同的，但由于云的垂直高度存在差异，因此到达地面的太阳辐射并不相同。这一现象表明仅仅依靠2维云图无法全面准确地描述云的特征。

图3 云的3维分布对太阳辐射的影响

WRF模式是一种广泛应用的中尺度数值模式，其主要基于大气运动的物理过程对天气现象进行模拟。由于大气的复杂非线性特征，WRF模式对3维云的预测准确率较低，直接使用WRF模式的3维云预测产品不能获得理想的地面太阳辐射预测结果。考虑到云的生消与大气湿度、温度、风速、风向、云水密度和云冰密度密切相关，而深度学习中的特征提取网络可以很好地学习上述要素的时空特征并反映太阳辐射情况，本文提出一种ASLSTM模型，用于提取这些气象要素的特征信息。图3说明了地面太阳辐射不仅与云的分布有关，还与太阳方位角、太阳高度角密切相关，同时光伏功率也是一个典型的时间序列，因此将WRF模式未来1 h的3维数值预报结果、太阳高度角、太阳方位角和历史光伏功率共同输入ASLSTM进行特征提取，以获取更精准的气象要素3维分布特征。ASLSTM的结构如图4所示。

图4 ASLSTM结构图

ASLSTM的输入包括历史光伏功率、太阳方位角、太阳高度角和WRF数值预报结果。其中WRF数值预报结果的数据维度为7×10×480×480，其他要素的数据维度为1×480×480。对WRF数值预报结果中的7种气象要素进行特征提取后本文得到了一个考虑全部气象要素相互关系的融合特征向量，维度为10×480×480，这一特征向量将与后续的多维特征融合模块一起用于光伏功率预测。

单层LSTM网络仅考虑每个变量的时间依赖性，无法捕捉变量之间的相互关系，而多层LSTM网络可以在每一层中引入不同的变量，以学习变量之间的特征相关性。此外通过在LSTM层后加入注意力层，网络可以自适应地学习不同要素对光伏功率预测的重要程度，并相应地对数据进行加权处理。

ASLSTM网络第1层的输入包括历史光伏功率序列、太阳方位角和太阳高度角，输出为隐藏状态向量hA。随后，水平风速、垂直风速、风向、温度、湿度、云水密度和云冰密度7个气象要素序列逐一与前一层LSTM网络输出隐藏状态向量结合，并一同输入到注意力层中，注意力网络的作用在于反映不同海拔上的气象要素对光伏功率的影响程度。在注意力层中，计算每个气象要素和隐藏状态向量之间的注意力分数。注意力分数用于对特征向量进行加权，加权后的特征向量被传递给下一层LSTM网络。通过这样的设计，ASLSTM网络能够充分利用历史光伏功率序列、太阳方位角和太阳高度角等信息，并结合气象要素序列，生成更富信息量的特征向量。注意力机制的引入使模型能够自适应地学习不同要素的重要性，提高模型对关键要素的关注程度，从而提升光伏功率预测的准确性。注意力层的运算过程如式(8)、式(9)所示

其中，∗为matmul product运算，M为该层输入的气象要素，hA为LSTM层输出的隐藏状态，W和b为可学习的权重和偏差，A为气象要素M和隐藏状态hA的注意力分数矩阵，注意力分数反映了不同海拔上的气象要素对光伏功率的影响程度，MA为3维气象要素特征。

2.5 MFFM模块

在多源特征融合时，由于本文中融合的云特征和气象要素特征具有不同的通道数，因此无法直接使用简单的线性操作进行异构数据融合。为了解决这个问题，本文设计了MFFM模块，旨在实现不同维度气象数据的融合，MFFM模块结构如图5所示。

图5 MFFM模块

对于单通道的云特征数据，本文采用1×1卷积网络来进行升维操作，将其扩展为10个通道。与之相比，WRF气象要素特征具有10个通道，每个通道代表着不同海拔上的气象要素数据特征信息。为了确定不同高度通道在光伏功率预测中的重要程度，本文引入了通道注意力网络，用于为每个高度通道分配权重。权重的大小反映了该海拔的气象要素信息对光伏功率的影响程度。通道注意力网络公式为

其中，MA为输入的气象要素特征，Mˆ 为加权后的气象要素特征，σ为sigmoid函数，MLP为全连接层。在通道注意力网络中，对气象要素特征分别进行全局最大池化和全局平均池化操作，得到两个维度为10的特征向量。再将这两个特征向量分别传入两层全连接层进行处理。最终得到加权后的气象要素特征。

接下来，将云特征和加权气象要素特征输入交叉注意力网络，交叉注意力层的结构与2.4节中的注意力层相同。交叉注意力网络计算气象要素特征数据的每个高度通道向量与2维云特征的注意力分数。注意力网络的作用是反映云层在该海拔上对气象要素的影响程度。通过这样的设计，本文能够更充分地利用云特征数据和气象要素特征数据，并通过权重的分配来强调和调节不同海拔上的气象要素信息对光伏功率预测的贡献。

MFFM模块的输入包括维度为1×480×480的2维云特征和维度为10×480×480的3维气象要素特征。首先，使用1×1卷积将2维云特征升维至10×480×480。然后，通过通道注意力层对3维气象要素特征的不同通道进行加权。这样可以控制不同通道对特征表示的贡献，以反映不同海拔的气象要素对光伏功率的影响程度。然后，使用交叉注意力层将这两组特征向量进行融合。交叉注意力机制能够学习不同特征之间的相关性，进一步提取更具信息量的特征表示。最后，融合特征向量被输入到LSTM网络中，后者利用融合特征进行时序建模，并生成光伏功率的预测结果。MFFM模块能够充分利用云特征和气象要素特征的信息，并通过时序建模更准确地进行光伏功率预测。

MPPM集成了上述3个模块并整合了多源异构气象数据，最大限度地从不同来源的数据中提取有价值的信息，从而实现高精度的光伏功率预测，MPPM的训练过程如算法2所示。

3 数据集

3.1 研究区域

本文研究区域为中国宁夏地区，选取空间范围480 km×480 km的矩形区域，宁夏大部分地区年太阳总辐射在5 800 MJ/m2以上，年平均日照时数在2 256～3 073 h，日照百分率在52%～70%，具有很大的光伏发展潜力。使用的数据包括光伏功率数据、卫星云图数据和气象数据，时间跨度从2022年3月—2023年2月，每月划分前22 d数据为训练集，其余天数为测试集。每平方千米的光伏面板的峰值功率为120 MW，由于夜间光伏功率几乎为0，只选取8～18点的数据，数据的时间分辨率为15 min。

3.2 卫星云图数据集

卫星云图数据来自FY-4B气象卫星和Himawari-8气象卫星，数据的空间和时间分辨率、观测区域均保持一致，卫星云图为单通道灰度图像，卫星云图数据时间分辨率为15 min，空间分辨率为1 km，像素大小为480×480，覆盖空间范围为一个480 km×480 km的矩形区域。

算法 2 MPPM训练过程

3.3 WRF模式预报数据

WRF模式预报数据来自欧洲中期天气预报中心(European Centre for Medium-range Weather Forecasts, ECMWF)，包括温度、湿度、水平风速、垂直风速、风向、云水密度和云冰密度，数据的时间分辨率为15 min。这些气象要素数据在水平空间上覆盖了一个480 km×480 km的矩形范围，水平空间分辨率为1 km，在垂直空间上覆盖从1 000～100 hpa的范围，垂直空间分辨率为100 hpa。每个时刻WRF模式预报结果的维度为7×10×480×480。

3.4 ERA5实况气象数据

ERA5数据来自欧洲中期天气预报中心 (ECMWF)，包含气压、水平风速、垂直风速、风向数据，覆盖范围和时空分辨率与WRF模式预报数据相同。每个时刻ERA5的维度为4×10×480×480。

4 实验

4.1 实验设置与实验方案

本文使用的实验设备的处理器为Intel(R)Core(TM) i9-10900X，内存为32 GB, GPU为NVIDIA GeForce GTX 2080Ti，操作系统为Ubuntu18.04，运行环境为pytorch3.6。实验使用Adam优化器，所有模型训练100个epoch, batch size为16，初始学习率为0.001。

(1)卫星云图预测实验。为验证STCDM模型在预测2维卫星云图方面的积极作用，本文进行第1组对比实验，实验数据包括ERA5气象数据、FY-4B和Himawari-8的卫星云图数据。本文使用STCDM对研究区域未来1 h卫星云图进行预测，并将预测结果与常见的时空序列预测方法MotionRNN,E3D-LSTM, PredRNN, ConvLSTM进行对比。本文使用结构相似性指数(Structural SIMilarity index,SSIM)和均方误差(Mean Squared Error, MSE)两种评价指标对各模型的预测效果展开评估。

(2)光伏功率预测实验。为验证MPPM模型在光伏功率预测任务中的性能，本文进行第2组对比实验，实验数据包括ECMWF的历史光伏功率数据、太阳高度角、太阳方位角和WRF数值预报结果。本文用MPPM预测了区域内各网格点的光伏功率，并将预测结果与常见的预测方法LSTM,XGBoost, ARIMA, MLP, ConvLSTM进行对比，本文使用均方根误差(Root Mean Square Error,RMSE)和 (CORRcorrelation index, CORR)两种评价指标对模型效果展开评估。

(3)季节性评估。为验证MPPM在不同季节条件下的泛化能力，本文拟开展季节性评估实验。实验数据包括按季节划分的ECMWF的历史光伏功率数据、太阳高度角、太阳方位角和WRF数值预报结果。本文将MPPM在不同季节的光伏功率预测结果进行对比，并使用RMSE和CORR两种评价指标对模型效果展开评估。

4.2 评价指标

(1)卫星云图生成评价指标。本文采用结构相似性指标(SSIM)、均方误差(MSE)来评价卫星云图预测模型的性能。SSIM和MSE的公式为

其中，f为预测云图，r为真实云图，µ为均值，σ为方差，σfr为协方差，c为偏置。SSIM的值在0～1之间，越接近1说明两图像相似，MSE的值越小说明图像越相似。

(2)太阳光伏功率预测评价指标。本文采用均方根误差 (RMSE)和相关系数(CORR)两个误差测量指标来评价光伏功率预测模型的性能。 RMSE和CORR的公式为

其中，pˆt表示t时刻的预测光伏功率，pt表示t时刻实际的光伏功率，N为样本数，Cov为协方差，Var为方差。RMSE值越小，CORR值越接近1，说明光伏功率预测精度越高。

4.3 实验结果

(1)卫星云图预测实验。为了验证STCDM在卫星云图预测任务上的优势，本文将其与常见的时空序列预测方法PreRNN[14], E3D-LSTM[15], Motion-RNN[16], ConvLSTM[17]进行了对比。图6展示了2022年4月1日10时至11时的FY-4B卫星云图预测示例。从主观效果上看，这组示例中云层整体有向东南方运动的趋势，同时局部区域还有非线性的形变。虽然PreRNN, E3D-LSTM, MotionRNN,ConvLSTM模型能够预测出云层的运动趋势，但图像整体模糊，云层的细节不清晰。相比之下，STCDM不仅能够准确预测云层的整体运动趋势，还能够清晰地预测出云层的局部细节。

从客观效果上看，表1展示了几种卫星云图预测方法定量分析的结果，本文在测试集上随机选取20组数据对每种模型进行实验，SSIM和MSE数据取20次实验的平均值。从表1可以看出，STCDM的表现优于其他方法，STCDM在15 min的SSIM达到0.914，比MotionRNN高3.6%，比E3D-LSTM高4.3%，比PreRNN高12.1%，比ConvLSTM高17.7%。且STCDM在所有4个预测时间步长上都表现出较高的预测精度，在60 min时STCDM的SSIM仍然达到0.795，虽然比15 min时下降了11.9%，但仍然比其他方法高出很多。在所有方法中STCDM生成的预测图像精度最高且性能表现最为稳定。

表1 不同模型的FY-4B卫星云图预测实验结果

为了验证模型的可靠性，本文还使用Himawari-8卫星云图进行了一组对比实验。表2展示了几种预测方法在2022年4月5日上午10时至11时的Himawari-8卫星云图预测效果。

表2 不同模型的Himawari-8卫星云图预测实验结果

从表2可以看出，STCDM在测试集上的表现优于其他方法，其他各项数据的对比结论与表1的一致，在此不再赘述。

(2)光伏功率预测实验。为验证本文所提出的MPPM在光伏功率预测任务上的优势，本文对比了MPPM与几种常见的时间序列预测方法LSTM[18],XGBoost[19], ARIMA[20], MLP[21], ConvLSTM的预测结果。图7展示了上述方法在2022年4月1日上午10时至11时光伏功率预测效果示例。

图7 2022年4月1日上午10时至11时光伏功率预测实验结果

表3展示了各模型的定量分析实验结果，本文使用RMSE和CORR作为评价指标，在测试集上随机选取20组数据对每种模型进行实验，RMSE和CORR取20次实验的平均值。

表3 不同模型的光伏功率预测实验结果

从表3可以看出，MPPM在测试集上的表现优于其他方法，实验结果表明，MPPM在光伏功率预测任务中的精度在所有时间节点上均优于其他模型，并且随预测时间增加导致的精度下降最小，性能表现最为稳定。

(3)季节性实验。光伏功率受到季节因素的影响，为了验证MPPM在不同季节的光伏功率预测性能，本文分别对每个季节的数据进行了实验。4个季节的光伏功率预测结果的RMSE值可视化效果如图8所示。

图8 四季光伏功率预测RMSE值

图8展示了4个季节的预测时间点，春季选取时间点为2022年4月10日10时至11时，夏季为2022年7月10日10时至11时，秋季为2022年10月10日上午10时至11时，冬季为2023年1月10日上午10时至11时。本文在每个季节随机选取20组数据进行实验，使用RMSE和CORR作为评价指标，RMSE和CORR取20次实验的平均值。其中春季数据的时间范围为2022年3月至5月，夏季2022年6月至8月，秋季2021年9月至11月，冬季2022年12月至2023年2月。

表4展示了MPPM在春夏秋冬4季的RMSE和CORR对比，在整体看来秋季的预测效果最佳，春季次之，夏季误差最大。

表4 不同季节光伏功率预测对比实验结果

可以看到春季和秋季时的预测精度要明显高于夏季和冬季，因为春秋季温度适宜，云层稀薄，能见度高，阳光穿透力强，气候相对稳定。夏季和冬季预测误差较大，因为夏冬两季的强对流天气多，太阳辐射量的波动大，增加了光伏功率预测的不确定性。在所有季节中，MPPM都有较高的预测精度，表明它对于节气、天气变化等外部因素的适应性比较强。

5 讨论

为了验证STCDM在卫星云图预测方面的性能，本文将其与4个基线模型(MotionRNN, E3DLSTM, PredRNN和ConvLSTM)在不同时间尺度上进行了实验比较。实验结果表明， STCDM在所有时间尺度上都具备最高的预测精度，这证实了该模型在卫星云图预测问题上的优越性能。本文对FY-4和Himawari-8数据都进行了实验，STCDM在不同数据集下进行的对比实验中均取得了最高的预测精度，实验结果表明数据集对模型的光伏功率预测精度没有明显影响。

值得注意的是，PreRNN, E3D-LSTM, MotionRNN和ConvLSTM等模型都采用了卷积神经网络进行图像生成。然而，由于多次卷积过程中图像细节信息的丢失，这些模型生成的图像常常存在明显的模糊。与之相比，STCDM利用STLSTM提取卫星云图的时空特征，能掌握云层整体的运动趋势。通过扩散模型去除图像中的噪声，同时保留云层的纹理和细节特征，能够生成高精度的卫星云图预测结果。

接下来，本文评估了MPPM在光伏功率预测中的性能，并与5个基线模型(LSTM, XGBoost,ARIMA, MLP和ConvLSTM)在不同时间尺度上进行了比较。实验结果显示，MPPM在所有时间尺度上取得了最佳的预测结果。该模型能够全面考虑多种相关特征对光伏功率的影响，包括3维气象要素特征、2维卫星云图特征和太阳几何参数。在计算过程中，MPPM利用多层LSTM结构和注意力机制对输入数据不同维度的特征信息进行自适应加权，更好地考虑与当前预测节点相关的信息，为预测提供更准确的信息，从而提高了预测的精度。相比之下，其他模型无法很好处理光伏功率的复杂非线性变化，且固定的权重参数不能有效提取多维数据信息，因此其预测精度明显低于MPPM。实验结果验证了STCDM在卫星云图预测中的效果，以及MPPM在光伏功率预测中的优越性。这些研究结果对于相关领域的进一步研究和应用具有重要的参考价值。

最后，本文对MPPM进行了季节性评估实验，对比了其在4个季节下的预测结果。实验结果表明，春季和秋季的预测精度高于夏季和冬季。这主要是由于春季和秋季大气运动较为稳定，云层运动也较少；相比之下，夏季和冬季的太阳辐射波动较大。综合实验结果可见，MPPM在4个季节中都展现出较高的预测精度，表明该模型能够适应多变环境和复杂场景，可以为实际应用中的光伏功率预测提供良好的支持。

6 结束语

本文提出一种融合多源异构气象数据的光伏功率预测模型MPPM，本模型的核心包括时空条件扩散模型(STCDM)、注意力堆叠LSTM网络(ASLSTM)和多维特征融合模块(MFFM)。STCDM可以有效提取云图的时空特征和纹理特征，并生成清晰的预测云图。ASLSTM利用多层LSTM网络和注意力机制，能够更好地提取多维特征中的有效信息。MFFM则通过融合2维云图特征和3维气象要素特征，充分考虑了云层的3维分布和气象要素对光伏功率的影响，从而显著提高了光伏功率预测的准确度。通过一系列实验，本文证明了MPPM能够实现高精度的短期光伏功率预测，并且在不同时间尺度和环境下都表现出较高的预测精度和稳定性。本文目前只研究了气象要素对光伏功率的影响，并未考虑其他要素如地理要素等对光伏功率的影响，在未来的研究中将针对不同地理和气象要素进行更广泛的耦合研究，以提升模型在各种复杂条件下的有效性和可靠性。