基于知识图谱的国内外电力市场研究综述

2022-06-16 10:27边晓燕张璐瑶林顺富
电工技术学报 2022年11期
关键词:图谱集群聚类

边晓燕 张璐瑶 周 波 徐 波 林顺富

(上海电力大学电气工程学院 上海 200090)

0 引言

当前国外已形成相对成熟的电力市场,拥有丰富的建设经验及教训,例如,美国PJM 电力市场实现了系统的集中控制与调度,保障市场的有效运作,其成功经验值得借鉴。但2021 年美国德州遭受极端天气造成大面积停电,电力供需的极端不平衡在高度市场化中反映为极高的电价,在一定程度上增加了公共风险。而我国还处于电力市场改革的进程之中,电力市场化进程缓慢,产生过不平衡资金等问题[1],这表明可再生能源发电的不确定性难以适应滞后的市场机制,新能源去补贴[2]后如何提升市场竞争力成为挑战。同时,国内外针对电力市场方面的研究不断深入,涌现出了大量新兴研究主题,我国学术界对电力市场研究的动态热点追踪提出更高的要求。因此有必要对近年来国内外电力市场方面的研究进行系统性梳理,深刻把握研究的热点与动向,有序推进我国电力市场相关理论的发展。

目前关于电力市场热点与动向综述方面,已有许多学者开展研究。文献[3]归纳了我国八个试点省份现货市场建设特点和促进可再生能源消纳的相关机制。文献[4-5]从政治背景、技术条件、市场驱动力、组织机构与电网架构等方面,对比分析欧洲统一电力市场、美国区域电力市场与我国电力市场的建设。文献[6]总结了各国面向高比例可再生能源电力市场研究的最新成果。然而,已有的电力市场综述研究[3-6]主要基于专家经验,并结合电力市场发展现状,从而总结出市场理论的内在演化逻辑。目前,如何利用国内外海量学术文献,基于数据技术进行文献综述与研究热点追踪成为难题。

知识图谱是科学计量学的新方法,为国内外电力市场研究的追踪热点提供了新的途径。与传统的文献综述[3-6]不同,文献的知识图谱能够从大量的文献数据中提取筛选结构化的知识序列,进而展现研究热点的演进历程、映射知识群体之间的交叉互动,从而实现对热点和新兴趋势的挖掘。目前,常见绘制图谱的工具有CiteSpace[7]等,它为学者提供了一种高效、可重复、快速应用的分析方法,在各个领域都具有应用前景。本文从文献的数据分析角度,调研了国内近十年1 495 篇、国外近十年5 106 篇电力市场相关文献。首先提出基于知识图谱的分析框架以及图谱合成与解读;然后基于共词网络结构的可视化,从时间维度系统性梳理出近十年发展的演进轨迹,聚焦近五年追踪热点,呈现电力市场领域的核心前沿;最后,总结电力市场的研究轨迹与学术热点。

1 知识图谱分析框架

电力市场研究具有多领域交叉融合且复杂的特点。知识图谱是结构化的语义知识库,其从文本数据中以结构化的方式提取知识,通过相互联结的关系,构成可视化图谱的网状知识结构[8]。针对电力市场研究的知识图谱分析包括合成图谱和图谱解读,从而获得演进轨迹和核心前沿,其分析框架如图1 所示。

图1 知识图谱分析框架 Fig.1 Knowledge graph analysis framework

本文利用合成图谱处理海量的文献数据,从海量文献信息中生成共词矩阵,通过谱聚类降低矩阵维数,利用可视化技术将共词矩阵可视化为共词网络。基于寻径网络算法或者最小生成树算法进行网络简化,并以聚类模块值和轮廓值来评估图谱聚类效果,选择剪枝后聚类效果最佳的网络图谱。

基于文献网络,从时间切片和关键词聚类进行图谱解读,强化图谱的可解读性。时间线图谱中,划分并提取集群标签词,形成近十年演进路径;关键词聚类方面,当图谱节点众多、连接复杂时以节点的突现性、中介中心性作为识别关键节点,把握整个图谱最核心部分,形成近五年核心前沿。

1.1 共词网络结构的可视化

共词分析的基本原理是在同一组文献中对一组词所出现的次数进行两两统计,通过这种共现次数来测度它们之间的亲疏关系。具体而言,从文献信息中基于共词分析将数据描绘成一个图表,根据图表关系计算相似度,生成共词的相似矩阵。

样本点i和j之间的相似度s(i,j)为

式中,d(i,j)为样本点i和j之间的距离;σ为转换因子。

谱聚类算法是基于图论的算法,适应共词网络下以连接关系为主的应用场景。基于共现的关键词相似矩阵一般比较稀疏,可采用奇异值分解进行特征值分解,计算出相似矩阵的最小特征向量;特征分解后得到的特征向量进行聚类,利用相似矩阵的谱信息进行特征降维,将数据聚类到少数几个维度。最后,利用可视化技术,将矩阵可视化为共词网络。

1.2 网络图谱的简化

基于寻径网络算法或者最小生成树算法进行网络剪枝的选择,最大程度简化网络,保留最重要的连接。其中,简化网络的图谱聚类效果是以聚类模块值和轮廓值来评估。

聚类模块值(Modularity)是衡量网络结构强度的划分质量,最早由M.Newman[9]提出。模块值Q(i)为

式中,Eii为集群i内所有的边数占整个网络所有边数的比值;ai为经过集群i内所有节点的边数(包含一点在集群i内、一点在集群i外的边)占整个网络的所有边数的比值。Q(i)值在0~1 之间,其值越接近1,表示划分网络结构的强度越高。

轮廓值(Silhouette)是评价聚类效果好坏的一种方式,其最早由P.J.Rousseeuw 提出。它结合内聚度和分离度两种因素。

轮廓值S(i)的公式为

式中,a(i)为内聚度,即i到同簇其他样本的平均距离;b(i)为分离度,即i到其他类簇的所有样本的平均距离。S(i)越接近1,则说明样本i聚类合理轮廓越明显。

1.3 图谱解读

时间线图谱中,对划分的各聚类集群采用对数似然比算法,提取最具代表性的词作为该集群的标签。聚类图谱中,以突现性以及中介中兴性作为节点权重衡量,反映出核心关键部分。

1.3.1 集群标签词抽取

对数似然比算法是一种用于信息检索与勘探的加权聚类技术,用以评估一个词对语料库的相关程度,提取出具有类别区分能力的标签词。

H1表示元素w1、w2之间是相互独立的;H2表示元素w1、w2之间具有相关性。H1和H2符合二项式分布,其似然值L(H1)、L(H2)分别为

式中,N为所有元素出现的总次;c1、c2和c12分别为元素w1、w2和w12在语料库中出现的次数;p1、p2和p12分别为采用极大似然估计法计算元素w1、w2和w12出现的概率;b(·) 为二项式分布。

H1和H2的差异度表示为LLR,其中似然比λ对数值是以2 为底,具体公式为

对数似然比算法不会过分放大高频词的领域相关性,通过考虑一个词对领域的正负面贡献,能够比较准确地反映领域的特性,保证抽取结果的稳定性[10]。

1.3.2 节点权重计算

1)突现性是指研究点突然爆发。采用突发性检测技术,识别被引次数的突然变化,根据发生的时间序列来建立一种突发检测模型——Kleinberg 状态机模型[11],其公式为

式中,σ(i,rt,dt)为t时刻状态产生的成本;st为第t时刻的突发状态序列;dt为总共的序列;rt为相关性的序列;pi为相关序列发生的期望。

在[t1,t2]时段,序列突现的强度Burst 定义为

突现节点通常揭示了有潜力的研究主题。在本文的网络图谱中,突现性用红色引用环表示。

2)中介中心性是指网络中经过某点并连接这两点的最短路径占这两点之间的最短路径线总数之比,用以测度点在网络中的重要性[12],中介中心性CB(v)为

式中,σst(v)为节点s到节点t的最短路径中经过节点v的数量;σst为节点s到节点t的最短路径数量。

在图谱中具体表现可分为两类:第一类为本领域中高度相连的枢纽节点;第二类为连接不同集群的转折点。一般而言,跨领域的研究会导致新兴趋势的诞生,因此更倾向于关注第二类转折点。在本文的网络图谱中,中介中心性用紫色引用环表示。这种节点权重计算,可只研究网络中少量的连接点,而不是整个网络,大大提高了图谱的可解读性。

2 电力市场研究演进轨迹

针对国内近十年1 495 篇、国外近十年5 106 篇电力市场的相关研究,采用基于知识图谱的方法进行系统化梳理,划分并提取集群标签词,从而提炼出随时间发展的演进轨迹。

2.1 国内电力市场的演进轨迹

本小节以“主题SU=(批发+零售+中长期+现货),文献来源:(SCI,EI 及北大核心期刊),时间跨度=2011-2020”等组配索引式,基于中国知网CNKI 中电力市场相关的总共1 495 篇文章,对国内电力市场的研究演进轨迹进行梳理。依据一年时间间隔内的数据构成每个单独的时间切片网络,整合这些独立的网络形成随时间推移的演变轨迹。单个时间切片的网络结构见表1。以2020 年的单个切片网络为例,2020 年515 篇表征影响力的g-index 指数[13]为12 以上的代表性文献集合,组成81 个节点、132 条连线的单年切片网络。

表1 电力市场切片网络结构 Tab.1 Slicing network structure of power market

整合单个的时间网络形成国内近十年电力市场研究的关键词演化路径。从时间维度表示知识演进的视图,勾画聚类之间的关系和某个聚类的历史跨度,展示了知识群体之间的更新和相互影响。其中,横轴为研究时间,纵轴为依次排列划分后的知识集群。每个集群的变化轨迹通过包含时间线的演化路径来显示。本小节得出了17 个聚类集群,并采用1.3 节提及的对数似然比算法,提取群体的标签词,在集群序号之后加以显示。选取0~4 号进行展示,如附图1 所示。

附图1 国内电力市场演化路径 App.Fig.1 The evolution path of domestic electricity market

知识图谱中,划分后的集群结构的特征量纲包括规模、轮廓值、代表年份以及标签词。以集群规模较大的0~8 号分析集群结构特征,如图2 所示。关键词集群内成员较多的,表示集群规模较大,比较具备代表性。聚类轮廓值接近于1,说明聚类相似度高。从图2 中可以看出,集群的规模超过20 个,集群具有代表性;仅有6 号集群轮廓值较低,其余集群轮廓值都接近于1,表明同一关键词集群的同质程度高,相似度高。

图2 集群结构特征 Fig.2 Cluster structure characteristics

接下来,以1 集群(调峰辅助服务)为例对演化路径的时间线进行解读,其演进轨迹如图3 所示。按年份对应到集群中的节点,依次递进解读节点。关键词节点中包含筛选后最相关的文献数据,以此展现研究轨迹的演变。

图3 1 号集群演进轨迹 Fig.3 No1.cluster evolution trajectory

应用场景:探索促进新能源消纳的市场机制,例如去中心化的市场机制可充分反映成员之间的良性竞争;泛在电力物联网下有更多的挑战[14],例如“边缘-云”计算架构[15]、区块链去中心化[16]等。

市场主体:参与主体由分布式能源转变到多能源耦合。对于分布式能源的管理涉及虚拟电厂、微电网等多种主体的管理方式[17],商业虚拟电厂的运营机制[18]是目前的研究难点,可考虑其加入辅助服务等交易品种;电储热与风电场联动参与调峰辅助服务,促进消纳弃风;发展到现今考虑控制因素的交互能源机制[19],从而实现系统能源互动,同时利用分布式调度弥补信息不对称的缺陷[20]。此外,调峰辅助服务市场应发挥火电等传统发电商的深度调峰效益[21],刺激具备灵活稳定性的市场成员主动参与调峰。

政策机制:商业模式节点同时连接1 号集群内市场机制、分布式能源、泛在电力物联网等多个节点,推动市场改革归根于商业模式的摸索[22]。例如规模化分布式储能提供辅助服务的自盈利模式以及协同共赢的共享储能模式等;从北欧及美国市场机制建设中吸取先进的经验[23],能源转型的阶段结合国情因地制宜建设中国特色电力市场的顶层设计[24],同时调峰辅助服务也是中国特色的交易品种。

2.2 国外电力市场的演进轨迹

本小节以“主题:(electricity NEAR/5 market),文献类型:(Article),语种:(English),索引=SCI-EXPANDED,时间跨度=2011~2020”等组配索引式,基于Web of Science 检索电力市场相关的5 106 篇文章,对国外电力市场的研究演进轨迹进行梳理。单个时间切片的网络信息见表2,以2020 年的网络结构为例,2020 年558 篇g-index指数36 以上的代表性文献集合,组成253 个节点、759 条连线的单年切片网络。

表2 电力市场切片网络结构 Tab.2 Slicing network structure of power market

整合单个的时间网络形成的研究演进轨迹如附图2 所示,附图2 呈现了国外近十年电力市场研究演化路径。基于对数似然比算法抽取网络图谱的标签词,共划分了23 个集群标签。附录中显示聚类标签0~4 号。

附图2 国外电力市场演化路径 App.Fig.2 The evolution of foreign electricity market

以集群规模较大的0~8 号分析集群结构特征,如图4 所示。0 号集群有44 个成员,规模最大,是最具有代表性的集群之一。同时集群0~8 号的轮廓性均超过0.8,说明集群内的各成员之间连接紧密。

图4 集群结构特征 Fig.4 Cluster structure characteristics

接下来,以0 号集群(负荷预测)为例对演化路径的时间线进行解读,其演进轨迹如图5 所示。

图5 0 号集群演进轨迹 Fig.5 No.0 cluster evolution trajectory

应用场景:单个市场支撑电力交易的难度大且风险较高,因此负荷预测的应用场景需要考虑市场之间的耦合,例如“能源+容量”、“能源+辅助服务”等。由图5 可知,2015 年纯能源市场引起广泛的讨论,长期而言纯能源市场促进转型低碳,然而可能出现能源短缺的风险,稀缺电价导致系统成本增加。因此容量市场受到投资者支持[25],其发电能力可靠,供应安全稳定,同时需求响应和储能的加入可实现发电充足性。近些年P2P(peer to peer)能源交易平台率先在瑞士落地实施[26],去中心化的市场机制设计[27]是双边能源交易的基础。联合双向能源和辅助服务市场中交互式电网系统的协同优化[28],对分布式能源与配电网运营商的经济性、灵活性以及可靠性进行评估[29]。

解决方法:随着市场的转变与发展,负荷预测已成为一个重要的研究领域,是电力市场运营和规划的关键任务。短期负荷预测常用长短期记忆、回声状态网络等模型,分布式学习算法对于预测复杂地理分布的用户非常具有潜力。近些年采用相似日法衡量气候的影响因素[30],最新的发展轨迹为机器学习模型[31],用于预测技术的发展,支撑后续投标策略和估算盈利。

3 电力市场的核心前沿

本节对国内近五年896 篇、国外近五年3 238篇电力市场的相关研究,采用基于知识图谱的方法动态追踪热点,呈现电力市场领域的核心前沿。基于关键词出现频次进行研究热点的可视化;基于节点权重探测核心前沿,权重以突现性和中介中心性进行衡量,提炼出电力市场研究的关键核心。

3.1 国内电力市场的核心前沿

本小节数据来源于中国知网CNKI 中近五年电力市场相关的文献,总计896 篇。结合1.2 节提及的图谱剪枝,对生成的单年网络或综合网络选择寻径网络算法或者最小生成树算法进行裁剪简化,结果见表3。对比四种方式的综合聚类效果可知,采用寻径网络算法裁剪单年网络的效果最佳。

表3 不同聚类裁剪算法效果对比 Tab.3 Comparison of the effects of different clustering and clipping algorithms

3.1.1 关键词网络图谱

图谱剪枝后,优化的关键词网络图谱如图6 所示。节点叠加成的树环大小表示每年的被引频次,出现频次较高的热点关键词有现货市场、辅助服务以及需求响应等。以现货市场节点为例加以说明,梳理该节点及其连接关系。

图6 关键词网络图谱 Fig.6 Keywords network map

现货市场节点以及连接如图7 所示,从其连接关系中可以看出,目前现货市场中存在不平衡费用、与中长期市场的衔接以及串谋竞价等问题。这些问题归根结底在于市场机制的不成熟,而市场机制中的重要环节之一是电价的机制设计。其大致可分为两种思路:①采用新方法的传统定价模式,如利用多智能体强化学习确定节点边际电价[32];②采用新的定价模式仍处于摸索阶段,如凸包定价模式[33]。此外,新兴的交易品种有金融输电权,金融产品的衍生能够更加还原电力的商品属性。

图7 现货市场节点Fig.7 Spot market node

由此看来,在知识图谱中可以选择任意感兴趣的节点并加以剖析,这种方式较为主观,当节点众多、连接复杂时难以把握整个图谱最核心的部分。接下来本节从节点的权重角度,探测出图谱的关键核心节点,以此捕捉电力市场相关的核心前沿。

3.1.2 关键核心节点

结合1.3 节提及的节点权重计算,以突现性和中介中心性作为衡量,探测出关键节点,并在图谱中反映出关键节点。知识图谱中,突现性表现为节点中心的红色引用环,中介中心性表现为节点最外围的粉色引用环。

1)突现节点

以最小持续时间1 年,寻找到12 个突现词,结果见表5。黑色方块对应时间轴2016~2020 年中的突现年份。

表5 关键节点-突现词表 Tab.5 Key node-emergent vocabulary

(续)

由表5 可知,能源互联网与电力市场改革属于研究背景的突现。在此背景下,针对综合能源系统的能源市场的推行,服务商参与市场的行为决策以及多能源耦合的网络阻塞管理等问题仍在研究中。同时,电力市场改革突现的时间点与中央发布《进一步深化电力体制改革的(中发[2015]9 号)文件》的时间相吻合。此外,突现性还体现在市场主体、交易品种以及应用场景等。以辅助服务为代表的交易品种是近五年突现强度最高的关键词,其包含的交易品种调频与深度调峰持续突现3 年,这表明目前电力市场还在探索辅助服务相关的研究。因此,以此节点为例,回溯至网络图谱并加以解析,图谱如图8 所示。

图8 辅助服务节点 Fig.8 Auxiliary service node

从网络图谱中辅助服务节点及其连接关系可以看出,分布式电源凭借灵活调节的优势成为辅助服务市场的核心成员,如何整合其灵活性挖掘潜在市场力仍需进一步探索。交易品种中广泛应用的是深度调峰,在此环节中需求响应的参与[34]越来越受到重视,要加强需求响应主动参与市场,如利用强化学习等算法得出其最优决策[35]。

2)中介中心节点

从高到低排列节点的中介中心性,选取前8 个中介中心性词,结果见表6。寻找的中介中心性词中,市场主体相关的最多,研究对象因更多考虑的为主动配电网、电动汽车等。同时,应用场景中最新颖的是商业模式。主动配电网是中介中心性最高的关键词,接下来以此节点为例解析。

表6 关键节点-中介中心词表 Tab.6 Key node-intermediary central vocabulary

主动配电网节点及其连接如图9 所示。首先,主动配电网融合了多个领域内的研究,例如可再生能源、电动汽车等,目前研究借助区块链的存储技术优化交易策略[36],以此作为智能合约的基础。其次,与鲁棒优化节点相连接,而鲁棒优化应用场景应考虑规划与运行相结合的优化配置[37]。同时,高比例可再生能源的电力市场,应更多地考虑以电动汽车为代表的产消者参与能量交易市场的商业模式。

图9 主动配电网节点 Fig.9 Active distribution network Node

3.2 国外电力市场的核心前沿

本小节数据来源于Web of science 检索3 238 篇相关文献。生成关键词网络图谱,并采取不同的优化算法进行图谱剪枝,结果见表7。对比聚类效果可知,综合聚类效果最佳为0.877 9。

表7 不同聚类裁剪算法效果对比 Tab.7 Comparison of the effects of different clustering and clipping algorithms

基于寻径网络算法对综合网络裁剪,聚类效果明显优于单年网络。这是由于文献数量增加,导致单年裁剪的网络划分模糊,使得其聚类模块值较低,进而影响了整体的聚类效果。因此,选择对综合网络裁剪,得到关键词的聚类图谱,如图10 所示。关键词网络图谱中出现频次最高的有模型、优化、需求响应、可再生能源、电价以及不确定性等。完整的图谱展示了全部的信息,但由于数据过多使得图谱节点众多、连接复杂,从而缺乏可读性。因此,接下来依据节点的权重,提炼出关键节点,聚焦于局部图谱。

图10 关键词网络图谱 Fig.10 Keywords network map

以最小持续时间为一年,寻找16 个突现关键词,结果见表9。

表9 关键节点-突现词表 Tab.9 Key node-emergent vocabulary

从表9 中可知,突现强度比较高的关键词有随机过程、最优潮流以及电价预测。区别于中国的定价机制,国外在电价预测方面发展迅猛。在此领域中,机器学习算法仍具有研究价值。最新突现的关键词有能量枢纽、区块链,例如考虑信息勾鸿决策能量枢纽的管理仍需提高其决策灵活性。随机过程节点兼具突现性高以及时间最新的特点,以此节点为例展示其在网络图谱中的具体连接,如图11 所示。从图中可以看出,随机过程方法,应用于不确定性因素的量化处理,或者计及发电侧经济性的最优运行策略。

图11 随机过程节点 Fig.11 Stochastic process node

从高到低排列节点的中介中心性,选取前8 个中介中心性词,结果见表10。应用场景中最新颖的是能量交易。能量交易中,需求响应的环境效益[38]是一个相对较新的话题,碳排放交易是其中不可或缺的环节。通过跟踪需求响应的碳排放量,有效地指导排放交易计划。从表10 中可以看出,聚合商是中介中心性最高的节点,接下来以此节点为例进行解析。

表10 关键节点-中介中心词表 Tab.10 Key node-intermediary central vocabulary

聚合商节点及其连接如图12 所示。常见的聚合 商有虚拟电厂、电动汽车聚合商。虚拟电厂的灵活运行缓解网络堵塞,提高其集成能源的附加价值;电动汽车聚合商的管理,需考虑驾驶模式、市场价格的不确定性[39]。此外,电动汽车通过V2G(vehicleto-grid)提供电网辅助服务,提高车网系统灵活性[41]。市场机制对于充分开发产消者的潜力是非常有必要的[42],鼓励本地配电网内的发电和消费,同时利用机器学习等算法为聚合商提供决策支撑。

图12 聚合商节点 Fig.12 Aggregator node

4 结论

本文立足国内外电力市场相关研究,追踪国内外在市场化进程中的研究成果,以十年为时间尺度刻画研究聚类集群中发展演变轨迹,详细而全面地展示各个集群内部随时间的演进过程;以五年为时间尺度抓取研究热点词,形成关键词网络图谱,采用中介中心性衡量关键节点以及重要连接,采用突现词挖掘集群中具有潜力的研究主题,实现专业领域的研究前沿跟踪。所得具体结论如下:

1)国内的演进轨迹和核心前沿:商业模式为研究轨迹中连接最多的节点,商业模式的探索例如规模化分布式储能提供辅助服务的自盈利模式等。辅助服务为近五年突现强度最高的关键词,其交易品种中广泛应用的有深度调峰,在此环节加强以需求响应为代表的灵活性资源的主动参与市场。主动配电网是中介中心性最高的关键词,借助区块链的存储技术优化交易策略;鲁棒优化等算法的应用场景应考虑规划与运行相结合的优化配置;高比例可再生能源的电力市场,应更多考虑以电动汽车为代表的产消者参与能量交易市场的商业模式。

2)国外的演进轨迹和核心前沿:纯能源市场稀缺电价导致系统成本增加,容量市场成为热点;同时,去中心化的市场机制设计仍在实行与探索中。在电价预测方面发展迅猛,在此领域中,机器学习算法仍具有研究价值;聚合商是中介中心性最高的关键词,以虚拟电厂、电动汽车为代表的聚合商,鼓励其主动为电网提供灵活性。

3)针对电力市场领域的发展前沿,本文提供了一种基于知识图谱的可重复、系统化方法来刻画研究领域的发展历程,可广泛应用于各个研究领域。可视化图谱从视觉分析角度呈现领域专业的进化阶段;利用视觉编码中赋予的节点权重-中介中心性、突现性可识别专业领域的关键核心。

猜你喜欢
图谱集群聚类
绘一张成长图谱
基于K-means聚类的车-地无线通信场强研究
海上小型无人机集群的反制装备需求与应对之策研究
一种无人机集群发射回收装置的控制系统设计
Python与Spark集群在收费数据分析中的应用
补肾强身片UPLC指纹图谱
基于高斯混合聚类的阵列干涉SAR三维成像
勤快又呆萌的集群机器人
主动对接你思维的知识图谱
基于Spark平台的K-means聚类算法改进及并行化实现