基于组合权重的Fisher最优分割法在水库汛期分期中的应用

2024-02-18 03:09夏青青李英海刘芬劳嘉鹏田丽娟
人民珠江 2024年1期

夏青青 李英海 刘芬 劳嘉鹏 田丽娟

摘要:针对Fisher最优分割法中多指标赋权仅考虑单一客观赋权法的不足,将基于信息论的熵权法和基于统计学原理的变异系数法、CRITIC赋权法引入到指标权重计算中,提出基于组合权重的Fisher最优分割法进行水库汛期分期。以水布垭水库为例,选取能反映洪水变化规律的旬平均流量、最大洪峰流量出现次数、旬最大一日洪量、旬最大三日洪量、旬最大七日洪量5个指标,采用基于组合权重的Fisher最優分割法进行汛期分期,并将分期结果与采用单一客观赋权法的分期结果进行对比分析,最后确定汛期分为3期最优,前汛期为5月1日至6月10日、主汛期为6月11日至7月31日、后汛期为8月1日至9月30日。研究结果表明:采用组合权重法确定权重既兼顾了熵权法、变异系数法、CRITIC赋权法的优势,又能直观地区分不同指标对汛期分期的影响程度,该方法适用于Fisher最优分割法中多指标权重的确定。

关键词:汛期分期;多指标权重;组合权重法;Fisher最优分割法;结果影响

中图分类号:TV21  文献标识码:A  文章编号:1001.9235(2024)01.0146.08

Application of Improved Fisher Optimal Segmentation Method Based on Combined Weight Method in Reservoir Flood Season Staging

XIA Qingqing1,LI Yinghai2*,LIU Fen1,LAO Jiapeng2,TIAN Lijuan3

(1.Survey Team of Jingzhou Yangtze River Administration,Jingzhou 434000,China;

2.College of Hydraulic & Environmental Engineering,China Three Gorges University,Yichang 443002,China;

3.Jingzhou District Water Conservancy Project Migration Service Center,Jingzhou 434000,China)

Abstract: In Fisher optimal segmentation method,multi.index weighting only considers a single objective weighting method.To overcome the shortcoming,this paper introduces the entropy weight method based on information theory,the coefficient of variation method based on statistical principle,and the CRITIC weighting method in the calculation of index weight.It proposes the Fisher optimal segmentation method based on combined weight.Taking Shuibuya Reservoir as an example,five indicators are selected,including the average flow in ten days,the number of occurrences of the maximum peak flood flow,the maximum one.day flood volume in ten days,the maximum three.day flood volume in ten days,and the maximum seven.day flood volume in ten days.Then the Fisher optimal segmentation method is applied to divide the flood season,and the staging results are compared with the staging results by a single objective weighting method.It is determined that the flood season is divided into three optimal periods.The pre.flood season is from May 1 to June 10,the main flood season from June 11 to July 31,and the post.flood season from August 1 to September 30.The results show that the combined weight method takes into account the advantages of the entropy weight method,the coefficient of variation method,and the CRITIC weighting method.The method can intuitively distinguish the influence degree of different indexes on flood season staging and is suitable for determining multi.index weight in the Fisher optimal segmentation method.

Keywords:flood season staging;multi.index weight;combined weight method;Fisher optimal partition method;result influence

中国由于受季风气候影响,各大流域降水和径流具有明显的季节性变化,随着水资源供需矛盾加剧,水库防洪和兴利的矛盾也更加显著[1-2],而在不增加防洪风险的前提下,充分利用中国洪水季节性变化规律,对水库汛期进行分期,拟定分期汛限水位,能有效缓解防洪与兴利矛盾。汛期分期研究方法分为定性分析和定量分析两大类。定性分析方法主要是成因分析法,该方法主要是对水文、气象条件进行分析,是最早也是采用最普遍的方法,但存在主观性强、精度低等不足之处。常用的定量分析方法包含数理统计法、分形理论、变点分析法、Fisher最优分割法等,数理统计法原理简单、实用性强,但阈值选取具有一定主观性;分形理论具有较强物理背景,但只能考虑单指标;变点分析法能考虑多指标,但在变点数的确定方面具有较强的主观性;而Fisher最优分割法不仅能考虑汛期多指标因子的影响,而且能确定最优分期数目,是现在应用较为普遍的一种汛期分期方法。

Fisher最优分割法是根据各指标对样本的重要程度不同,通过赋不同权重来体现各指标对分期的影响程度。多指标赋权方法主要有两大类:一类是主观赋权法,如层次分析法、专家评分法;另一类是客观赋权法,如主成分分析法、变异系数法、熵权法、CRITIC法。最早,刘克琳等[3]提出专家评判法确定Fisher最优分割法中各指标的权重。莫崇勋等[4]在对澄碧河水库进行汛期分期时采用赋均权重的方法考虑多指标对汛期分期的影响。朱燕燕等[5]提出采用模糊层次分析法确定其权重系数,再利用Fisher最优分割法对汛期进行详细划分。李英海等[6]采用基于熵权法改进的Fisher最优分割法确定各指标权重,并应用于三峡水库汛期分期。许多研究者提出了多指标权重法来改进Fisher最优分割法中赋均权重的问题,但目前研究局限于考虑单一客观赋权法,极少有考虑不同客观赋权方法对Fisher最优分割法影响的研究。为解决Fisher最优分割法中确定权重仅考虑单一方法的不足,提出基于熵权法、变异系数法和CRITIC赋权法的组合权重法计算指标权重,然后再结合Fisher最优分割法进行汛期分期,以水布垭水库为例开展研究,以期为汛期分期中多指标权重的确定提供参考。

1 Fisher最优分割法基本原理及计算步骤

Fisher 最优分割法以各个分段总离差平方和最小为依据,以各段内样本间差异最小、各分段间差异最大为基本原则,对有序样本进行分割[7-8]。将n个有序样本用{ X1,X2,X3,…,Xn }表示,B(n,k)表示将n个有序样本分割成k段,这种分割可表示如下:

Pk={ik,ik+1,...,ik+1-1}

其中的分段点满足1=i1

具体步骤如下。

步骤一 数据处理。考虑多指标进行Fisher最优分割时,假设每个样本Xi均有m项指标,即Xi={xi1,xi2,…,xij,…,xim}。对各指标特征值进行无量纲化处理,得到标准化矩阵X′=[x,ij ]nm。

再进行加权计算,得到向量Y:

式中 wj——第j个指标的权重。

式中 yt——第t个分类中的样本值,1≤t≤k。

若用D(it,it+1-1)来表示某一类Pt的类直径,则可记为:

步骤三 定义目标函数。根据最优分割的原则,定义目标函数为:

使目标函数值最小的分割即为Fisher最优分割,记为:

步骤四 推求最优分割。最优分割是以各段内样本间差异最小、各分段间差异最大为基本原则,有序样本y1,y2,…,yn 的最优k分割是在其某一个截断末尾子段的最优分割B(ik-1-1,k-1)之后再添加一段形成的,递推公式为:

先找到分割点ik,使B(n,k)达到最小,即:

B(n,k)=B(ik-1,k-1)+D(ik,n)(7)

由此得第k类为Pt=yik,yik+1 ,…,yik+1-1 ;然后找ik-1,使其满足:

Bk(ik-1,k-1)=B(ik-1-1,k-2)+D(ik-1,ik-1)(8)

得到第k-1类Pk-1=i,ik-1+1,…,ik-1。以此类推得到最优k分类的分类结果。

差异越明显,因此取f(k)最大时的k值作为最优分类数。

2 组合权重计算方法

采用Fisher最优分割法进行汛期分期时,需要对选取的各个指标进行赋权,在上述计算步骤的基础上增加权重分析计算部分,具体计算流程见图1。将Fisher最优分割法中初始分类向量Y′的权重由多指标权重w′j确定,见式(9),w′j采用熵权法、变异系数法、CRITIC赋权法计算得到。

2.1 熵权法

熵权法以变量隐含的信息熵为基础,利用信息量大小进行权重计算,是一种客观赋权方法。计算步骤如下[10]。

步骤一 计算指标j的熵值Hj。

步驟二 根据指标j的熵值计算其熵权w′1j。

2.2 变异系数法

变异系数法是利用统计学原理对指标变化程度进行计算,确定指标的重要程度,变异系数值越大,能提供的信息量越多,反映系统特征的差异性越大,指标区别程度越明显,所赋的权数越大。计算步骤如下[11-12]。

步骤一 计算各指标变异系数。

其中:

步骤二 计算各指标的权重。

2.3 CRITIC赋权法

CRITIC赋权法是一种客观赋权方法,它以标准差的形式来衡量样本的离散程度,以指标间的相关性为基础来反映指标的独立性[13]。它通过指标的相关系数和标准差来确定信息量,指标信息量越大,则该指标的重要性越大,权重就越大。计算步骤如下。

步骤一 计算第i项评价指标的变异性和冲突性。变异性通过标准差进行表征,冲突性由cj表示。

式中 σj——第j个指标的标准差;rij——2个评价指标间的相关系数。

步骤二 计算各指标权重。

2.4 组合权重计算方法

熵权法是基于信息论基本原理,变异系数法和CRITIC赋权法是基于统计学原理,熵权法属于第一类赋权方法,变异系数法和CRITIC权重法属于第二类赋权法[14]。为了兼顾各种赋权重方法的优势,通过加权法建立组合赋权方法,本文假设2类赋权方法具有同等重要性,令β=0.5,同时也假设第二类赋权方法中的变异系数法和CRITIC赋权法也具有同等重要性。本文采用式(16)计算第j项指标的组合权重:

式中 w′1j、w′2j、w′3j——熵权法、变异系数法、CRITIC赋权法计算所得权重。

3 实例计算

水布垭水库是清江流域梯级水库的第一级水库,坝址以上流域面积10 860 km2,是一座以发电为主,兼防洪、航运的大型水利枢纽。清江流域位于长江中游,为亚热带季风气候,流域降水量时空分布具有鲜明的季节性特征。雨季一般从4月开始,9月底結束,降水量年内分配不均,4—9月降水量占全年的 75%~78%,其中5—8月的降水量占全年的50%~55%[15-16],因此有必要进行汛期分期。

3.1 样本指标选取

3.2 指标权重计算

采用熵权法、变异系数法、CRITIC赋权法、组合权重法分别计算各指标权重,结果见图2。由计算结果可以看出,4种考虑指标差异的赋权方法均是各旬洪峰出现次数所占权重最大,且均超过均权重0.20,说明各旬洪峰出现次数对分期影响较大;而W3d和W7d所占权重较小,均小于均权重0.20,说明这2个指标对汛期分期的贡献度较小。采用组合权重法综合考虑熵权法、变异系数法和CRITIC赋权法计算得权重w′=(,N,W1d,W3d,W7d)=(0.21,0.27,0.21,0.13,0.17)。

3.3 分期计算

将组合权重法计算所得的权重对各指标加权计算得出初始分类样本向量,再计算各截断样本的目标函数B(n,k)值,Fisher最优分类结果见表2,绘制目标函数B(n,k).k和非负斜率f(k).k曲线,见图3。

由图3可见,B(n,k)函数值在k=3处出最陡且出现拐弯,且f(k)最大,所以分3类最优。由表2可得k=3对应的分期为{1,2,3,4}、{5,6,7,8,9}、{10,11,12,13,14,15},即前汛期为5月1日至6月10日、主汛期为6月11日至7月31日、后汛期为8月1日至9月30日。

3.4 结果分析

根据前文Fisher最优分割法的计算步骤,采用基于单一客观赋权法的Fisher最优分割法计算得到水布垭水库汛期分期结果,见表3。由表3可见,3种单一客观赋权法和组合权重法均是将汛期划分3期为最优,除基于变异系数法确定的结果略有差异外,熵权法、CRITIC赋权法和组合权重法的分期结果一致。综合权重指标计算分析可得,基于变异系数的Fisher最优分割法分期结果与其他2种单一客观赋权法存在差异的原因是、N、W1d、W3d、W7d这5个指标所占的权重不同,而熵权法、CRITIC赋权法的各旬洪峰出现次数所占权重均较变异系数法大,对汛期分期影响更显著,分期结果更接近。为兼顾各种赋权法的优势,采用基于变异系数法、CRITIC赋权法、熵权法的组合权重法对权重进行优化,最终得到的分期结果与基于熵权法和CRITIC赋权法的分期结果一致。

根据1950—2020年水布垭入库日径流资料,统计分析了水布垭汛期洪水分布特征。水布垭入库径流年最大日平均流量散点图以及多年日平均流量见图4。由图4可以看出,水布垭年最大日平均流量散点的概率呈现由弱到强再由强到弱的规律,散点主要集中在6月中旬至7月底;由多年日平均流量过程线可以看出,多年日平均流量在6月下旬至7月底呈峰状,明显高于其他时间段。

通过对水布垭入库径流年最大洪峰发生时间进行统计(图5)可得,年最大洪峰主要出现在5月下旬至7月底,约占总数的75%;大于3 000 m3/s的洪峰量级主要出现在6—7月,约占总数的59%;大于5 000 m3/s的洪峰量级主要出现在7月,约占总数的54%。

综合上述分析可将水布垭水库汛期划分前汛期为5月1日至6月10日、主汛期为6月11日至7月31日、后汛期为8月1日至9月30日,与前文基于组合权重的Fisher最优分割法划分结果一致。

4 结论

为解决Fisher最优分割法中多指标赋均权的不足,提出基于变异系数法、CRITIC赋权法、熵权法的组合权重法确定权重系数,兼顾了各种赋权重方法的优势,既深入挖掘了各指标的隐含信息,又考虑了各指标间的差异。以水布垭水库为例进行汛期分期研究,组合权重法能较直观地区分出旬平均流量、最大洪峰流出现次数、旬最大一日、旬最大三日、旬最大七日洪量这5个指标对汛期分期的影响程度,其中最大洪峰流出现次数所占权重最大,影响最显著,最大三日洪量所占权重最小,影响程度较其他指标最小。最终确定水布垭水库最优分期结果5月1日至6月10日为前汛期、6月11日至7月31日为主汛期、8月1日至9月30日为后汛期,分期结果能够较好地反映水布垭水库的洪水特征,研究表明组合权重法适用于Fisher最优分割法中多指标权重的确定。

参考文献:

[1]郭生练,刘攀,王俊,等.再论水库汛期水位动态控制的必要性和可行性[J].水利学报,2023,54(1):1-12.

[2]王俊,郭生练.三峡水库汛期控制水位及运用条件[J].水科学进展,2020,31(4):473-480.

[3]刘克琳,王银堂,胡四一,等.Fisher最优分割法在汛期分期中的应用[J].水利水电科技进展,2007(3):14-16,37.

[4]莫崇勋,王大洋,朱新荣,等.Fisher最优分割法在澄碧河水库汛期分期中的应用[J].水力发电,2017,43(6):19-22,27.

[5]朱燕燕,武鹏林.基于FAHP-Fisher的最优分割法在汛期分期中的應用[J].水电能源科学,2016,34(6):57-59,56.

[6]李英海,夏青青,王永强,等.考虑溪-向梯级调蓄影响的三峡水库分期汛限水位研究[J].长江流域资源与环境,2022,31(7):1514-1522.

[7]夏青青,李英海,郭家力,等.基于熵权法的改进Fisher最优分割法在水库汛期分期中的应用[J].人民珠江,2019,40(7):42-47.

[8]唐莉,张永波,祝雪萍,等.基于PCA-Fisher最优分割法的汛期分期影响研究[J].水力发电,2018,44(1):13-16,76.

[9]李东琴,黄亚,易灵,等.基于Fisher最优分割法的龙滩水库汛期分期研究[J].人民珠江,2021,42(3):12-16,52.

[10]虞慧,刘星根,吴晓彬,等.指标权重算法对Fisher最优分割在水库汛期分期中的影响研究[J].中国农村水利水电,2021(1):105-110.

[11]张霞,武鹏林,祝雪萍.综合分期方法在陈家湾水库汛期分期中的应用[J].人民黄河,2019,41(2):54-58,63.

[12]李俊.基于改进模糊集分析法的汛期分期[J].长江科学院院报,2017,34(12):12-16.

[13]罗宇,田向忠,徐泗鑫,等.基于CRITIC权的减法集对势法在佛子岭水库汛期分期中的应用[J].江淮水利科技,2022(6):15-18.

[14]吴荣根,吴博阳,蔡海洋,等.基于组合权重-TOPSIS综合评价法的风场及风力发电机组健康度评估[J].微特电机,2023,51(5):66-71.

[15]郭生练,陈炯宏,栗飞,等.清江梯级水库汛限水位联合设计与运用[J].水力发电学报,2012,31(4):6-11.

[16]熊丰,郭生练,王俊,等.清江水布垭和隔河岩梯级水库防洪库容互补关系研究[J].水力发电,2021,47(5):36-40,120.