应用GS-FCM 复合聚类的配网项目造价分析研究

2022-07-22 02:28赵振宇包格日乐图
工程管理学报 2022年3期
关键词:供电量配电网聚类

刘 宣,赵振宇,包格日乐图

(1.国网冀北电力有限公司经济技术研究院,北京 100038;2.华北电力大学 经济与管理学院,北京102206,E-mail:baogeriletu111@163.com)

城乡配电网不停电作业是提高配网供电可靠性和提升供电服务质量的重要手段,技术应用比率逐年攀升。为提高配电网各情景下采用不停电作业技术的项目成本管控能力,适应配电网高质量建设及智能化管理发展趋势,在配电网规划建设上,有必要从采用不停电作业技术的项目造价分析角度开展项目成本管控的综合评价指标体系构建及聚类分析与预测研究,目的是建立并基于既有成功典型案例库研究不停电作业情境下配电网同属类项目成本构成及相应成本管控策略。

基于项目管控优化角度开展配电网项目建设不停电作业,可有效实现区域电网高质量供给服务及设施高效迭代目标。现阶段,有学者基于配电网建设不停电作业项目技术管理角度展开研究,如黄湛华等[1]创建了一套城市配电网不停电作业项目全流程管控体系,实现项目流畅性、安全性等优化目标。孙伟等[2]使用多因素Logistic 回归方法构建不停电作业等级评估模型,完成对线路不停电作业能力的评估。为提升配网项目管理技术分析能力,杨帆等[3]通过开展不停电方案智能编制、工器具全生命周期管控等应用场景研究,完善不停电作业全流程智能化、自动化管理。廖天明等[4]提出基于聚类算法的配电网基建改造项目综合评估方法,实现电网改造投资精确管理的指导目标。针对不停电作业技术下配电网改造及新建项目阶段性成本管控特点,祝健勋[5]提出通过采用项目整体规划、工期缩减、及招标阶段造价管理等手段实现对配电网络高效管控的建设成本目标。基于现有研究基础,本文根据配电网项目成本管理的不停电作业趋势化及智能化特点,采用科学合理的综合评价指标体系及聚类分析算法,可有效开展不同属类不停电作业项目工程造价辅助性分析及成本管控策略研究。

1 建立项目综合评价指标体系

考虑配电网不停电作业项目多发生于区域负荷增长显著,设备、线路老化及故障频发等情况区域,配电网潜在事故症结的有效甄别及问题筛选对项目预防性工作具有参考借鉴意义[6,7]。配电网不停电作业项目样本数据多存在时空随机性及区域分散性特征[8,9],不同项目发生区域地形复杂程度对项目土建和安装工程费等费用产生较大影响,同时受区域组织管理及物资价格水平影响,地区配网成本构成和造价水平管控也存在较大差异。考虑不停电作业项目区域异质性及成本波动性特点,有必要构建考虑不停电作业项目基本特征及衍生指标的综合评价指标体系[10],辅助参考既有案例进行数据的自适应学习及分析输出,采用经验性手段提高项目成本管控分析及指导能力。

依据指标针对性考量,项目基础数据指标如项目概预算投资、竣工结(决)算投资、技术条件(不停电作业次数、涵盖减少停电量)、地形分布占比及项目分项费用构成指标等,突出不停电作业项目成本构成要素差异性;衍生指标建立在基础指标之上,为突出不停电作业项目成本管控差距和深入发掘项目特征,通过数据再整合及计算获得如多供电量和单位多供电量费用成本指标。同时,为实现样本数据有效经济性研究,通过不停电作业项目结余率分析及聚类分析实现项目内在规律性及联系性挖掘,辅助未来同类项目经济性分析及分类管理,指标体系构建及研究流程如图1 所示。

图1 不停电作业项目造价控制综合评价指标体系及研究框架图

2 建立项目复合聚类模型

本文采用的GS-FCM 复合聚类模型将隶属度模糊聚类与初始聚类寻优算法相结合,有效聚焦聚类算法初始数据条件解及提高高维度数据聚类精度。

2.1 间隔统计量算法

考虑样本数据庞大及影响因素高维情况下存在类群数确定困难的问题,采用间隔统计量算法(Gap statistic)对FCM 初始聚类数展开迭代寻优并确定最佳聚类数目[11,12],通过有效估计最佳聚类数目以优化改进聚类过程,公式如下:

假设类群数为k类,其中,Ck表示聚类得到的第k类;nk为类中所有成员数目;该类中所有成员彼此距离平方和为DK。Wk代表该类内平方和的平均值,对Wk取对数处理并与构造的零均值均匀分布进行比较;{logWk}是通过B次对参考分布的Monte Carlo 模拟所得logWk期望值;Gapn(k)为参考数据集随机样本损失和实际样本损失之差,假设实际样本对应最佳簇数是K,Gap取得最大值所对应K值为最佳类群数。相关计算式为:

式中,sdk为B次Monte Carlo 模拟logWk的标准差。

2.2 模糊C 均值聚类

模糊C均值聚类算法是一种基于获取目标函数最小值的无监督模糊聚类算法[13]。通过该算法可确定数据不同属类聚类中心参数,再通过各数据点与各聚类中心距离判定其隶属度。FCM 聚类算法目标函数Jm(U,V)及约束条件[14,,15]如下式:

式中,uij为某个样本属于某一类属隶属度;n为样本总个数;k为类群分类数,k∈[2,n];m为平滑指数,m∈[1,+∞],用于控制属类间模糊程度;vi为某类属聚类中心;xj为第j个样本值。当完成迭代时,根据uij对样本进行分类。

采用拉格朗日乘子法求Jm(U,V)在达到全局极值时的uij和vi,使目标函数达到极小值,计算公式为:

具体GS-FCM 算法流程如图2 所示。

图2 GS-FCM 复合聚类算法流程示意图

3 案例分析

3.1 案例信息

某地区10kV 及以下配网工程采用不停电作业方式开展工程项目建设,据统计,该地区两年内10kV 及以下配网工程累计完成不停电作业项目43项,累计87 次,减少停电6.61 万时·户,增供电量6.13 万千瓦时。

案例数据来源于该地区工程项目造价数据库,考虑区域配网项目通常为涵盖各型号配电工程、配电线路(架空线路、电缆线路)的综合建设项目,项目总体工程量较难精确且综合统计,项目单位造价数据无法及时给定。因此,案例基于综合评价指标数据开展基于不停电作业项目视角的项目聚类及造价对策分析,建立“基础+衍生”两个层次共11 项指标,指标数据如表1 所示。

表1 不停电作业工程项目综合评价指标体系

3.2 项目分析

如表1 所示,本案例不停电作业项目均为配电网新建工程项目,安装工程费为项目成本控制重要目标。考虑短期内不同区域设备采购价格及设备技术规格存在较小浮动,实施设备成本管控带来的经济效益变量并不明显;不停电作业费用虽总成本占比较小,但考虑项目施工实施环节,不停电作业贯穿始终,对项目的施工工艺及成本控制起到决定性作用;通过项目概预算、结(决)算及资金结余率等常规数据分析,可直观评估项目建设规模、投资规模及成本控制效率等项目参数,为项目提供评估基础。

基于综合评价指标体系,采用GS-FCM 模糊聚类模型开展类属数迭代寻优测算,通过计算最大Gap值及最大Gapn(k-1)-(Gapn(k)+sk)值,确定最优聚类数目K=8,最大Gap值数据参考如图3 所示。

图3 GS-FCM 复合聚类算法聚类数寻优路径图

GS-FCM 聚类算法将以上43 个项目进行聚类为6 至9 类的数据迭代寻优,具体聚类数目变更过程数据如图4 所示。

图4 项目聚类数目迭代优化对比图

从聚类划分数目增长趋势分析,随着聚类迭代数目增加,属类3、5 和7 始终趋于稳定,属类9在聚类数目达到9 之后从属类2 中分离,存在变异扩展情况,剩余其他类在聚类数8 阶段之后基本趋于聚类稳定,隶属度数值变更不明显。

为避免造价项目数据硬归类效果,采用隶属度函数实现项目的聚类灵活性,如项目3、4、5、6等均存在绝对优势隶属度情况(隶属度在90%以上),项目聚类属性明显。高隶属度类项目在进行成本管理时可为后期同类项目提供重要参考依据,并通过采用相似技术、组织管理等手段实现项目成本管控及方案归档。因此,为提高项目成本管控效率,可通过该聚类分析方法实现项目立项及设计阶段项目建设规模及成本构成预测。案例具体项目聚类划分情况如表2 所示。

表2 项目最优聚类及隶属度

该研究对象在聚类数达到8 阶后,聚类趋于稳定。如表2,聚类4、7 和5 的项目基础及衍生指标数值较为接近,高度相似并聚类研究,普通造价及带电作业造价水平可共同作为项目评价聚类依据。其中,聚类7 样本数占比各分类阶段均达21%,聚类5 样本数占比各分类阶段均达19%,具有高聚类稳定性且样本数量庞大,可作为典型工程研究;聚类1 项目衍生指标数值较为接近,基础指标结构存在差异性,项目存在较高相似性并聚类研究;聚类2 及聚类8 项目基础指标数值较为接近,衍生指标结构存在差异,项目存在较高相似性并聚类研究,该类样本数占比各分类阶段均达16%;聚类6 项目基础及衍生指标结构均存在一定差异性,项目可暂归一类;聚类3 项目在各聚类划分阶段隶属度占据绝对优势,可单独研究。具体特征划分如表3 所示。

表3 项目基于指标倾向的聚类划分及特征描述

通过以上分析,可基于两类指标应用场景及参评重要性对项目划分三类,具体特征如下:

第一类:依据基础及衍生双重指标聚类项目,该类项目基于欧氏距离原理利用数据结构的整体异质性开展特定类型项目聚类。相同属类数据特点为,数据结构相似,各评价指标数值差异较小,整体性较为一致。

第二类:依据基础或衍生单一型指标聚类项目,该类项目评价依据通常为常规项目费用构成及造价控制指标,或二次衍生的不停电作业造价控制等指标。以上项目多在基础指标的分项费用构成、静态投资额或衍生指标的多供电量、单位多供电量费用成本、不停电作业项目结余率角度,存在较高结构相似性或数据比例相似性。

第三类:基础和衍生参考性均不明显型聚类项目,该类项目可归纳如下两子类:一是受项目样本数量限制,项目暂无可匹配及归类对象;二是随着聚类数目迭代寻优,项目存在不同阶段聚类隶属度变更情况,项目属类产生跳跃性变换。

3.3 项目造价控制应对策略

(1)针对基础与衍生指标数据结构均相似项目,分项费用占比数据结构较接近,安装工程费用占比、总静态投资额与建设规模存在较强相关性,导致项目多供电量及单位多供电量费用成本较高。考虑该类属项目规模特点,建议通过样本数据加权形式确定各类属基础及衍生指标均值及浮动范围,构建指标参考幅值及最优数据结构框架。

考虑该类属项目数量优势,重点发掘成本管控特点,造价管理可从项目可研及初步设计环节,增加各部门与咨询、设计机构信息沟通接触面,从方案设计阶段锁定设备及材料采购清单和相应安装工程费用构成,对项目投资开展精细化控制,充分考虑带电作业技术介入的项目施工定额设计及变更,提高投资估算精度,构建典型性数据结构框架;项目可行性初步落实后,多部门联合开展项目可行性成本控制再论证工作,将不停电作业技术贯通于项目各环节并优化各环节安装工程费用。

(2)针对基础指标数据结构相似项目,静态投资水平、分项费用占比及地形占比等指标数据结构较接近,但衍生指标差距较大,造成此类数据结构特点主要原因为不同项目不停电作业技术施工水平及项目停电总时长差距较大,多供电量等数据较为离散,不停电作业技术的应用渗透率直接影响项目设计及施工环节造价成本控制,从而导致区域项目结余率差距较大。考虑该类属项目规模特点,建议通过样本数据加权形式确定基础指标均值及浮动范围,通过基础指标均值及适中或较低的衍生指标数值推算项目各类指标浮动范围,构建指标参考幅值及最优数据结构框架。数据框架的制定应基于样本衍生指标的概率分布特点,酌情确定衍生指标数值以兼顾不同区域不停电作业技术差异特点。

针对衍生指标数据结构相似项目,多供电量、单位多供电量费用成本及不停电作业项目结余率指标数据存在较高结构相似性。当基础指标中总量型指标数值偏高时,说明不停电作业技术渗透率较高,采用该技术的项目成本管控水平较高,项目的安装工程费用占比偏低,设备购置费占比普遍偏高。对该类属项目,建议提高静态投资较高项目的指标权重占比,建立成本管控较为严格的属类结构框架。对衍生指标合理但基础指标数值较高的项目建立成本管控阈值,设立成本警戒线。如条件允许,通过配电网容量需求模拟等系统对该属类开展容量规模测算,将多供电量等衍生指标作为成本管控的下临界值,反推项目建设规模、总投资额及项目费用构成。

(3)考虑两类指标参考性均不明显型项目的数量占比特点,建议加强项目信息搜集管理能力,扩大样本资源库。鉴于样本数量限制,该类属可单独进行项目成本管控,依据基础指标开展衍生指标的评估,判断项目不停电作业技术对成本管控的渗透率及实施效率,发掘项目成本改善措施。

依据以上属类项目造价控制策略,数据标准结构如表4 所示,括号内为数据上下波动幅值。未来可根据项目实际需求及设计阶段指标特征,采用如下典型属类数据框架模板开展项目成本管控方案选取工作。

表4 各属类项目数据标准结构表

考虑以上项目从储备入库到过程实施历时较长,易导致项目实施规模大幅变动,造成资金大量节余或超出概算情况。建议相关部门建立增量型数据库并依据典型聚类案例情况,优化投资计划目标及下达流程,在下达计划之前增加可研复核环节,根据实际情况及相似案例数据调整项目建设规模和设备材料价格,针对性地设计及采用带电作业技术手段辅助减少工程非必要性成本支出,从源头提高该类项目投资管控能力。

4 结语

针对不停电作业技术应用情境下的工程项目造价管控问题,提出适用于该类型项目的综合评价指标体系,并且采用基于“基础+衍生”指标体系GS-FCM 复合聚类模型对既有案例项目开展聚类数目迭代寻优及属类划分动态分析。高效确定项目聚类数目及聚类群落,基于模型出色的运算输出能力,从动态角度对案例项目开展特征倾向及潜在变异趋势研究。最终,基于所得案例聚类结果对各属类项目进行属类特征倾向研究,并针对项目个性及通性特征提出在不停电作业技术应用情境下的造价管控策略,提出项目针对性指标数据标准框架,为后续项目造价管控提供参考性指导。

猜你喜欢
供电量配电网聚类
城市10kV配电网综合评价及目标网架规划
基于K-means聚类的车-地无线通信场强研究
配电网FTU配置优化方法研究
10千伏配电网线损原因与管理策略探析
关于城市10kV配电网自动化实施的探讨
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
县城配网公变防过载损坏分析
基于天然气联合循环电厂的热量—功率—燃气容量分析