基于高光谱分析的长荡湖水质监测技术研究

2022-08-27 07:34蒋志昊梁文广石一凡王冬梅唐大伟宋亚君
江苏水利 2022年8期
关键词:悬浮物浊度反射率

蒋志昊,梁文广,石一凡,王冬梅,唐大伟,宋亚君

(1.江苏省水利科学研究院,江苏南京 210000;2.江苏省水文水资源勘测局常州分局,江苏常州 213300)

1 研究背景

目前,利用卫星遥感反演水质参数和人工实测这2 种常规监测方法为主要的湖泊水质监测手段。常规的水质监测技术耗时耗力,投入产出比低,难以覆盖区域范围内所有地点水质数据,不能满足多样化的监测需求。当前,多光谱遥感技术具有时态多、范围广的动态监测优势,广泛应用于水体参数的反演研究中,但光谱波段少、光谱分辨率较低[1],影响水质参数反演精度。高光谱技术具有光谱波段多和连续等优势,海量的光谱信息可反映真实水表光谱信息,是常规水质监测和遥感水质监测的重要补充,为区域性水环境监测提供新的技术手段。曹引等[2]基于南四湖实测的高光谱数据和同步水质采样分析数据构建了反演南四湖水体叶绿素a浓度的多种数学模型;巩彩兰等[3]利用地物光谱测量及同步配套水质采样分析实验,对黄浦江全河段水体进行调查研究,并以TN 和悬浮物为例得出最佳反射率反演组合;包起帆等[4]利用星地同步监测实验,建立长江口含沙量浓度高光谱反演模型;吴廷宽等[5]以贵阳市百花湖为例,对水体进行光谱实测,探讨湖泊水质高光谱反射率与水质参数浓度之间的定量关系,对湖泊富营养化进行监测评价。由上述研究成果可知,不同湖泊之间的下垫面条件有所差别,反演模型普适性较差,对典型湖泊光谱特性和水质参数之间定量关系需单独分析。

根据常州水环境监测中心2008—2018 年水质监测成果,长荡湖整体水质基本处于劣Ⅴ类。考虑到长荡湖在西太湖流域中的重要过水作用和对周边水系的影响,提高长荡湖水质监测精度水平,实现全湖泊、多时段常态化管理,对改善水环境、实行长效化管理意义重大。因此,本研究以常州市长荡湖为研究对象,依照《地表水和污水监测技术规范》进行水质采样,获取采样点的水质参数,利用高光谱扫描仪提取对应点位水表光谱信息。通过水质参数与高光谱的相关性分析,分析比较不同水质指标的光谱,筛选出对光谱反射率敏感的水质参数,建立可见光至近红外波长范围内多种水质参数-高光谱反演模型,并验证分析模型精度和适用性,确定适用于长荡湖的水质高光谱监测模型。

2 材料与方法

2.1 研究区概况

长荡湖(31°33′~31°40′N,119°30′~119°37′E)位于江苏省常州市境内,地处亚热带季风气候带,湖泊南北长13.6 km,东西宽9.3 km,现有水域面积约84 km2,平均水深1.1~1.2 m。现状湖盆地形平坦,无显著起伏,北半部湖盆水稍深,南半部水浅,多沼泽性芦苇浅滩,淤积严重。

2.2 水质采样及处理

为保证实验效果,要求采样当日天气晴朗,湖泊水体流速不宜过高,以提供较为稳定的实验环境。研究区域选定后,在湖泊的进出水区、中心敞水区、滨岸带等各类型典型区域设置一定数量的采样点,于2020 年5 月4 日利用YSI 公司水质多参数分析仪和实验室水质采样化验分析的方式,获取水温、DO、ORP、电导率、透明度、NH3-N、NO3-N、TP、TN、CODcr、CODMn、悬浮物SS、浊度、Chl-a 和pH 等15 项水质参数。本次采样共设20 个点位,取水表0.5 m表层水,点位具体分布情况见表1。

表1 长荡湖布设点分布

通过传感器现场测量以及实验室内水样测定,长荡湖5月水质统计结果如表2所示。结果显示调研区域内各水质参数具有显著空间差异。根据国家《地表水环境质量标准》(GB3838—2001)和现场采样实验室分析结果,当日长荡湖CODMn、COD 全湖平均达到Ⅱ类水体水质标准,南部水质劣于北部,大部分达到Ⅲ类标准。TP、TN 质量浓度均低于Ⅴ类地表水标准,湖泊水质为劣Ⅴ类,溧阳市域内围网养殖严重,湖泊富营养化程度严重。

表2 长荡湖水质参数统计结果

2.3 现场水体高光谱数据

高光谱采集与水质参数测量同步进行,根据布设点位的序号对各点依次进行测量。本次实验使用的是美国ASD 公司生产的FieldSpec®4 Std-Res野外便携式高光谱仪,波长范围350~2 500nm,能够捕获可见和近红外光谱。在350~1 000 nm范围内,光谱采样间隔为1.4 nm,光谱分辨率为3 nm,而在1 000~2 500 nm 范围内,光谱采样间隔为2 nm,光谱分辨率为10nm。获取的原始数据经过数据筛选,反射率计算和异常值剔除处理后,与水质参数进行拟合分析。

2.4 光谱参数及相关性分析

将经实验室检测15 种水质参数和经预处理的光谱反射率进行相关性分析。分别采样单波段[6-7](Single Band,SB)、波段差值[8](Difference of Band,DB)和波段比值(Ratio of Band,RB)[9-11](式1~2),比较350~1 000 nm 波长范围内光谱反射率和各参数间的相关关系,筛选出对光谱敏感的水质参数。式中:BD和BR分别为波段差值和波段比值;Ri和Rj为对应i和j波段的光谱反射率。

2.5 模型构建

利用检测到的建模样本,使用各种算法建立光谱数据与通过传统方法检测的属性值之间的线性或非线性回归模型。本次研究根据光谱相关性分析结果,参照水质参数与光谱反射率之间关系所得规律选择最优波段组合,分别建立指数、线性、多项式、幂函数和对数模型。

2.6 模型验证

从所有采样样本中随机选取2/3的样本用于构建数学模型,其他1/3 的样本用来检验模型拟合精度。选择相关性最高的数学模型进行水质反演,并采用F检验法对模型显著性进行验证,模型的精度评价指标为绝对误差(Absloute Error,AE)、均方根误差(Root Mean Squared Error,RMSE)、相对误差(Relative Error,RE)和平均相对误差(Mean Relative Error,MRE)来表示进行评价。通过R2、RSE、Std.Res(残差标准差)将验证组样本真实值与模型模拟值进行对比,模型的评价标准为R2越高,且RMSE、RE以及MRE越低,则表示模型的拟合效果越好。实测值与模拟值散点越接近1∶1 线,代表反演的精度越高,最终确定反演效果最佳的模型。

3 结果与分析

3.1 水体光谱特征

本次实测光谱曲线在810nm 开始下降,而由于水分子在近红外波段对光有强吸收作用,波长大于1 000 nm 以后反射率迅速下降并接近于0,所以选择350~1 000 nm 波长范围进行样本分析。本次实验最终选取的20 个采样点光谱处理结果如图1 所示。根据光谱实测结果,长荡湖水体在可见光范围内共有3个反射峰值区,分别集中于550 nm、700 nm和800 nm 波长附近,分别对应可见光绿光、红光波长。其中,在550 nm 处的反射率对应最高峰值,在700 nm附近出现2个强吸收带,反射率陡降,800 nm波长以外的反射率逐渐下降。

图1 长荡湖采样点光谱反射率响应曲线

2.2 水质参数与高光谱波段相关性分析

将2020 年5 月4 日同步获取的上述15 项水质参数和实测光谱数据进行Pearson相关分析,获取水质参数相关系数最佳的波段或波段组合反射率值(表3)。单波段相关性分析优点在于模型构建简单且直观,能排除波段自相关影响,并且具有丰富的先验知识和理论基础作为支撑;双波段相关性分析可以一定程度上消除测量时代入人的噪声、测量环境变化带来的误差和大气的影响,达到信息增强与压缩的目的,以利于更好建立水表反射率与水质参数化验指标之间的关系。本文分别采用波段差值和比值的方法进行相关性分析。

表3 长荡湖水质参数与350~1 000 nm范围内光谱反射率相关性分析

根据最优波段相关性表,双波段组合与光谱反射率之间的相关关系整体优于单波段,其中波段比值与水温之间具有最高的相关性,R=0.96;波段差值对悬浮物SS、电导率、水温、浊度相关性最强,R=0.94;单波段对悬浮物SS 具有最高的相关性,在波长为816 nm处取得,R=0.84。

将各种波段组合下最优相关性大于0.7的水质参数看作光谱反射率的敏感参数,进行建模分析和对比验证,最终选取TP、悬浮物SS、浊度、水温和透明度等5 项参数。图2~6 为上述5 种参数分别与单波段、波段差值、波段比值任意组合的相关关系分布图。5 种参数均在近红外波段的波长处与反射率具有较好的相关性,TP、悬浮物SS、浊度、水温和透明度在单波段的最大相关系数分别为0.815、0.84、0.78、0.74、-0.74。图2~6 为上述5 项参数与350~1 000 nm 波长范围内,3 种波段反射率组合的相关性分布图。单波段光谱反射率相关性最高的波段集中位于近红外波段附近,900 nm之后伴随强水汽吸收带,相关性迅速减弱。波段差值组合的相关性分布图具有一致的特征规律,双波段在均位于500 nm 波长范围内的组合与各参数相关性较弱,对应反射率曲线为Chl-a 和黄色物质的强烈吸收带,此区间各波段反射率较低。500 nm以上时相关性较为显著,且波长差在200 nm 以内,波段反射率差值与参数相关性较强,这与颗粒悬浮物的散射作用有关。波段相除组合具有相似的特征,但是当波长超过930 nm后相关性突然下降。

图2 TP与光谱反射率相关性分析

图3 悬浮物SS与光谱反射率相关性分析

图4 浊度与光谱反射率相关性分析

图5 水温与光谱反射率相关性分析

图6 透明度与光谱反射率相关性分析

2.3 模型构建

经验模型[12-15]是通过对观测对象表层光谱特性和水质参数同步实测,并进行适当的统计分析得到水质参数的估测算法。本次实验以单波段、波段差值、波段比值为自变量,分别利用指数函数、线性函数、多项式函数、幂函数和对数函数对长荡湖TP、悬浮物SS、浊度、水温和透明度这5 项参数进行模拟(表4~8)。

表4 长荡湖水体TP高光谱拟合模型

利用单波段、波段差值和波段比值组合,利用多种数学模型,建立光谱反射率和TP质量浓度之间的定量关系。结果显示,比值模型整体相关性最优,各类函数拟合均保持R2>0.8,其中将864 nm 和914 nm处的反射率比值作为自变量,建立的一元二次多项式方程模拟的TP 质量浓度具有最高的相关性,R2为0.833,并且通过F检验。

利用单波段、波段差值和波段比值组合,结合多种数学模型,建立光谱反射率和悬浮物SS之间的定量关系。结果显示,用波段差值和波段比值进行拟合均能取得较好的效果,其中将928 nm和964 nm处的反射率比值作为自变量,建立的一元二次多项式方程模拟的悬浮物质量浓度具有最高的相关性,R2为0.926,并且通过F检验。

利用单波段、波段差值和波段比值组合,利用多种数学模型,建立光谱反射率和浊度之间的定量关系。结果显示,单波段反射率与浊度在可见光范围内虽然有较好的相关性,但不适宜用本文提供的经验模型法进行拟合。双波段进行拟合的效果明显优于单波段,并且以909 nm 和923 nm 处的反射率差值作为自变量,建立的线性方程模拟的水体浊度具有最高的相关性,R2为0.922。

利用单波段、波段差值和波段比值组合,利用多种数学模型,建立光谱反射率和水温之间的定量关系。结果显示,双波段模拟效果明显优于单波段,将779 nm 和740 nm 处的反射率比值作为自变量,建立的线性方程和多相式方程模拟的pH 值相关性最高,R2均为0.941,并且通过F检验。考虑到线性方程式模型更加简易,最终选择线性模型作为反演模型。

表5 长荡湖水体悬浮物SS高光谱拟合模型

表6 长荡湖水体浊度高光谱拟合模型

利用单波段、波段差值和波段比值组合,利用多种数学模型,建立光谱反射率和透明度之间的定量关系。结果显示,利用差值组合拟合的效果最佳,其中将971 nm 和930 nm 处的反射率差值作为自变量,建立的指数方程模拟的透明度具有最高的相关性,R2为0.959,并且通过F检验。

对上述5种参数最佳波段组合下的最优模型进行整体评价,除TP 的拟合采用的是波段比值,悬浮物、浊度、水温和透明度均宜采用波段差值的组合。对透明度模拟的R值最高,对水温进行模拟后MRE取得最小值(表9)。

表9 高光谱拟合模型整体评价

2.4 模型评价

根据最优半经验模型预测值与TP、悬浮物SS、浊度、水温和透明度实测值的对比,根据本文模型预测的长荡湖TP、浊度、透明度均与实测值高度吻合。TPR2=0.97,RES=0.005,std.Res=0.015;透明度R2=0.97,RES=0.069,std.Res=1.204;透明度R2=0.9,RES=-0.971,std.Res=3.69。预测值与实测值均匀分布在X=Y线的两侧且紧邻分布。水温和悬浮物SS的模拟相关性弱于上述3 项,但R2均大于0.74。整体而言,本文建立模型对长荡湖TP、悬浮物、浊度、水温和透明度的预测均取得较好的效果。图7为拟合效果对比图。

图7 长荡湖参数反演模型精度评价

3 结论与讨论

本文根据实测长荡湖的光谱特征,利用同步获取20个点位的15项常规水质参数。通过光谱反射率和水质参数相关性分析,筛选出TP、悬浮物SS、浊度、水温和透明度等5项相关性强的水质参数,建立适用于长荡湖的多种水质-高光谱反演模型,并进行模型验证和适用性分析等,得出以下结论:

(1)根据2021年5月对长荡湖15项水质特征参数的采样结果分析,当日长荡湖CODMn、COD全湖平均达到Ⅱ类水体水质标准,南部水质劣于北部,大都达到Ⅲ类标准。TP、TN 质量浓度均低于Ⅴ类地表水标准,湖泊水质为劣Ⅴ类。受溧阳市域内大量围网养殖的影响,全湖各位置悬浮物SS、浊度、Chl-a 和透明度差异较大,南部湖泊富营养化程度严重。

表7 长荡湖水体水温高光谱拟合模型

表8 长荡湖水体透明度高光谱拟合模型

(2)根据光谱实测结果,长荡湖水体在可见光范围内共有3 个反射峰值区,分别集中于550 nm、700 nm 和800 nm 波长附近,分别对应可见光绿光、红光波长。其中,在550 nm处的反射率对应最高峰值,在700 nm附近出现2个强吸收带,反射率陡降,800 nm波长以外的反射率逐渐下降。

(3)在实测水表光谱的基础上,分别利用单波段、双波段差值、双波段比值3 种组合方式与15 项水质参数进行相关性分析。结果显示,双波段普遍比单波段具有更强相关性。单波段则受限于单边自变量,相关性在给定波长内表现出正负性。TP、悬浮物SS、浊度、水温和透明度在不同波段反射率组合条件下Rmax均大于0.7,表现出较强相关性,对光辐射敏感性较高。受自身作用机制和被其他水质参数掩盖特征的影响,另外10种水质参数辐射特性表现不太显著。

(4)基于半经验模型,分别利用指数、线性、多项式、幂函数和对数函数,筛选出最优波段组合下的最佳反演模型。结果显示,多项式模型对TP、悬浮物SS和透明度的反演效果最佳,相关系数平方分别达到R2864/914=0.92,R2928-964=0.93,R2971-930=0.96。浊度和水温更适合用线性函数反演,两者反演的相关系数平方分别为R2909-923=0.92,R2779-740=0.94。将上述模型带入检验集中进行精度验证,均表现出于真实值相近的结果。TP 预测值和真实值之间R2=0.97,RES=0.005;悬浮物SSR2=0.74,RES=1.014;浊度R2=0.9,RES=0.971;水温R2=0.80,RES=0.144;透明度R2=0.97,RES=0.069。

(5)高光谱技术在湖泊水质参数研究中发挥重要作用,利用实测光谱和水质参数建立的数学模型有利于提高遥感反演精度,为实际应用和推广建立理论依据。同时,长荡湖内构筑物分布复杂,具有饮用水源地、水上景观、餐饮船聚集点和围网养殖等多种功能区。现已在全湖开展退圩还湖工作,高精度高光谱反演模型结合卫星遥感可有效监测工程实施过程中全湖水质改善状况,并对各功能区的分配决策给出指导性意见。

猜你喜欢
悬浮物浊度反射率
悬浮物对水质氨氮测定的影响
利用镜质组反射率鉴定兰炭与煤粉互混样的方法解析
高浊度水处理参数优化研究分析
商品条码印制质量检测参数
——缺陷度的算法研究
车灯反射腔真空镀铝反射率研究
丙烯酰胺强化混凝去除黑河原水浊度的研究
燃煤电厂湿法脱硫废水悬浮物和Cl4-浓度控制优化
《中国药典》四部通则澄清度检查法中可能存在问题的探讨*
水体悬浮物的危害及其监测方法
青草沙水库浊度与悬浮颗粒物粒径的分布特征