基于回归分析的玉米冠层叶绿素含量高光谱反演分析

2021-09-08 07:45赵占辉张丛志张佳宝吴运金张宏敏鲁春阳
中国农学通报 2021年20期
关键词:诊断模型冠层反射率

赵占辉,张丛志,张佳宝,吴运金,张宏敏,鲁春阳

(1河南城建学院测绘与城市空间信息学院,河南平顶山 467036;2封丘农田生态系统国家试验站/土壤与农业可持续发展国家重点实验室/中国科学院南京土壤研究所,南京 210008;3生态环境部南京环境科学研究所,南京 210042)

0 引言

叶绿素是高等植物和其他所有能进行光合作用的生物体含有的一类绿色色素,其含量高低能够反映植物光合速率的强弱、氮利用效率、生理胁迫和生长状况等信息[1-2]。当前农作物叶绿素含量测定主要采用分光光度法、活体叶绿素仪法和光谱法[3]。分光光度法通过化学方法提取叶片中的叶绿素,以此测定叶片叶绿素含量,测定结果稳定可靠,但提取速度较慢、易损坏植株叶面,容易影响农作物生长。根据工作原理不同,活体叶绿素仪法可分为透射型活体叶绿素仪法和反射型活体叶绿素仪法,通过测定红光(650 nm)与红外光(940 nm)被叶片吸收比率,测量植物的叶绿素相对含量,该方法是一种速测法,测定结果稳定可靠,不会对植被叶片造成破坏[4]。光谱法主要光谱信息技术进行建模分析,建立植物叶片叶绿素含量化学值与光谱数据之间的定量关系,间接获取植物叶片叶绿素含量信息。

由于传统的化学提取方法具有非常大的机械破坏性且不可恢复,其工作量巨大,无法进行大规模实时监测,活体叶绿素仪法虽能大大提高测量工作效率,但依旧受样本数量限制,无法进行大面积的植物叶绿素含量变化实时监测。相反,随着遥感技术快速发展,基于遥感数据的光谱分析法依靠少量样本就能够快速、无损的获取大面积农作物叶绿素含量,对快速监测作物光合作用强弱、生长发育状况等具有重要意义,关于农作物叶绿素含量与光谱关系的研究也已经成为近年来农业领域研究的热点。

无人机搭载的高光谱仪具有光谱分辨率高、波段多、波段连续性强等优点,且能够快速获取纳米级的光谱信息,利用该技术能直接对植被冠层微弱光谱进行定量分析,在农作物长势监测方面表现出强大的优势[2,5-6]。因此,根据作物冠层的光谱反射率与叶绿素含量建立反演模型,快速获取空间尺度作物叶绿素含量分布特征,对评估作物光合作用强弱、生长发育状况具有重要意义。早在20世纪Hinzman等[7]学者就已经提出利用作物冠层反射光谱监测作物叶绿素含量具有可行性,随后,国内外学者[8-10]先后在实验室利用高光谱数据对植物叶片叶绿素含量进行了估算,基本实现了作物叶片无损监测与叶绿素分布可视化。梁爽等[5]、郑涛等[9]也通过筛选敏感波段,建立了叶绿素诊断模型,验证了作物叶片叶绿素含量与光谱特征具有密切关系。肖武等[11]研究还发现玉米冠层叶绿素含量对红边波段的响应同样敏感,以此为基础建立叶绿素含量遥感反演模型,并应用于土地损毁监测与评价,估测精度达到了83.4%。

目前,由于所获取的影像数据波段数量较少、光谱信息有限,而且光谱诊断波段及参数的范围较窄,导致作物叶绿素含量高光谱反演模型估测精度普遍低于85%,难以满足当前数字农业的需求,有待进一步深入研究更高精度的作物冠层高光谱估测模型。为此,本研究以中国科学院封丘农业生态实验站长期定位氮肥梯度试验田为研究对象,研究了玉米冠层光谱反射率与作物叶绿素含量之间的关系,建立了基于高光谱反射率的玉米冠层叶绿素含量反演模型,并对模型精度、可靠性进行了验证分析,以期为推进高光谱遥感技术在农业中的应用提供数据支撑。

1 材料与方法

1.1 研究区概况

试验区位于河南省封丘县(35°01'N,114°24'E),在中国科学院封丘农田生态系统国家试验站内进行,该试验站地处黄淮海平原,属于半干旱半湿润季风气候,多年平均降雨量为615 mm,且60%~90%分布在6—10月,年平均气温为13.9℃。定位试验自2008 年一直延续至今,夏玉米品种为‘郑单958’,共设7个氮肥水平:0、30、70、110、150、190、240 kg(N)hm2/a,磷肥按氮肥施入量的40%施入,不施钾肥,玉米季磷肥作为基肥一次施入,氮肥肥分别在苗期、灌浆期各施入40%、60%。每个处理设置3次重复,共计21个小区,每个小区面积约28 m2,试验当天在每个小区采集3 个样本,共计63个样本,其中前2次重复小区中42个样本数据设为数据集Ⅰ,用于模型校正,第3次重复小区中21个样本数据设为数据集Ⅱ,用于模型验证(如图1)。

图1 基于高光谱数据合成的实验区真彩色影像图

1.2 数据获取与处理方法

无人机搭载的传感器为Resonon PIKA L 高光谱成像仪,PIKA L 采用非凝视成像原理,拍摄方式为线扫式,光谱范围为400~1000 nm,波段数200,光谱分辨率3 nm。无人机飞行高80 m,设定航速1 m/s。传感器镜头焦距17 mm,视场角17.6°,镜头垂直向下,地面分辨率5 cm,航拍面积0.25 km2覆盖整个研究区。

本研究以小型系统性试验田为研究靶区,获取的高光谱影像的预处理流程如下:(1)由于原始影像数据为信号DN值,无单位,需要通过辐射定标文件将原始影像转换为辐射率图像,本研究利用Spectronon Pro软件将高光谱影像辐射亮度转换成反射率数据;(2)在Spectronon Pro软件中根据飞行高度、视场角等参数信息对高光谱影像进行粗校正;(3)基于差分GPS(Trimble GeoXH,美国天宝公司)获得的地面靶标点坐标数据,利用ArcGIS 10.3软件对高光谱影像进行手动精几何校正;(4)最后,在Spectronon Pro软件中对获得的影像进行拼接,利用ENVI 5.1软件裁切生成研究区高光谱影像。

根据叶绿素地面测量对应的样点位置构建感兴趣区域(region of interest,ROI),采集该样点玉米叶片的光谱反射率,得到各样点的反射率光谱数据。

1.3 玉米叶片SPAD值测量

为同步、快速、无损获得玉米叶片叶绿素含量,采用JN-4N型叶绿素测定仪,测得叶片SPAD值。JN-4N型手持叶绿素仪2 个LED 光源发射2 种光,一种是红光(峰波长650 nm),一种是红外线(940 nm),2 种光穿透叶片,打到接收器上,光信号转换成模拟信号,模拟信号被放大器放大,由模拟/数字转换器转换成数字信号,数字信号被微处理器处理后计算出SPAD 值。本研究在每个小区选取3个样点,63个样点,同步测得玉米叶片SPAD值。每个样点的玉米选择3片叶子测量,每片叶子不同部位测3个SPAD值,取平均值作为该片叶子的SPAD值,并记录样点位置。

1.4 反演模型构建与检验

过去研究发现,反射光谱在可见光及中远红外区域是诊断作物叶片叶绿素含量的敏感波段,叶绿素作物叶片的重要赋色成分,其含量高低对反射光谱产生一定影响[9,12-13],研究区不同叶绿素含量的光谱反射曲线形态特征基本一致(图2)。在可见光波段400~650 nm 范围内光谱曲线呈先上升后下降趋势,650~760 nm范围呈先下降后快速上升趋势,具有明显的反射峰和吸收谷;在近红波段(760~900 nm)范围趋于上升趋势,且不同叶绿素含量的光谱反射率较为容易区分。由于原始光谱数据是离散的数据,本研究采用如下公式对光谱仪采集原始光谱数据进行一阶微分计算[14]。选取夏玉米叶片光谱“三边”特征的参数、反射峰与吸收带位置、植被光谱指数等17个前人构建的高光谱特征参数(表1);以光谱特征参数为自变量利用回归法建立叶绿素含量的估算模型[12,15]。将试验获得的数据集Ⅰ用于模型校正,数据集Ⅱ用于模型验证。通过对比各模型的建模决定系数R2、极值(Max、Min)、极差(Range)、变异系数(Coefficient of Variation)、平均绝对误差率(Mean Absolute Percentage Error,MAPE)和残差均方根(Root Mean Squared Residual,RMSR)筛选出最优模型用以研究区春小麦的叶绿素含量的反演。R2用以估测模型的稳定程度,越接近于1 说明模型的稳定性越好,最大值(Max)、最小值(Min)、极差(Range)和变异系数(Coefficient of Variation,C.V.)能反映不同诊断模型对空间变异性的表达能力,平均绝对误差率(Mean Absolute Percentage Error,MAPE)和残差均方根(Root Mean Squared Residual)则从另一角度表征诊断模型的估测结果与“真值”的拟合程度,其计算公式如式(1)~(2)所示。

表1 反射光谱特征参数

式中,xi为采样调查法土壤有机碳密度测定值,xi为土壤有机碳密度估测值,n为样本数量。

本研究利用ENVI 5.1 软件进行光谱数据读取与波段运算,在SPSS 22.0 软件中进行模型构建与检验,采用ArcGIS 10.3软件制图。

2 结果与分析

2.1 不同SPAD值的玉米冠层叶片反射光谱特征

从高光谱影像中提取SPAD测样点位置的平均反射光谱特征曲线,得到玉米叶片反射光谱对7 种不同SPAD 值水平的响应,并在玉米地临近地块获取裸地的平均反射光谱特征曲线(图2)。总体上,不同施氮水平下叶片光谱曲线形状相似,可见光区域(400~700 nm)植物冠层的光谱反射率均较低,其光谱曲线存在一个反射峰和一个吸收谷,即550 nm左右区域的绿光与690 nm左右区域的红光,该波长范围内玉米叶片SPAD高值区的光谱反射率低于SPAD低值区。与可见光区域相比,近红外区域光谱反射率大幅上升,特别是在690~750 nm之间的光谱反射率急剧上升,形成植被光谱的最重要特征——红边。不同SPAD值的玉米冠层叶片在750~900 nm之间的光谱反射率差异显著,高量施氮处理冠层叶片光谱反射率显著高于低量施氮处理。裸地光谱曲线随波长增加均匀增加,符合该地物的典型特征,说明本文获取的高光谱数据具有一定的可靠性。

图2 玉米与裸地光谱特征曲线

2.2 玉米冠层叶片SPAD值诊断模型构建及精度分析

本研究分别将数据集Ⅰ中42个训练样本SPAD(R)值进行了Log(R)、Log(1/R)、1/R、SQRT(R)、SQRT(1/R)5种数学变换,将17个光谱参数根据其特性划分为4组,分别为反射曲线“三边”斜率及其位置、叶绿素的反射峰与吸收带位置、反射曲线“三边”面积、光谱指数与叶绿素含量相关的植被指数。为了简化模型参数,在建模前对各参数进行筛选,筛选出与SPAD值或其变换值关系紧密的的光谱参数作为诊断模型备选参数,具体为:根据相关系数大小,筛选出各组参数中与SPAD值变换前后相关性最大且达到显著水平的备选参数,分别为λr、Rg、SDb和NDVI。备选光谱参数λr、Rg、SDb、NDVI与SPAD变换前后值相关系数变化范围分别为:-0.89~0.79、-0.91~0.90、-0.84~0.84、-0.88~0.89,由Pearson相关矩阵图(图3)可以看出,变换前后的SPAD值变换后与备选光谱参数相关性系数均大于同组其他参数。因此,本研究中将变换前后的APAD 值作为因变量、备选光谱参数作为自变量,做进一步诊断模型建模分析。

图3 玉米冠层SPAD值变换前后与光谱参数Pearson相关性分析矩阵图

将变换前后的SPAD值与光谱参数回归分析结果显示(表2),备选光谱参数与变换前后的SPAD值拟合程度均达到了显著性水平,视为该分析结果具有参考价值。Rg与变换前后的SPAD值回归方程的R2最大,变化范围为0.79~0.83,光谱参数SDb与NDVI的回归方程次之,变化范围分别为0.69~0.71、0.74~0.80,λr的R2最小,变化范围为0.15~0.19。分析结果还显示,与SPAD值相比,数学变换后的SPAD值与光谱参数回归分析的R2值呈下降趋势,MAPE值呈显著上升趋势,RMSR值无明显变化。由此可见,通过一元回归分析所建立的诊断模型预测能力随参数变化而呈现显著差异,最高可解释因变量83%,最低不足20%,对SPAD进行数学变换并不能提升诊断模型预测能力,反而增加了预测结果误差。因此,未进行数学变换的SPAD值与备选光谱参数所建立的一元回归方程可认为是本研究中的精度较高的一类预测模型,本文将该预测模型统称为“一元诊断模型”。

表2 玉米冠层SPAD值变换前后与光谱参数单变量线性回归分析

为了进一步提升诊断模型预测能力,基于上述分析结果,本文将SPAD值作为因变量、4 个备选光谱参数作为自变量,采用逐步回归方法做多变量回归分析,以回归分析方程的R2值最接近1 为原则,最终得出基于多变量的SPAD值最优预测模型,结果如表3 所示,诊断模型的R2值为0.93,MAPE、RMSR值分别为0.13、0.26。可见,与“一元诊断模型”相比,该模型的预测精度得到显著提升,预测结果误差也未出现明显增加。因此,本文将基于光谱参数λr、Rg、SDb、NDVI的多元回归方程作为最优预测模型,并将该预测模型定义为“多元诊断模型”。

2.3 玉米叶片SPAD值高光谱影像反演及精度

为了检验诊断模型预测能力,本文利用数据集Ⅱ中的21个样本数据验证“一元诊断模型”和“多元诊断模型”的精度。基于“一元诊断模型”SPAD预测值与实测值的回归分析结果如图4 所示,拟合方程R2分别为0.6183、0.7345、0.2867、0.8945。尽管基于光谱参数NDVI的“一元诊断模型”的预测值与实测值达到较高的决定系数,但存在偏离1:1 等值线问题,从此说明“一元诊断模型”存在预测结果整体偏移现象,其预测极值能力依旧较弱。同理,图5 为基于“多元诊断模型”预测结果与SPAD实测值的回归分析结果,由此可以看出,该模型所预测的结果与实测值决定系数较高,R2为0.9285,拟合直线接近于1:1 等值线,由此证明该诊断模型对极值的预测能力较强。因此,基于光谱参数λr、Rg、SDb、NDVI的“多元诊断模型”为本研究所获取的最优SPAD值预测模型,估测结果准确性较高。

图4 基于“一元诊断模型”SPAD预测值与实测值的关系

图5 基于“多元诊断模型”SPAD预测值与实测值的关系

表3“多元诊断模型”精度分析

综合上述分析结果,利用ENVI+IDL 软件平台,使用“多元诊断模型”(表3)对试验区高光谱影像进行填图(图6)。结果显示,不同施肥处理SPAD值差异十分显著,能清晰反映不同地块SPAD值差异,影像上高值区呈条带状分布。这是由于玉米正值拔节期,部分地块玉米叶片不能完全覆盖地面,从而导致玉米行间存在裸露土壤,诊断模型仅对玉米冠层叶片SPAD值估测有效,玉米间空隙区域因而SPAD估测值较低,故而玉米行间颜色多为红、黄色图斑,表示该区域SPAD较低。在高量施氮处理(F7)地块,由于氮肥充足,玉米枝叶比较繁茂,完全覆盖行间土壤,因而影像中条带状特征图斑消失。玉米试验田临近裸地区域多为红、黄色图斑,仅存在少量蓝色图斑,这是由于裸地区域存在少量杂草,其叶片中的叶绿素引起预测模型响应,该结果也间接证明了该多元诊断模型对植物叶片叶绿素具有一定的敏感性。

图6 基于多元诊断模型玉米冠层叶片SPAD值反演图

3 结论

本研究以中国科学院封丘农业生态实验站长期定位试验的夏玉米为研究靶区,利用42 个玉米冠层SPAD值为训练样本,采用回归分析方法,对高光谱反射率数据进行反演分析。得出以下结论。

(1)对选定的17 个光谱参数涵盖了400~900 nm波段范围内光谱反射率曲线特征、曲线面积及植被指数等信息,采用相关性分析方法,从同一类型光谱参数中遴选与数学变换前后SPAD值关系最紧密的参数作为建模参数。光谱参数λr、Rg、SDb、NDVI分别与SPAD原始值具有较高的决定系数,分别为0.19、0.83、0.71、0.80,所构建的“多元诊断模型”在预测精度、结果稳定性等方面均得到明显提升,在高光谱或多光谱遥感监测方面具有一定的应用潜力。

(2)本文采用的参数筛选与回归分析建模方法获取了精度较高的玉米冠层叶绿素含量高光谱预测模型,并通过独立样本对预测模型精度进行验证分析,其预测精度与可靠性较前人研究具有一定的提升。本研究论证了回归分析建模方法在高光谱遥感在作物冠层叶绿素含量估测分析的可行性,“多元诊断模型”的决定系数高达0.93,同时揭示了光谱参数λr、Rg、SDb、NDVI能够较全面的反演作物冠层叶绿素空间分布特征。

4 讨论

玉米拔节期是整个生育期的关键时期,该时期植株茎叶生长快速快,光合作用强度大,叶绿素作为重要光合色素,其含量高低可直接决定植株光合效率并进一步影响光合产量[16]。过去学者研究认为,通过监测植株叶绿素含量变化能诊断出该时期作物生长健康状况,已经成为制定农田管理措施的重要参考依据[17]。研究还表明,叶绿素含量高低对可见光波段的光谱反射率具有重要影响,其显著差异主要表现在500~600 nm波段上,叶绿素能吸收大部分的红光和紫光但反射绿光[18]。基于叶绿素对特定波长光谱吸收和反射等特性的认识,国内外已经开展了大量关于作物叶绿素光谱学诊断研究,如Coste 等[19]利用650 nm 和940 nm 处的透射光的相对比值来计算叶绿素含量指标。汤旭光等[20]基于可见、近红外反射光谱反射率估算了作物叶片叶绿素含量,并建立了反演模型。本研究借助长期定位梯度施肥试验平台,构建出夏玉米冠层叶片SPAD值梯度变化特征,玉米拔节期冠层光谱反射率变化表现为:在可见光区域呈现先增加后降低,最后快速上升,在400~725 nm 波段范围内SPAD值越高对光谱吸收能力越强,呈低反射率特征,相反,725~900 nm近红外波段SPAD值越高光谱反射率越高。这些光谱特征与植物叶片叶绿素的特征密切相关,叶绿素是一种能吸收光能含脂的色素物质,将吸收的红光和蓝紫光能量转换成化学能,而不能吸收绿光光能,因而SPAD值越高光谱反射率越低,在550 nm 左右波段呈现反射峰[21]。由于色素和纤维素在近红外波段的吸收较低,光线在叶片细胞结构经过多次散射致使接近50%的光线被反射,当植株营养状况较好时叶片内叶绿素含量高、细胞层较多、叶肉与细胞间空隙较厚能进一步增加光谱反射率,最终表现为SPAD值越高,725~900 nm波段光谱反射率越高[22]。根据上述光谱特征能清晰区分不同SPAD值对应光谱特征曲线(图2),为进一步构建玉米冠层叶片SPAD值诊断模型提供了可靠的数据基础。

以光谱特征曲线为依据,本研究将“三边”特征参数与植被指数作为构建诊断模型的候选参数,采用微分光谱的方法,对原始光谱做一阶微分,用来表征“三边”极值、位置、面积等特征信息。微分光谱具有与SPAD值相关性高、独立于土壤背景及减弱或消除测量误差干扰等优点,如茹克亚·萨吾提等[23]对原始光谱的数据进行微分预处理后,通过0.01水平显著性检验的波段数量明显增加,并且指数微分处理能够增加叶绿素估算精度。袁杰等[24]研究也认为一阶微分光谱数值可以较好的反演作物生长信息和叶绿素密度等信息。本研究以长期定位试验田为研究靶区,为简化模型参数,有效消除同类型参数同时参数模型构建所带来的数据冗余,将获取的微分光谱数值和植被指数等17个光谱参数根据其特性划分为四类。采用相关性分析方法,根据光谱参数与叶绿素值相关系数大小遴选的4个构建诊断模型的光谱参数,首先将单个光谱参数与数学变换前后的SPAD值构建一元回归预测方程,与已有研究结果不同[23],本研究发现数学变换后的SPAD值与光谱参数间的拟合度并未得到明显提高。因此,将SPAD原始数值与λr、Rg、SDb、NDVI的回归方程作为优选的“一元诊断模型”,并进一步构建“多元诊断模型”。通过对比决定系数R2大小,“一元诊断模型”预测能力低于“多元诊断模型”,验证样本对这两种模型验证结果更进一步印证了“多元诊断模型”的可靠性,其预测结果与实测结果决定系数R2达到0.9285,拟合直线斜率为1.0132。与前人研究结果相比,本研究中构建的“多元诊断模型”预测精度得到明显提升,因此,本研究推荐基于光谱参数λr、Rg、SDb、NDVI的“多元诊断模型”为SPAD值最优高光谱诊断模型。

本研究利用高光谱400~900 nm 波段诊断玉米冠层SPAD值变化,其结果与前人研究具有一致性,但该诊断模型决定系数有一定提高,光谱参数数量更少,模型结构更加简单[12-13]。“多元诊断模型”包含的光谱参数综合考虑了光谱反射曲线特征、曲线面积及植被指数等信息,能够完整反映整个光谱波段范围(400~900 nm)内高光谱信息,并有效规避了因同类型光谱参数携带类似信息所造成的数据冗余,提高模型诊断能力的同时简化了模型参数,在高光谱或多光谱遥感监测中具有一定的应用潜力。然而,由于验证样品数量有限,本研究所建立的SPAD高光谱诊断模型可靠性及普适性仍需进一步验证。

猜你喜欢
诊断模型冠层反射率
影响Mini LED板油墨层反射率的因素
近岸水体异源遥感反射率产品的融合方法研究
基于低空遥感的果树冠层信息提取方法研究
具有颜色恒常性的光谱反射率重建
基于激光雷达的树形靶标冠层叶面积探测模型研究
安徽省淮南森林冠层辐射传输过程的特征
CD4细胞计数联合IGRA预测AIDS/Ⅲ型TB影像诊断模型分析
化学腐蚀硅表面结构反射率影响因素的研究*
施氮水平对冬小麦冠层氨挥发的影响
对于电站锅炉燃烧经济性诊断模型的研究