我国高分遥感近十年林业应用研究进展

2023-12-12 10:44王本洋周双云徐誉远莫罗坚
湖南生态科学学报 2023年4期
关键词:反演树种光谱

王本洋, 周双云, 徐誉远, 莫罗坚

(1.华南农业大学 林学与风景园林学院,广东 广州 510642;2.华南农业大学 森林经理研究室,广东 广州 510642;3.广东省岭南院勘察设计有限公司,广东 广州 510663;4.广东省东莞市林业科学研究所,广东 东莞 523106)

遥感是高新科技的重要内容之一,是国家科技实力的象征,也是衡量国家综合实力的重要标志[1-3]。自20世纪80年代至今,我国经过40多年的发展,自主研发了气象、资源、环境、高分以及小卫星等多种系列200多颗遥感卫星,现已跻身世界遥感科技的前列。

“高分”系列属于《国家中长期科学和技术发展规划纲要(2006—2020年)》中部署的“高分辨率对地观测系统重大专项”(简称高分专项)[4]。自2013年高分一号成功发射至今,我国高分遥感已经发展了近十年时间。相比于其他卫星遥感,我国“高分”系列卫星的林业应用研究主要集中在哪些细分领域?响应了林业对遥感的哪些需求[5]?主要定量研究方法如何?应用效果如何?目前尚未见述评性报道。

本文基于林业需求,初步总结高分遥感林业应用研究的细分领域,重点介绍较为常用的6种定量分析方法及其应用特点,并对高分遥感的林业应用进行讨论和展望,以期为相关研究者提供借鉴与参考,进一步推动高分遥感在林业中的应用。

1 我国高分遥感在林业中的细分应用领域

在我国,林业是最早引进并广泛应用遥感技术的领域之一[6]。在高分遥感出现之前,林业领域采用的卫星遥感数据主要来自美国的Landsat 5—8[7]、QuickBird[8]、WorldView 1—4[9]、MODIS[10],欧空局Sentinel 1—2[11],法国SPOT 4/5[12]等,在森林火灾监测[13]、病虫害监测[14]、叶面积指数反演[15]、森林蓄积量和生物量估算[16]以及森林树种识别[17]等多个方向都取得了丰富研究成果。

经文献梳理发现,我国高分遥感的林业应用研究主要集中于森林资源调查、森林灾害监测和森林参数提取3个细分领域。其中,森林参数提取进一步细分为森林郁闭度和植被覆盖度估算、叶面积指数计算、森林蓄积量和生物量估算、林分高度提取以及森林类型/树种识别等。这与黄华国[5]基于林业需求提出的林业遥感应用领域相一致。这些细分领域随时间轴即发展阶段不断延伸、深化的关系如图1所示。

图1 高分遥感在林业中的应用发展态势Figure 1 Development trends of Gaofen-series satellite imagery in forestry

1.1 森林参数提取

1.1.1 森林郁闭度和植被覆盖度估算

近年来,遥感林业应用研究的热点之一为不同空间、时间及光谱分辨率支持下的森林郁闭度和植被覆盖度及其变化研究。采用高分遥感进行郁闭度研究的报道较少,且这些研究采用了多光谱数据。

为了高效处理不断增加的大量遥感数据,Chen等[18]采用GF-1数据和实测数据,基于多元线性回归(Multiple Linear Regression,MLR)和Spark算法构建了崂山林场的森林郁闭度模型,发现两种模型精度一致(R2为0.651),采用Spark算法的反演效率更高。Wang等[19]基于GF-1和ZY-3高空间分辨率数据,采用MLR、广义加法模型(Generalized Additive Model,GAM)和随机森林(Random Forest,RF)3个模型估算旺业甸林场和高峰林场的森林郁闭度,发现模型相同情况下,GF-1的估算效果更好;三种模型中GAM模型更稳定。

闫敏等[20]较早采用高分遥感影像开展植被覆盖度变化研究,课题组以Landsat 5 TM、GF-1影像和野外调查数据,构建了大兴安岭根河森林保护区植被覆盖度模型。结果发现,模型精度R2为0.52,还发现植被覆盖度与高程存在较强正相关性(R2大于0.95),与坡度存在较弱正相关性(R2约0.37),与坡向有微弱的负相关性(R2约为-0.02)。Liu等[21]采用GF-2、Landsat 8和实地调查数据,基于机器学习算法估算中国三北防护林的植被覆盖度,发现随机森林模型的精度最优(R2=0.993)。

1.1.2 叶面积指数计算

叶面积指数(LAI)是植被冠层结构最重要生物物理参数之一[22],GF-1数据具有较好的LAI估算能力[23],徐晓雨等[24]利用GF-1和Landsat 8影像数据,反演了河北省康保县荒漠化地区LAI,结果发现,基于GF-1的反演模型具有更大的决定系数,效果优于基于Landsat 8的反演模型。Chen等[25]利用GF-5数据,采用特征选择和机器学习算法反演了长春市的LAI,结果表明,随机森林用于特征选择,K-最邻近用于回归模型反演精度最高(R2=0.834)。

1.1.3 森林蓄积量和生物量估算

汪康宁等[26-27]较早、较系统地开展了基于高分遥感的森林蓄积量研究,先后采用单一尺度(8 m)和多尺度(8 m、16 m、24 m空间分辨率)的GF-1影像作为数据源,结合野外调查数据,构建和分析了黑龙江凉水自然保护区的RF反演模型和不同纹理特征变量下的森林蓄积量。刘兆华等[28]利用GF-2影像数据和内蒙古旺业甸林场的实地调查数据为数据源,评估了MLR、RF、BP神经网络(Back Propagation Artificial Neural Networks,BP-ANN)、支持向量机(Support Vector Machine,SVM)和K—最邻近模型(K-Nearest Neighbor,KNN)5个蓄积量估测模型,发现RF模型精度最高(R2为0.66),MLR模型精度最低(R2为0.47)。

Li等[29]采用GF-2、Sentinel 2数据,基于自适应特征变量优化算法和RF、KNN构建了内蒙古旺业甸实验林场的森林蓄积量模型,发现基于自适应特征变量优化算法和两种数据联合均可提高模型精度(KNN和RF相对均方根误差分别为24.20%和20.82%)。

在森林生物量研究方面,刘常瑜等[30]较早开展了利用高分影像构建森林生物量反演模型的研究。结合野外调查,分别以GF-1(16 m)和Landsat TM(30 m)影像构建的崂山林场森林生物量反演模型表明,基于GF-1的模型精度(80.75%)高于TM(77.12%)[30]。Zhu等[31]基于GF-2、GF-3和无人机遥感数据,采用随机森林构建了广东省淇澳岛红树林保护区的森林生物量模型,模型精度依次为GF-2和GF-3联合(R2=0.43)、GF-2(R2=0.21)、GF-3(R2=0.12)。Li等[32]采用GF-2、Sentinel 2及两者融合数据和实地调查数据,构建了湖南省黄丰桥林场的森林生物量模型,结果发现,基于NND融合算法的GF-2 B3波段和Sentinel 2融合影像(NND_B3)的堆叠泛化方法具有更高的估算精度(R2=0.6985)。

GF-3遥感作为合成孔径雷达遥感,能够获取森林冠层、垂直结构等特征信息,是当前森林生物量估算的重要数据源之一。潘婧靓等[33]利用GF-3全极化数据、Landsat 8 OLI影像数据,结合样地调查数据,采用KNN构建了南宁市高峰林场的生物量模型,结果表明,采用2种遥感因子的模型的精度(R2=0.75)略高于采用单一遥感因子的模型的精度(GF-3的R2=0.47,Landsat 8 OLI的R2=0.42)。

1.1.4 林分高度提取

现有研究多采用激光雷达提取森林树高[34],但由具有超高空间分辨的航空数据或专业星载摄影测量系统获取的立体观测数据也可提取森林的高度信息[35]。因此,GF-2作为具有亚米级空间分辨率的、侧摆能力为±35°的遥感卫星也具有提取森林高度的潜力。倪文俭等[36]利用GF-2(0.8 m)影像数据获取点云数据,并进一步处理得到内蒙古自治区根河市大兴安岭林区的数字表面高程模型、森林高度模型;研究结果表明,GF-2的异轨立体观测数据可较好地记录森林冠层的垂直结构信息,GF-2与激光雷达的像素对像素的线性相关性R2为0.51。

1.1.5 森林类型/树种识别

森林类型/树种的识别研究多基于无人机遥感数据,或者国外遥感数据,如中高空间分辨率的Landsat以及Sentinel等。研究表明,Landsat 8数据对针叶、阔叶树种的识别具有较好效果,但对森林树种的精细分类效果较差[37]。国产高分遥感因其具有较多的地物光谱特征、较高的空间分辨率而在森林类型与树种识别研究中具有自身优势。

当前高分遥感研究中,GF-1高空间分辨率数据是森林类型/树种识别主要数据源。但在识别我国常见的亚热带常绿森林类型时,不仅需要考虑高空间分辨率影像,还要考虑其与光谱信息之间的关系[38]。吕杰等[39-40]较早开展了基于高分遥感的森林类型分类和优势树种分类研究。在黑龙江省凉水国家自然保护区的研究表明,基于GF-1(8 m)和湿地调查数据的森林类型分类精度可达91.68%[39],采用随机森林分类模型得到的优势树种分类总精度最高为81.01%[40]。Li等[41]基于GF-2和森林资源二类调查数据,采用随机森林方法构建了崂山林场的森林类型识别模型;结果发现总体分类精度(83.16%)和Kappa系数(79.86%)均优于支持向量机分类模型。

高精度单木树种识别是基于遥感技术的树种识别研究的热点之一。高空间分辨率影像是单木树种识别主要数据源之一,采用GF-1、GF-2影像进行树种精细分类时精度高于85%[42-43],尹凌宇等[44]基于GF-2数据和森林资源调查数据,采用最大似然法和SVM建立了四川省甘孜州道孚县的树种分类模型;与最大似然法相比,SVM的分类精度为86.75%,提升了5.96%。

高光谱数据具有较高的光谱分辨率(一般在10 nm左右),能识别森林植被的细微差异,为树种精细识别提供了可能。将GF-5高光谱数据与其他高空间分辨率影像融合能充分发挥不同类型遥感影像的优点,提高森林树种识别精度。同时,两种不同数据源协同进行树种识别可提高识别精度[45]。栗旭升等[46]基于GF-5、GF-6、DEM和野外调查数据,采用KNN、SVM、贝叶斯分类、分类回归树和RF等多种方法建立面向对象多源数据分类器自适应的树种识别方法,总体分类精度为87.56%。研究结果表明,具有较好树种识别能力的光谱特征因子主要集中在红光和近红外波段,纹理特征因子主要集中在均值、熵和角二阶矩[46]。

1.2 森林资源调查

我国在第六次国家森林资源清查正式引入遥感技术[47]。目前,在森林资源规划设计调查(二类调查)研究报道中,仅有少数采用了高分遥感,仍主要采用SPOT 5以确定单位边界、地类属性、蓄积量以及其他与森林资源密切相关的生态与环境因素等。

李新平[48]较早将国产高分遥感应用于森林资源调查中,主要是融合GF-2全色和多光谱影像,结合上期调查的矢量化数据,形成新一期野外调查数据。李旋等[49]采用GF-1和地面调查数据,建立了湖南省醴陵市的遥感判读标志,通过目视解译提取森林资源分布情况;结果发现,目视解译的总体精度(93%)高于RF(86%)、SVM(75%)以及最大似然法(58%)等3种自动解译方法的总体精度。

1.3 森林灾害监测

森林灾害监测主要包括火灾监测和病虫害监测。在森林火灾方面,武晋雯等[50]利用GF-1和Himawari-8(H8)数据,构建高斯函数拟合模型,以2017年4月11日11—16时辽宁省丹东市森林火灾为案例,进行了林火密集监测、火烧迹地和森林燃烧受害程度监测研究。Zhang等[51]提出了改进的多时相数据联合空间属性监测算法,并基于该方法和GF-4数据对2020年10月30日黑龙江省的火灾进行监测研究,与MODIS数据相比,基于GF-4数据所得结果的准确率提高了62%。

在病虫害监测方面,Huang等[52]利用GF-1、GF-2数据,基于深度卷积神经网络对辽宁省大西山、铁背山、南天门山等山地森林进行松材线虫病的快速识别,准确率高(94.90%)。Zhan等[53]基于GF-2(1 m和4 m)和Sentienl-2数据,对朝阳市大河北镇的有红松节油甲虫病的树种进行识别,结果发现1 m分辨率的GF-2总体精度最高(77.7%)。

2 我国高分遥感林业应用的主要研究方法

根据现有文献报道,高分遥感林业研究中采用的定量分析方法有近30种,它们服务于不同的研究目的,具体使用方法各有差异。其中,采用多元线性回归分析、随机森林、支持向量机、BP神经网络、像元二分法、面向对象分类法等6种方法(表1)的文献数量和涉及的高分遥感类型的较多,这些方法的适用范围较广、应用效果较好。

研究者往往综合使用多种数据源、多种分析方法。如Li等[29]采用GF-2、Sentinel-2数据基于自适应特征变量优选算法和RF、KNN构建森林蓄积量模型。杨丹等[54]基于GF-1影像,结合U-Net、SegNET、DeepLab V3+等3种深度学习方法进行林分类型研究,并与最大似然法、RF方法比较。基于GF-2数据,刘兆华等[28]采用RF、MLR、BP-ANN、SVM、KNN等5个模型估测蓄积量;肖越等[55]分别采用RF、MLR、KNN、SVM、多层感知等5种模型估算森林蓄积量。基于GF-1和ZY-3数据,Wang等[19]采用MLR、GAM和RF 3个模型反演森林郁闭度。汪红等[56]对比分析了RF、SVM、KNN、贝叶斯分类算法等4种方法的树种识别能力。基于GF-1数据,刘伯涛等[57]分别采用BP-ANN、SVM、RF和MLR估算森林蓄积量。

2.1 多元线性回归

多元线性回归(Multiple Linear Regression,MLR)属于经典多元分析方法,在森林生物量、蓄积量等森林参数定量反演中应用较多。基于GF-1(2 m)影像,张苏等[58]对比分析了多元线性回归和支持向量机两种模型对森林蓄积量的估算能力,结果表明,在采用光谱特征和纹理特征作为特征变量的情况下,多元线性回归模型(R2为0.45)的精度稍低于支持向量机(R2为0.58)。

2.2 随机森林

随机森林(Random Forest,RF)广泛应用于森林资源调查、森林树种识别和森林生物量研究中。随机森林算法是由Breiman[59]提出的一种基于决策树的机器学习算法,在运算量不变的前提下通过多个决策树算法提高模型预测精度,对共线性问题不敏感[60]。随机森林生成决策树的样本是随机选择的,可以很好地避免拟合问题,运算速率和精度都很高,对异常值和噪声有很好的容忍性,对训练数据的适应能力也很强[61]。

基于GF-1 WFV和GF-3 FS-Ⅱ双极化SAR(Synthetic Aperture Radar,SAR)数据,王欢等[62]采用RF法进行湿地分类研究,结果表明在采用GF-1光谱特征和GF-3后向散射系数特征作为特征变量的条件下,湿地分类总体精度为86.23%,优于仅采用GF-1影像光谱特征作为特征变量总体精度。基于GF-2数据,刘兆华等[28]采用RF、MLR、BP-ANN、SVM、KNN等5个模型估测蓄积量;肖越等[55]分别采用RF、MLR、KNN、SVM、多层感知等5种模型估算森林蓄积量,结果表明,RF估算精度最高(74.60%,R2为0.51),其次为SVM模型(69.87%,R2为0.31)和KNN模型(60.46%,R2为0.28),MLR模型与多层感知器模型精度较差,分别为65.01%和63.94%,R2分别为0.06和0.05。基于GF-2和Landsat 8数据,Liu等[21]基于机器学习算法估算中国三北防护林的植被覆盖度,结果发现,RF模型精度(R2=0.993)最优。基于GF-1和ZY-3数据,Wang等[19]采用RF、MLR、GAM等3个模型反演森林郁闭度。基于GF-6和Sentinel 2数据,Yu等[45]采用RF分类器构建了东南地区优势树种识别模型。

2.3 支持向量机

支持向量机(Support Vector Machine,SVM)被广泛用于森林资源调查、森林生物量、森林郁闭度等林业研究中。可用于分类或回归研究。

支持向量机是一种按监督学习方式对像元进行二分类的机器学习方法,其原理是在线性可分时,在原空间寻找两类样本的最优分类超平面;线性不可分时,在线性通过确定适当的核函数将原始数据从低维输入空间变为高维空间,从而在高维空间内求解最优线性分类超平面[63]。

基于不同时间分辨率GF-1影像,徐凯健等[64]提取了不同时间尺度下树种生长阶段的林分冠层光谱归一化植被指数(NDVI),结果表明光谱信息经过微分处理,有效提高了利用逐旬或逐月尺度的时序光谱数据构建的SVM树种识别模型的精度。基于GF-1 WFV和时间序列数据,Xu等[42]采用SVM对内蒙古喀喇沁旗森林进行森林树种识别研究。基于GF-2数据,尹凌宇等[44]采用SVM和最大似然法建立了四川省甘孜州道孚县的树种分类模型;汪红等[56]对比分析了RF、SVM、KNN、贝叶斯分类算法等4种方法的树种识别能力,结果表明,SVM模型总体分类精度(81.68%)低于RF模型(93.35%),高于贝叶斯分类模型(80.05%)和KNN模型(67.75%)。

2.4 BP神经网络

BP神经网络(Back Propagation Artificial Neural Networks,BP-ANN)是一种向后传播的多层前向神经网络,一般由输入层、隐藏层和输出层组成[65],其中输入层接受外部输入数据,输出层为网络输出,采用线性函数作为传递函数连接各神经元[66]。

在林业遥感中,通常将遥感信息作为输入层,通过BP神经网络的计算经由输出层得到期望的输出结果。基于GF-1数据,刘伯涛等[57]分别采用BP-ANN、SVM、RF和MLR估算森林蓄积量,结果表明三种非参数模型的精度均优于MLR模型,依次为RF(0.534)、SVM(0.534)、BP-ANN(0.534)和MLR(0.534);刘赛赛等[67]利用二类调查等数据源,采用BP-ANN和MLR建了新疆布尔津林场落叶松林分的郁闭度模型,决定系数R2分别为0.713和0.692。基于GF-2数据,徐梦伶等[68]采用BP-ANN、偏最小二乘回归和主成分回归模型构建了湖南黄丰桥林场的3种森林生物量模型。

2.5 像元二分法

像元二分法主要用于森林郁闭度的计算。其原理是假定一个像元的光谱信息由两个组分因子的光谱信息线性组合而成,并且传感器所获取的光谱值是每个组分对光谱值的贡献之和,每个组分所占比例即为该组分因子所贡献信息的权重[69-70]。进行森林郁闭度计算时,两个组分因子分别是林冠覆盖部分和非林冠覆盖部分,乔木层林冠覆盖地表部分所贡献的权重即为该像元的森林郁闭度。

基于GF-1的16 m和SPOT 6的6 m空间分辨率影像和内蒙古自治区呼伦贝尔市伊敏露天煤矿周边10 km典型草甸草原的实地调查数据,蔡宗磊等[71]分别采用像元二分法、支持向量机和偏最小二乘法估算植被覆盖度,结果表明支持向量模型的精度在2种影像中均为最高。基于GF-1 WFV 16 m数据,彭继达等[72]提取植被指数作为植被覆盖度指示因子,采用像元二分法建立了厦门市植被覆盖度模型。

2.6 面向对象分类法

面向对象分类法是在影像分割获取对象基础上,利用不同分类模型对遥感影像典型特征进行分类的方法,包括影像分割、建立分类规则和信息提取三部分[3]。面向对象法综合利用了遥感影像的光谱、纹理、空间结构分析,可提高影像分类精度[73],被广泛应用于森林资源监测和森林树种识别等领域。

基于具有红边波段的GF-6数据,王子彦等[74]利用光谱信息、植被指数因子和红边特征,采用面向对象多尺度分割法提取广西鹿寨县的桉树人工林信息,结果表明加入红边波段的分类方案的总体精度为91.75%,提高了11.25%,优于仅采用光谱信息或植被指数的分类方案。

表1 高分遥感在林业应用中的常用研究方法表Table 1 Popular quantitative methods employed in forestry application of Gaofen-series imagery

3 讨 论

回顾我国高分遥感的十年建设发展之路,数据自给率达90%,不仅在我国林业、环保、国土、测绘等行业领域得到广泛应用,在“一带一路”国家和地区也取得了显著应用效果[76]。

高分遥感数据波段多、光谱分辨率高,在多元线性回归分析、随机森林、支持向量机、BP神经网络、像元二分法、面向对象分类法等方法支持下,在森林资源调查、灾害监测、郁闭度和覆盖度估算、蓄积量和生物量估算、叶面积指数计算、森林类型识别和树种识别方面具有一定优势和较大应用潜力。

目前,在林业领域的高分遥感相关研究成果主要来自国内研究者,主要以GF-1和GF-2为数据源,相比于Landsat或Sentinel,文献数量偏少。

3.1 反演精度不高

高分遥感采用传统的参数和非参数模型反演森林参数时的精度较低。与传统遥感反演相比,传统机器学习方法经过多年发展、不断改进,与传统遥感影像更加匹配,而高分遥感反演还在摸索阶段。高分遥感影像自身的特点,如光谱、空间、辐射分辨率等,也决定了在提取光谱波段、植被指数、纹理信息等特征变量时与传统遥感影像有所不同。

3.2 模型发展问题

大量新研究方法被应用到林业遥感研究中,但是在森林蓄积量和生物量等定量反演时存在精度偏低、大尺度反演适用性较差等问题。因此需要发展针对高分遥感影像的方法。如何充分挖掘高分影像特点,改进和发展机器学习算法,以进一步发挥高分遥感影像在上述细分领域中的应用能力,以及提升树种识别等能力,应是未来研究方法发展的一个重点。

4 研究展望

(1)充分挖掘高分影像数据源优势。国产高分在林业研究中的作用越来越重要。基于多源遥感的林业研究可以充分发挥各类遥感影像的优势。相比于常用的Landsat、Sentinel等和SPOT 5、IKONOS、QuickBird、WorldView等,我国高分遥感在空间和光谱分辨率上具有一定优势,并且GF-5具有更高光谱分辨率,填补了高光谱遥感在星载方面的空缺。应进一步探索高分遥感与其他遥感数据的协同处理方法,充分挖掘高分遥感数据的可用光谱信息,提取与森林类型/树种、蓄积量/生物量、叶面积指数等森林参数有关的光谱特征,植被指数特征以及纹理信息等多种遥感特征,深入研究森林结构参数在高分遥感中的反射机制,研究具有物理意义和机理基础的机理模型在森林参数的可用性,明确各机理模型在森林参数反演与树种识别等方面的精度和适用范围。

(2)构建不同数据源间回归模型。长时间序列研究是未来热点之一。可开展“高分”系列数据自身可比性及其与其他传统遥感数据源可比性的研究。GF-1、GF-2、GF-4、GF-6遥感均为多光谱遥感,但在辐射分辨率、光谱波段范围和信噪比特性等方面存在差异。因此,在植被指数等定量反演结果间也存在一定差异。可通过定量研究建立它们彼此之间的回归模型,定量刻画数量关系,以增强数据的可比性。Roy等[77]已建立Landsat数据间的回归模型。进一步地,可建立高分遥感系列与包括Landsat在内的其他遥感数据的关系模型,以更好地参与长时间序列有关研究。

(3)丰富针对性算法。伴随着遥感技术在林业中的应用不断向纵深发展(图1),3S技术、物联网和模型逐渐成为森林监测和数据分析的常规手段,而新兴的对地观测技术包括高分辨传感器、无人机和近地观测,尤其是激光雷达,有望成为解决森林监测中一些困难问题和加强森林生态监测的有力手段[78]。充分挖掘高分影像特点,改进和发展机器学习算法,发展针对高分遥感影像的数据分析方法,以进一步发挥高分遥感影像在上述细分领域中的应用能力。

猜你喜欢
反演树种光谱
基于三维Saab变换的高光谱图像压缩方法
反演对称变换在解决平面几何问题中的应用
常绿树种在新疆的应用现状
基于低频软约束的叠前AVA稀疏层反演
基于自适应遗传算法的CSAMT一维反演
城市绿化树种选择,只顾眼前你就输了
一个树种的国家战略
星载近红外高光谱CO2遥感进展
珍贵树种红豆树生态位测定
叠前同步反演在港中油田的应用