基于随机森林的GF-6 WFV 和Landsat8 OLI遥感影像分类比较

2022-09-01 15:09牛全福傅键恺马亚娜
地理空间信息 2022年8期
关键词:灌木波段林地

牛全福,傅键恺,陆 铭,马亚娜,张 曼

(1. 兰州理工大学土木工程学院,甘肃 兰州 730050;2. 甘肃省应急测绘工程研究中心,甘肃 兰州 730050)

土地覆盖是人们依据土地的特性,对土地进行间段性的管理和经营。同时土地覆盖也是全球变化的热点问题之一[1]。遥感数据则因其具有大范围、时效性强和成本低的优势成为土地覆盖获取的主要数据源。如何精确地获知土地覆盖的情况,这就应该在中高分辨率遥感影像的支持下,对土地覆盖的变化情况进行高效、准确、及时的管理[2-10]。本研究以山西省浑源县为研究对象,运用随机森林分类方法对GF-6 WFV与Landsat8 OLI 影像数据进行土地覆盖分类,并对分类结果进行对比分析。

1 研究区概况及数据预处理

1.1 研究区概况

浑源县隶属于山西省大同市,地理坐标为113.72°~113.92°E,39.67°~39.83°N,气候类型为中温带大陆性季风气候,距离大同市中心约82 km。研究区域内主要土地覆盖类型包括耕地、林地、草地和灌木、裸地、水域、矿区、城镇与农村用地7 种土地类型。由于中部地区的居民地分布比较分散,对比较不同分辨率影像中零碎分布地物的分类效果较为明显。

(研究区位置如图1所示。)

图1 研究区位置(审图号为GS(2019)3333号)

1.2 遥感数据及预处理

本研究所选用的GF-6 WFV和Landsat8 OLI2种卫星的实验数据源信息见表1,波段信息对比见表2。

表1 数据源信息

表2 GF-6和Landsat8 2种卫星的波段信息的对比

GF-6 WFV和Landsat8 OLI数据预处理在ENVI5.3平台上完成。Landsat8 OLI 的预处理包括辐射定标、大气校正、影像拼接和裁剪,GF-6 WFV 的预处理流程有辐射定标、大气校正、辐射校正、几何校正、影像裁剪,其中几何精校正用到的辅助数据为30 m 的DEM数据和Landsat8 OLI的全色波段,GF-6 WFV影像的绝对定标系数从中国资源卫星应用中心(http://www.cresda.com/CN/Downloads/dbcs/)获取,Landsat8 OLI和GF-6 WFV 大气校正选用FLAASH 大气校正模块下的MODTRAN 辐射传输模型,GF-6 WFV 影像的光谱响应波谱使用从中国资源卫星应用中心下载的光谱响应数据制作。

2 随机森林分类方法

当前遥感影像分类应用到的方法主要有监督分类、非监督分类、CART 决策树分类、面向对象的分类等,本研究选择随机森林分类法执行土地利用分类。随机森林是由Breiman 引出的一种基于决策树组合的方法,是在样本空间、特征空间同时进行的集成学习算法。随机森林中的每一颗决策树依赖于一个由训练确定的参数组成的随机向量,每棵树通过Bagging 算法形成独立分布的训练样本集,并利用这些训练样本集进行训练,同时在特征集中选择部分特征进行决策树的构造。在当前的算法里,随机森林具有以下优点:①随机性的选择训练样本和分裂属性,使得随机森林对噪声数据不太敏感,且不轻易导致过拟合问题;②随机森林的参数少且设置简单,只有森林规模大小和每次节点分裂时所选属性个数2 个参数;③随机森林算法可以有效解决样本中的类不平衡问题,并且特别适用于一些常规机器学习算法难以处理的高维小样本数据,对于分类数据存在缺失值的情况也有较好的结果[13]。

随机森林算法实现步骤如下:

步骤1:在每一个循环t=1,…,T,执行步骤2和步骤3。

步骤2:从训练样本集中通过Bagging算法得到新的训练样本集。

步骤3:对新的训练样本集,得到相应的新分类模型ht。其生长过程如下:在树的每个内部节点处从D个特征中随机挑选m个特征作为候选特征(m<D),按照节点不纯度最小的原则从这m个候选特征中选择一个最优特征对节点进行分裂生长。让每一颗分类数充分生长到每个叶子节点的不纯度达到最小,并不对树进行剪枝。

3 典型样本分析

3.1 典型样本的选取与检验

结合其他数据资料与遥感影像地物特征,在本区域遥感影像上分别对耕地、林地、草地和灌木、裸地、水域、矿区、城镇与农村用地7 种地类的样本进行了选取。选取的训练样本应具有代表性、全局性。本研究选择的训练样本中耕地87 个、林地68 个、草地和灌木76 个、裸地64 个、水域20 个、矿区69 个、城镇与农村用地69个。

选取的训练区样本通过样本可分离度来检验各地类之间的可分性,分离度取值范围通常为0~2。当分离度为1.9~2.0时,说明各样本之间可分性好,属于合格样本;当分离度为1.0~1.9时,各样本之间的分离效果中等;当分离度小于1.0 时,则需将两类样本进行合并。本研究区Landsat8 OLI 和GF-6 WFV 遥感影像各样本间的可分离度值如表3、4所示。

表3 Landsat8 OLI遥感影像中各地物类别的可分离度

表4 GF-6 WFV遥感影像中各地物类别的可分离度

由表3、4可知:GF-6 WFV对耕地、林地、草地和灌木的可分性都高于同期影像Landsat8 OLI,除了城镇与农村用地和矿区间的样本可分离度小于1.7 以外,其余地类之间的样本可分离度较高。

3.2 各地物基本光谱分析

3.2.1 GF-6 WFV与Landsat8 OLI对应波谱分析

由图2 可知,GF-6 WFV 红光传感器的光敏范围(620~700 nm)比Landsat8 OLl(630~680 nm)大,GF-6 WFV 红光传感器光敏范围进入了680~700 nm,而Landsat8 OLI 没有进入这一区域,该范围处于对植被反应敏感的红边区域,同时红边也是植被的反射率在近红外波段接近与红光波段交界处快速变化的区域,再加上GF-6 WFV 新增的2 个红边波段(GF-6 WFV B5 光敏范围为680~730 nm,GF-6 WFV B6 光敏范围为720~780 nm),使得GF-6 WFV 对耕地、林地、草地和灌木的反射率更加敏感。

图2 波普响应函数

3.2.2 GF-6 WFV与Landsat8 OLI各地物光谱分析

分析GF-6 WFV 与Landsat8 OLI 影像各地类光谱曲线(图3、4)可知:

图3 GF-6 WFV各地物光谱特征曲线图

相同之处:①7 种地物的光谱均值在蓝(B)、绿(G)、红(R)波段差异不大,其中矿区和城镇与农村用地亮度值重叠度较高;②除了水域外,其他6种地类的亮度均值在红(R)波段后均呈上升趋势,其中耕地、林地、草地和灌木的光谱均值上升最明显;③7 种地类在近红外(NIR)波段上的光谱均值差别明显、可分性较高。

图4 Landsat8 OLI 各地物光谱特征曲线图

不同之处:GF-6 WFV 在近红外(NIR)波段和红边1(RE1)波段之间,耕地、林地、草地和灌木的亮度值下降较快,其中耕地的亮度均值下降幅度最大,在红边1(RE1)波段处耕地的亮度均值下降到最低;在红边1(RE1)波段和红边2(RE2)波段之间,除了水域外,其他地物的亮度均值都呈现上升趋势,其中耕地的亮度均值上升幅度最明显,其次是林地、草地和灌木;在红边2(RE2)波段处,耕地的亮度均值达到最高,林地次之,光谱差异仅次于近红外(NIR)波段;在紫(P)波段以及黄(Y)波段中,7 种地物的亮度均值变化趋势相同,差异不明显。Landsat8 OLI在热红外1(SWIR1)波段和热红外2(SWIR2)波段处,除了水域外,其他地类的光谱均值变化差异较小,可分性较低。

综合可知,各地物在GF-6 WFV 和Landsat8 OLI的近红外波段处都可以区分出来,而GF-6 WFV新增了2 个红边波段,在耕地、林地、草地和灌木这3 种地物的可分性方面GF-6 WFV要优于Landsat8 OLI。

4 分类结果评价

4.1 分类结果及各地类面积占比差异分析

根据随机森林分类方法及原理,对浑源县Landsat8 OLI 遥感影像和GF-6 WFV 遥感影像以及缺少红边波段的GF-6 WFV影像数据进行分类,并对浑源县原始影像分类后的各地类面积占比进行统计,结果如图5、表5所示。

图5 分类结果

表5 主要地类面积占比

从表5 可以看出,GF-6 WFV 分类出来的耕地面积占比(22.85%)高于Landsat8 OLI(18.23%),据统计2019 年浑源县的耕地覆盖率为21.92%,因此GF-6 WFV对耕地的分类更接近于真实值。从分类后的结果(图5)来看,林地主要分布于浑源县中南部和中西部,矿区主要以中部的青瓷窑、大瓷窑煤矿为主,耕地几乎都分布在中部,比较集中,由于研究区水域较少,分类结果面积占比最小。根据目视解译和实地考察后的结果可知:浑源县中南部和中西部、中东部大部分为恒山林场,少量为草地和灌木以及部分矿区;再结合分类结果图可知,Landsat8 OLI 错将少部分林地分为草地和灌木,因此GF-6 WFV 在耕地、林地、草地与灌木的分类结果上要优于Landsat8 OLI,主要是由于GF-6 WFV 新增了对作物比较敏感的2 个红边波段,使得GF-6 WFV对于耕地、林地、草地和灌木的可分性更加明显。GF-6 WFV 分类出来的城镇与农村用地、矿区和裸地面积占比都比Landsat8 OLI 更加真实,说明在纹理特征明显、地类零碎分布的区域GF-6 WFV的分类效果优于Landsat8 OLI。

4.2 GF-6 WFV和Landsat8 OLI分类精度评价

基于ENVI5.3 软件随机产生抽样点,通过实地验证方法,结合2019 年浑源县的Google earth 影像对选取的抽样点进行地物类型确定。在研究区中随机抽样了283个点,其中耕地62个,林地57个,草地和灌木51个,裸地35个,水域16个,矿区38个,城镇与建筑用地24个,通过混淆矩阵和Kappa系数得的精度评价结果,如表6所示。

表6 Landsat8 OLI和GF-6 WFV土地利用分类评价

由表6可知GF-6 WFV的总体分类精度为91.11%,比Landsat8 OLI的总体分类精度(87.87%)高3.24%;GF-6 WFV 的Kappa 系 数为0.89,比Landsat8 OLI 的kappa 系数(0.85)高0.04。两者的Kappa 系数都大于0.8,说明分类效果比较理想,数据可靠性较高。GF-6 WFV 卫星对于耕地、林地、草地和灌木、裸地、水域、矿区、城镇与农村建用地的分类精度都高于Landsat8 OLI 卫星。由于GF-6 WFV 新增了对作物比较敏感的2 个红边波段,使得GF-6 WFV 对于耕地、林地、草地和灌木的分类精度要高于Landsat8 OLI 卫星;GF-6 WFV 卫星的分辨率比Landsat8 OLI高,混合像元少,所以GF-6 WFV 对于裸地、水域、矿区、城镇与农村用地这些地物类型破碎、细节与纹理特征明显的区域,分类效果更好。综合所知,高空间分辨率的国产GF-6 WFV遥感影像在土地利用分类中体现出了一定的优势,具有较好的分类效果。

5 结 语

本研究利用同一地区同期GF-6 WFV和Landsat8-OLI 遥感数据,基于随机森林分类法,对比典型样本光谱差异、类别可分性、分类结果及分类精度差异,得出以下结论:①在两幅影像的蓝、绿、红、近红外波段处典型地物光谱趋势一致性良好,各地物在近红外波段区分最明显。在耕地、林地、草地和灌木可分离性方面,GF-6 WFV高于Landsat8 OLI,其他的地物类型可分离性较为接近;②国产GF-6 WFV在土地利用分类中的分类效果要优于同时期影像Landsat8 OLI 的分类效果。GF-6 WFV 分类结果则更加接近于真实值,尤其是对耕地、林地、草地和灌木效果较好,这也体现了高分六号卫星新增的2 个红边波段对农业、林业的监测能力。GF-6 WFV 具有较高分辨率优势,对零碎分布的地物分类结果好于

Landsat8 OLI。

该研究也有不足之处:由于林地中阴影的存在,可能会把阴影错分为林地,需在后续研究中利用DEM、纹理特征、多时相数据进行后处理,进一步提高分类精度。同时本文对于土地利用类型分配的原因以及土地利用类型的变化趋势没有进行研究,有待下一步深入研究。

猜你喜欢
灌木波段林地
最佳波段组合的典型地物信息提取
灌木丛
图片新闻
基于PLL的Ku波段频率源设计与测试
明水县林地资源现状及动态变化浅析
内蒙古灌木植物多样性及其区系分析
浅谈明水县林地资源动态变化状况
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术
与世隔绝的人世