1975–2018 年呼伦湖湖泊边界数据集

2024-01-11 10:40李昕悦李佳鑫马荣华王贞
关键词:呼伦湖湖泊水域

李昕悦,李佳鑫,马荣华,王贞

1.南京信息工程大学,遥感与测绘工程学院,南京 210044

2.中国科学院南京地理与湖泊研究所,湖泊与环境国家重点实验室,南京 210008

3.中国科学院大学,北京 100049

4.国家地球系统科学数据中心,湖泊—流域科学数据中心,南京 210008

5.草原生态安全省部共建协同创新中心,呼和浩特 010021

引 言

呼伦湖(116°58′–117°47′E,48°40′–49°20N)位于内蒙古自治区呼伦贝尔盟满洲里市南郊[1],是内蒙古第一大湖[2]。呼伦湖具有调节气候、涵养水源、防止荒漠化、维持生物多样性等多种功能,是我国北方生态安全屏障的重要组成部分[3]。呼伦湖流域是以保护草原生态、湿地系统和珍贵濒危鸟类为主的我国东北部大型综合自然保护区,在呼伦贝尔的生态保护和经济发展中发挥着不可代替的重要作用[4]。呼伦湖流域具有明显的大陆性气候特征,但也是南北冷暖气流交汇的区域,因此对全球气候变化极为敏感[5]。

受人类活动以及气候变化的影响,近年来呼伦湖及其流域发生显著变化[6],生态环境发生改变,如蓝藻水华暴发加剧、湖泊水生生物多样性减少等[7]。水面面积是湖泊的重要特征参数,水面面积缩小导致湖周湿地萎缩,破坏鱼类、鸟类栖息地、威胁湖泊生态安全[3]。因此,监测呼伦湖水体边界的长期变化对生态环境保护和经济可持续发展具有重要意义。

随着卫星技术飞速发展,遥感影像广泛应用于水体边界的提取和研究时空尺度。利用遥感影像提取水体的研究方法主要有模型分类法、分类器法、自动水体提取法等[8]。这些方法在部分区域已取得较高水体识别精度,但是线状河流、湖周湿地等水体边界仍需人工目视解译校正。例如,Pekel 等(2016)利用Landsat 卫星提取全球地表水,其中也包括线状河流等小型水体,水体提取存在一定的不确定性[9]。此外,低空间分辨率的卫星数据难以有效地提取小范围的水体信息[10]。孙芳蒂等(2022)利用500 m 分辨率的MODIS 影像提取鄱阳湖水体边界[11],分辨率低于Landsat 影像。另外,也有的水体边界数据集的时间覆盖范围较短,如许芬等(2018)利用高分1 号数据与Landsat 8 OLI 数据提取海南省的陆域水体未包含2010s 之前的数据[12]。

目前,高空间分辨率、高精度的长时序湖泊水体边界公开数据集相对缺乏。部分原因在于长时间序列的遥感研究面临较大数据下载和处理需求。谷歌地球引擎(Google Earth Engine,GEE)拥有巨大的遥感影像数据集以及高性能的计算能力,可以更加方便地处理长时间序列的遥感影像。据此,本研究基于Landsat 系列遥感影像数据,生产1975–2018 年呼伦湖水体边界数据集。通过计算归一化水体指数(Normalized Difference Water Index,NDWI)[13],使用直方图阈值分割算法确定阈值[14],最终经过人工修正,使用同年哨兵2 号影像目视解译结果进行精度验证。本数据集可较好地描述呼伦湖的年度水体变化,为分析和评估水量变化对气候和人类变化的响应提供数据支持和科学依据。

1 数据采集和处理方法

1.1 卫星数据下载和预处理

1975–2018 年6–9 月无云的Landsat MSS/TM/ETM+/OLI(Landsat Multispectral Scanner/ Thematic Mapper/ Enhanced Thematic Mapper Plus/ Operational Land Imager)的Level 2 地表反射率产品用于生产呼伦湖湖泊边界矢量数据集。Landsat 影像数据由美国联邦地质调查局(United States Geological Survey,USGS)提供(https://www.usgs.gov/)[15]。此数据已经针对气体、气溶胶和瑞利散射等大气条件进行了校正,空间分辨率为30 m。影像获取及预处理均在Google Earth Engine 中完成。

1.2 数据处理方法

在水体识别和湖泊监测的研究中广泛采用NDWI 精确度高达98%[16]。由于不同季节性水域面积存在变化情况,选取6–9 月影像,此时呼伦湖水域较为稳定,受植被、雪水等干扰较少[17]。Landsat影像采用公式(1)计算NDWI。

式中,GREEN 为绿波段地表反射率,NIR 为近红外波段地表反射率。分别为Landsat TM/ETM+第二波段和第四波段、Landsat OLI 第三波段和第五波段。运算完成后获得呼伦湖NDWI 栅格影像集。

在数字图像处理中广泛采用大津阈值分割法(OTSU)[18],该算法常用于图像分割。OTSU 算法的核心是直方图阈值分割方法。该方法计算简单,不受图像亮度、对比度影响[18]。OTSU 算法利用NDWI 计算得到的水体和陆地的灰度直方图计算得出最优阈值T,使灰度直方图的类间方差最大化,从而将水体与陆地区分开。如图1 所示。T 表示OTSU 算法得出的最优阈值。

图1 OTSU 双峰阈值分割图Figure 1 Splitting plot of the OTSU Bimodal threshold

使用OTSU 算法自动确定阈值,提取呼伦湖流域水域范围,将其转换为矢量格式数据集。之后,将其与原始Landsat 图像进行叠加分析,对结果进行目视检查与手动校正。利用矢量化调整错误和缺失的点。此外,去除河流和湖泊周围的小湖泊,只保留呼伦湖。选择每年面积最大的边界作为呼伦湖边界。

2 数据样本描述

2.1 数据组成

本数据集包括1975–2018 年每年一期呼伦湖边界矢量数据,其中1978–1982 年、1990 年数据缺失,共38 期的呼伦湖水体边界数据。按照不同的投影坐标将数据分成两部分并以不同的投影坐标命名:Lake Hulun(投影CGCS)、Lake Hulun(投影WGS)。这些数据保存为1 个压缩文件(1975–2018 年呼伦湖水体边界数据集.rar),总数据量为10.8 MB。数据格式为shp。投影坐标系分别为WGS_1984_UTM_Zone_50N 和CGCS2000_3_Degree_GK_CM_117E。地理坐标系为GCS_WGS_1984。

2.2 数据样本

本数据集主要包括湖泊的水体分布以及长时间序列时湖泊变化。以数据集中的1975 年、2012 年、2018 年作为呼伦湖水体分布的样例,其中2012 年呼伦湖的水位相对较低。如图2 所示。

图2 呼伦湖水体空间分布示意图Figure 2 Spatial distribution of water boundaries of Hulun Lake

呼伦湖水体面积时间序列变化如图3 所示。本研究显示呼伦湖水域在过去30 多年里经历了小幅度下降,继而保持稳定,此后又剧烈减小,近年处于逐步上升阶段。1975 年呼伦湖水体面积为2086.29 km2,到1983 年小幅度下降到2009.46 km2,减少了76.83 km2;1984–2000 年,呼伦湖水域面积保持在2100 km2左右;2001–2012 年,呼伦湖水域面积呈缩小趋势,缩小了346.06 km2,主要原因为乌尔逊河、克鲁伦河年径流量降低以及受全球大规模气候变化影响,呼伦湖区域处于高温少雨的干旱期,降水量下降、蒸发量上升[19];2013–2018 年,呼伦湖水体面积增加139.16 km2,主要原因是降水量和河流径流增加,湖水水位逐渐上升[20]。研究结果与赵澍等(2018)的监测结果基本一致[17]。

图3 呼伦湖水体面积时间序列变化示意图Figure 3 Time series changes in the area of Lake Hulun

3 数据质量控制和评估

为验证Landsat 提取的呼伦湖水体边界数据集精度,我们使用哨兵2 号MSI (Multi-Spectral Imager)影像目视解译提取的结果作为参考验证。MSI 图像(空间分辨率10 m)比Landsat 影像具有更高空间分辨率,可更清晰地区分湖周湿地和线状河流。验证年份选择2017 和2018 年(图4)。

图4 水体提取结果验证Figure 4 Result verification of water extraction

将哨兵二号影像的目视解译结果作为真实地表数据进行验证,计算混淆矩阵得到总精度(OA)和Kappa 系数(表1),2017 年总精度99.59%,Kappa 系数0.99;2018 年总精度99.70%,Kappa 系数0.99。此外,将提取结果的面积与目视解译得到的面积做对比(表2),2017 年相差13.97 km2,2018 年相差4.6 km2。发现利用Landsat 影像提取的水体边界数据集提取精度大于99%。Landsat 与Sentinel-2A 的提取结果相比,基于Landsat 卫星影像提取的结果偏小。与原始影像叠加,发现差值主要集中在湖周,尤其是湖口湿地区域。尽管提取结果存在一定偏差,但数据集具有高于99%的精度,仍具有参考价值,并且能够满足用户对数据集精度的要求。

表1 水体提取精度Table 1 Water extraction accuracy

表2 水体面积对比(km2)Table 2 Comparison of water body areas(km2)

4 数据价值

呼伦湖是内蒙古自治区第一大湖,是我国北方生态安全屏障的重要组成部分,是维系呼伦贝尔大草原生态系统的重要水体[3],其水域面积变化对区域气候和周边生态环境变化具有重要影响。受气候变化[21]和人类活动的共同影响,呼伦湖水域面积经历着减少又增加的过程。2001–2012 年呼伦湖水域面积缩小,2013 年以来呼伦湖水域面积逐步回升。

本数据集基于不同时期多源遥感影像数据(1975–2018 年),包含38 期湖泊水体边界矢量数据,时间序列较长,可以为分析评估水量变化、水资源变化、气候变化和湖泊响应之间的关系提供基本数据支持和科学依据。

5 数据使用方法和建议

数据集包含1975–2018 年间每年一期共38 期的呼伦湖水体边界,该数据均为SHAPE FIlE 格式(.Shp),可利用ArcGIS、QGIS 等地理信息系统软件对本数据集进行编辑及以及后续分析工作。

数据作者分工职责

李昕悦(2000—),女,安徽淮南人,硕士,研究方向为湖泊环境遥感。主要承担工作:数据生产,结果验证,论文撰写和修改。

李佳鑫(1998—),女,山西长治人,硕士,研究方向为湖冰遥感监测。主要承担工作:技术指导,论文修改。

马荣华(1972—),男,山东临沂人,博士,研究方向为湖泊环境遥感。主要承担工作:总体思路设计,论文修改。

王贞(1983—),女,河南安阳人,硕士,研究方向为地理信息制图。主要承担工作:论文数据下载及处理、数据编辑。

猜你喜欢
呼伦湖湖泊水域
坐在呼伦湖畔看星星
坐在呼伦湖畔看星星
进博会水域环境保障研究及展望
柳江水域疍民的历史往事
新巴尔虎写意(组诗)
你相信吗?湖泊也可以“生死轮回”
城市水域生态景观设计探讨
“害羞”的湖泊
奇异的湖泊
我国水域将按功能定位分类保护