基于Maxent模型的榆林地区新石器时代遗址预测分布研究

2019-11-14 08:17吴瑞婵甘淑李强强
软件 2019年9期
关键词:榆林地区环境变量考古

吴瑞婵 甘淑 李强强

摘  要: 榆林地區新石器时代遗址丰富,同时在中国历史上占有重要地位,为了更有效的保护和发掘榆林地区的遗址,了解古遗址空间分布的不同规律,探讨研究古人类社会发展与自然环境演变的关系,本研究利用Maxent模型结合ArcGIS软件对榆林地区遗址分布进行预测研究,得出榆林地区潜在的遗址分布概率图,并利用Kvamme增益统计对模型精度进行验证。结果表明:①本次实验Maxent模型的AUC值为0.708,表明模型预测准确度较高;②由刀切图得出不同环境变量对遗址分布影响权重从大到小依次为:dem>离水距>剖面曲率>坡度>坡向;③模型的增益值为0.62,说明模型具有较高的精度。

关键词 榆林地区;考古遗址;环境变量;Maxent模型;遗址预测模型;AUC值;增益统计

中图分类号: TP7    文献标识码 A    DOI:10.3969/j.issn.1003-6970.2019.09.034

本文著录格式:吴瑞婵,甘淑,李强强. 基于Maxent模型的榆林地区新石器时代遗址预测分布研究[J]. 软件,2019,40(9):148-152

Research on Neolithic Site Prediction Distribution in Yulin Area Based on Maxent Model

WU Rui-chan1,2, GAN Shu1, LI Qiang-qiang1

(1. College of Land and Resources EngineeringKunming University of Science and TechnologyKunming 650032, China;2. Institute of Remote Sensing and Digital Earth, Chinese Academy of Science Joint Laboratory of Remote Sensing Archaeology, Beijing 100101)

Abstract Yulin region is rich in site.It occupies an important position in the history of China, in order to protect and excavate the Yulin sites more effectively and understand the spatial distribution of ancient sites. To explore the relationship between the development of ancient human society and the evolution of natural environment, then this research use Maxent model combining ArcGIS software to predict the distribution site in yulin, The distribution probability map of potential sites in yulin region is obtained. and by using the statistical Kvamme gain model accuracy validation. The results show that: (1) the AUC value of Maxent model in this experiment is 0.708, indicating that the prediction accuracy of the model is high; (2) according to the Jackknife map, the weight of the influence of different environment variables on the distribution of the site is as follows: dem > euclidean distance > curvature > slope > aspect;(3) the gain value of the model is 0.62, indicating that the model has high precision.

Key words Yulin region; Site points; Environment variables; Maxent model; Site prediction model; AUC value; Kvammes gain statistics

0  引言

RS和GIS技术的发展为考古发掘工作提供了新的方法和手段[1]。遗址作为古代人类活动留下的遗迹,具有重要的价值。通过研究潜在的遗址分布,有利于加深人们对人地关系的认识,为保护可能存在的遗址提供参考。考古遗址预测模型是一种有助于评估考古遗址存在于景观的不同位置的可能性的工具,是一种结合时间和空间的时空定位方法[2]。它利用数学方法将遗址点和可能与遗址分布有关的环境因素结合起来在模型中进行分析,得出遗址分布可能的规律和特征[3]。遗址预测模型可以追溯到20世纪50、60年代的聚落考古研究,美国考古学家Willey在微鲁河谷所做的区域聚落系统研究[4]。1985年Parker认为遗址预测模型是考古空间分析理论、方法和技术发展到一定阶段的自然产物[4]。90年代后遗址预测模型被广泛应用,如Michael Marker等利用空间数据挖掘技术对伊朗扎格罗斯山脉上的旧石器时代聚落遗址位置进行了预测[5]。近年来遗址预测模型逐渐朝多元化方向发展,如Ido Wachtel利用Logistic模型和Maxent模型预测比较以色列北部加利利和中国东北地区的阜新遗址分布等[6]

国内近年来利用遗址预测模型来研究遗址分布的也越来越多,如倪金生[4]、乔文文[7]和董振[5]等都采用逻辑回归模型分别对山东沭河流域上游文化,岳山文化、郑洛地区龙山文化时期聚落遗址和延边地区渤海国遗址进行研究,尚南[8]采用逻辑回归方法对汾河流域仰韶文化时期至夏商时期的考古遗址进行预测研究。郭飞[9]采用改进随机梯度上升法建立汾河流域龙山文化时期的遗址预测模型。结合GIS技术进行考古已经成为一种趋势,而且遗址分布预测模型的构建对于考古工作的开展具有一定的指导作用,可以避免许多不必要的工作。逻辑回归模型用于预测遗址分布的技术已经相当成熟,而传统的Maxent模型常被用于预测物种适宜性分布,很少用在考古上。鉴于它的操作简单,适用性广泛,稳定性好,所以目前被尝试用于考古研究。所以本研究以榆林地区为例,利用Maxent模型预测遗址分布概率,得出潜在的遗址分布概率图,分析不同环境变量对遗址分布影响的权重,为榆林地区的遗址保护和挖掘提供技术支撑。

1  研究区概况

榆林市位于陕西省北部地区,毛乌素沙地南边缘,北纬36°57′~39°35′,东经107°28′~111°15′之间(如下图1)。地貌大体以长城为界,北部为风沙草滩区,南部为黄土丘陵沟壑区,平均海拔1000至1500米。榆林地区地势由西向东倾斜,河流众多,境内游53条河流汇入黄河。红碱淖是陕西最大的内陆湖。榆林气候属于暖温带和温带半干旱大陆性季风气候,四季分明。作为温带和半干旱交错带的典型代表,榆林地区在片段地理上有其独特的空间分布格局。在生态上具有显著的脆弱生境特征和演化规律。在历史上榆林曾是魏、秦、汉、隋、明五个封建王朝修筑军事防御长城较集中的地方。目前榆林地区已经发掘的著名遗址有神木石峁遗址,秦长城遗址等。这些条件使榆林在历史上战略位置重要,为榆林地区文明的产生与发展奠定了基础。

2  数据来源

榆林地区的行政区划图来源于国家基础地理信息中心,作为底图来使用。本研究所需的数据主要是遗址点数据和与遗址分布相关的环境数据(如下表1)。遗址点主要来源于遗址发掘报告和网站数据,共735处,分布情况如图1。研究所用的环境数据主要有DEM遥感数据[10]、坡度、坡向、剖面曲率和河流水系数据。河流水系数据为USGS上下载所得,在本研究中我们将榆林地区的河流水系图利用ArcGIS中的欧氏距离工具生成了90 m×90 m的栅格图层,计算每个栅格之间的距离和最近的水源。并称之为离水距。各环境变量具体如下图2。DEM数据为地理空间数据云上下载的SRTM90 m分辨率的高程数据,并由高程数据生成坡度、剖面曲率和坡向数据。受气候、水源、地形等自然因素的影响,遗址通常选取在海拔较低,地形平坦,距河流较近且能接受到更多光照的地方[11]。具体来说古代人类定居倾向于选择地势较低、坡度较缓的地方。所以高程数据和坡度數据是分析遗址分布必不可少的要素;古代人类居住地的选择倾向于朝阳方向,以便有充足的光照,所以坡向数据也是必不可少的要素;水对于维持生命是必不可少,古代交通工具缺乏,取水困难,所以距水源的距离是影响遗址分布必不可少的因素。受现有资料的限制,目前的各环境变量并不能准确的反应过去的情况,但仍可认为这些变量对于分析古代遗址点的存在是具有启发的,并且与古代人类定居点的选择有一定的联系[1]

本研究中选用的dem数据、坡度、剖面曲率、坡向和离水距等环境变量均在ArcGIS中进行处理,采用GCS_WGS_1984坐标系,均处理为栅格数据,在实验前对数据进行预处理,包括降噪[13]、拼接、裁剪、配准、矢量转栅格等操作。采用ArcGIS中的空间自相关工具分析变量与遗址分布的相关性,再利用SPSS统计分析软件分析变量之间的相关性,剔除相关性强的变量,结果表明这五个环境变量均不存在相关性,所以均可用于实验研究。

3  模型方法介绍

本研究采用Maxent3.4.1软件构建模型预测遗址分布,得出榆林地区潜在的遗址分布概率图。ArcGIS用于处理数据和统计分析。Maxent模型基于最大熵原理,因此又叫最大熵模型。最大熵原理指导我们在所有合适的分布中选择熵值最大的分布。Maxent模型只需要遗址点和与遗址相关的环境变量即可对遗址分布进行预测。用遗址存在点数据作为限制条件,得出此条件下的最大熵分布[14]。假设离散型随机变量X的概率分布是,则其熵是

在进入模型之前首先对上述数据做相关处理,将遗址点保存为csv格式,将5个环境变量分别做掩膜处理,统一边界、坐标和单元格大小,设置相关参数,最终环境变量均保存为asc格式。本实验设置25%的测试样本,75%的训练样本,最大迭代次数为5000,重复运行15次,选中刀切图选项评价各环境变量的权重,其他设置默认。模型的预测结果利用受试者工作特征曲线(receiver operating characteristic curve,ROC)下的面积(area under curve,AUC)进行检验,AUC的取值范围为[0,1],AUC值不受阈值的影响,是公认的较理想的评价指标[15]。AUC值越高说明预测准确度越高[16]。一般认为AUC值即ROC曲线下的面积在0.5~0.7时模型准确度较低,0.7~0.9时模型准确度较高,>0.9时准确度最高。本次实验得出的AUC均值为0.708,说明Maxent模型预测准确度较高;实验得出的遗址分布预测图为ASCII格式的图层,采用ArcGIS中的转换工具将概率分布图转换为栅格格式,在ArcGIS中进行分析、处理。模型得出榆林地区遗址概率分布图共五副分别为最大值图、中值图、最小值图、均值图和标准差图。本研究选用均值图作为最终结果图。最终得出Maxent模型遗址分布概率图如下图3。此外还得出评价不同环境变量权重的刀切图,如图4所示。

4  模型精度验证

Kvamme是一种通用的评价遗址预测分布软件的指标[17,18]。本研究采用Kvamme增益统计评价模型的精度。表达式为,其中Pa是概率区遗址点数占总遗址的比值,Ps是概率区面积占研究区总面积的比值[7]。Gain值越接近1模型的预测准确度越高。Gain接近0时模型基本没有预测能力,Gain值为负值时具有反向预测能力,预测遗址不存在的概率[7]。采用ArcGIS中重分类的方法对Maxent模型得出的遗址分布概率图进行分类,将概率区等分为低概率区、中概率区和高概率区三类(如图5所示)。计算各概率区增益值(如表2所示)。

5  结果

由重分类结果图可以揭示榆林地区遗址分布的空间规律,北部为高概率区,中部及南部为中概率区,河流水系周围主要为低概率区,与已知的遗址分布状况吻合,且结果表明:①Maxent模型的AUC值为0.708,说明模型具有较高的准确性,②利用Kvamme增益统计评价模型的精度,一般选择高概率区寻找遗址点可以有效的提高挖掘效率,所以采用高概率区的增益值作为评价标准。结果表明高概率区遗址点数量为246处,所占面积为0.12,Gain值为0.65,表明Maxent模型具有较高的准确率。需要说明的是在运行Maxent模型时有19个遗址点缺失环境变量值,所以最终参与模型运行的共有716个遗址点。③实验还根据刀切图得出不同变量对遗址分布影响重要性的大小依次是:dem>离水距>剖面曲率>坡度>坡向。

6  结论

本文利用榆林地区遗址点结合与遗址分布相关的dem、坡度、剖面曲率、坡向和离水距等环境变量,利用Maxent最大熵模型建立榆林地區遗址预测模型,得出榆林地区潜在遗址分布概率图,揭示了榆林地区遗址分布的空间规律。提出了一种不同于传统预测模型的新模型,并对实验结果进行分析,结果表明Maxent模型可以有效地预测遗址存在的概率,分析不同环境变量对遗址分布的影响,同时具有较高的精度。因本文主要使用的是自然环境变量,未使用人为因素变量,模型的精度并不够高,所以下一步可以收集更多与遗址分布相关的自然、人为因素添加到模型中,提高模型精度,为榆林地区遗址保护和挖掘提供更有效的参考,并为其他地区遗址挖掘和保护工作提供技术支撑。

参考文献

[1] 李政委, 苏惠敏, 朱利涛, 等. 陕西省汉至唐时期历史文化遗址空间分布及其影响因素[J]. 陕西师范大学学报: 自然科学版, 2018.

[2] 陈斌, 郑江龙, 勾学荣, 等. 一个时空定位方法[J]. 软件, 2015(2).

[3] 秦臻. 回顾与展望:数学模型方法在考古学中的应用[J]. 华夏考古, 2014(1): 142-149.

[4] 倪金生. 山东沭河上游流域考古遗址预测模型[J]. 地理科学进展, 2009, 28(4): 489-493.

[5] 董振, 金石柱. 基于Logistic回归模型的延边地区渤海国遗址预测研究[J]. 延边大学学报(自然科学版), 2015(2).

[6] Wachtel I, Zidon R, Garti S, et al. Predictive modeling for archaeological site locations: Comparing logistic regression and maximal entropy in north Israel and north-east China[J]. Journal of Archaeological Science, 2018, 92: 28-36.

[7] 喬文文, 毕硕本, 王启富, 等 郑洛地区龙山文化遗址预测模型[J]. 测绘科学, 2013, 38(6): 172-174.

[8] 尚南, 于丽君, 等. 采用逻辑回归的汾河流域遗址分布研究[J]. 测绘科学, 2015, 40(8): 47-52.

  • 郭飞, 于丽君, 聂跃平, 等. 改进随机梯度上升法在遗址预测中的应用[J]. 遥感信息, 2018(4): 49-54.
  • 钱育蓉, 于炯, 英昌甜, 等. 云计算环境下新疆遥感应用数据中心的挑战与机遇[J]. 软件, 2015, 36(4): 58-61.
  • 陈瑞, 李凤全, 王天阳, 等. 长江中游新石器时代遗址规模的分布特征[J]. 地理学报, 2018.
  • 颜明艳. 基于MAXENT模型评估北部湾潮间带中国鲎和圆尾鲎稚鲎的潜在地理分布及种群保育对策[J]. 生态学报, 2018(9).
  • 曹妍, 陈伟, 徐森. 图像去噪方法研究与仿真[J]. 软件, 2015, 36(4): 33-36.
  • Wang Y, Xie B, Wan F, et al. Application of ROC curve analysis in evaluating the performance of alien species' potential distribution models[J]. Biodiversity Science, 2007, 15(4).
  • 孙瑜, 史明昌, 彭欢,  等. 基于MAXENT模型的黑龙江大兴安岭森林雷击火火险预测[J]. 应用生态学报, 2014, 25(4): 1100-1106.
  • 孙瑜, 史明昌, 彭欢, 等. 基于MAXENT模型的黑龙江大兴安岭森林雷击火火险预测[J]. 应用生态学报, 2014, 25(4): 1100-1106.
  • 翁秀木. 一个通用的软件质量评估指标体系[J]. 软件, 2015, 36(3): 59-63.
  • 苏奎, 张彦超, 董默. 一种计算机安全评价系统设计[J]. 软件, 2015, 36(4): 119-122.

猜你喜欢
榆林地区环境变量考古
十大考古发现
考古出乎意料的几件事
三星堆考古解谜
保护林业资源 发展榆林经济
榆林地区植树造林技术研究
榆林地区老年人体育建设的现状与生活方式原则
基于三阶段DEA—Malmquist模型的中国省域城镇化效率测度及其收敛分析
考古与论今