基于网络问政平台的城市问题挖掘与对策研究

2021-11-02 12:53刘贵文袁媛韩青叶
中国房地产·综合版 2021年9期
关键词:文本挖掘空间分布城市建设

刘贵文 袁媛 韩青叶

摘要:基于人民网“地方领导留言板”上21个城市在城市建设领域的海量公众留言,采用LDA(Latent Dirichlet Allocation)主題模型、情感分析算法进行文本挖掘。研究发现:热点主题留言量整体呈逐年上升趋势,其中以房产开发主题的关注度最高;在情感倾向方面,公众表现为消极情感色彩,物业管理主题的负面留言量占比最高,从空间角度来看,不同城市居民对于不同主题表现出的情感态度存在较大差异。据此,结合城市建设过程中存在的问题,提出了相关对策建议。

关键词:城市建设;网络问政;文本挖掘;空间分布

中图分类号:F293 文献标识码:A

文章编号:1001-9138-(2021)09-0044-52 收稿日期:2021-08-16

作者简介:刘贵文,重庆大学管理科学与房地产学院教授。

袁媛,重庆大学管理科学与房地产学院硕士研究生。

韩青叶,重庆大学管理科学与房地产学院弘深青年教师。

基金项目:中央高校基本科研项目NO.2020CDJSK03PT23。

伴随我国新型城镇化的发展,城市人口规模不断扩大,常住人口城镇化率不断提高。与此同时,人与人、人与自然、精神与物质等方面之间的关系出现失衡,不同社会群体间利益格局分化导致矛盾激增,城市公共事务日趋复杂,经济、社会、环境等层面的城市问题逐步深化,对于现代化城市建设产生了制约,阻碍城市的高质量发展。城市建设是贯彻落实新发展理念、推动城市高质量发展的重要载体,因此,对城市建设领域进行重点分析,从公众的角度探寻城市发展过程中存在的问题,作为政府制定政策和实施行动计划的依据,有助于增强居民的获得感与价值感,提高城市承载能力和内生动力,走出一条内涵集约式发展的新路。

随着互联网使用率的逐步上升、政府职能的精简以及公民意识的觉醒,实现基于网络数据的科学决策,进而提升城市治理能力和政府服务水平引起了广泛关注。近年来,国内外学者对网络数据及文本挖掘技术的研究成果较为丰富,在城市建设研究领域,主要应用于城市空间设计、形象与品质改善等。陈映雪等采用新浪微博的签到数据,将文本分析法与空间分析法结合,着眼于城市空间结构、土地使用、场所分布与居民活动的互塑关系研究。龚言浩等以微博数据为基础,通过文本挖掘等方法,对“一带一路”倡议的空间格局进行了分析。Munawir等基于谷歌地图上的用户评论,使用文本挖掘分析和总结在线评论文本,确定游客对万隆市主题公园的看法和评价,旨在探讨主题公园在万隆市发展地方品牌的有效性。而纵观研究尺度,大都集中于单一城市。谢永俊等基于北京市的微博签到数据,采用空间聚类和文本分析挖掘城市的热点区域和主题,进而深度挖掘市民对北京市的总体意象。Wang等通过自动文本分析,对北京市的上访案件进行了分析,旨在总结和探讨北京市民普遍关注的问题。彭晓等通过提取海南省三亚市市民服务热线数据,利用高频词分布和相关性网络分析在城市公共管理中的主要问题。

综上,尽管现有研究取得了丰硕成果,但总体上仍存在不足。第一,城市是一个涵盖经济、环境和社会的复杂系统,城市建设也涉及多个层面,是不同要素有机结合的综合体,而大多数学者聚焦于城市建设的特定主题或偶发事件,忽视城市不同层面的关系,对城市建设缺乏系统的实证分析。第二,城市的地理特性、资源禀赋有所差异,但现有研究多集中于单一城市,较少开展多个城市的比较研究。因此,本文基于人民网“地方领导留言板”的公众留言,对城市建设状况进行总体分析,旨在通过挖掘热点主题及公众情感,识别不同城市在建设过程中存在的问题,作为政府进行城市治理、政策参考的重要依据。

1 研究数据与方法

1.1 数据来源与筛选

研究数据来自全国性网络问政平台人民网“地方领导留言板”的网民留言记录,该问政平台2006年试运行,2008年功能升级后正式运行,信息覆盖面广,遍布城建、教育、医疗、文娱等领域。相较于各地政府自设的公众留言平台,人民网的“地方领导留言板”由中央媒体管辖,具有真实保留历史数据、完整公开原始信息等优势,是系统研究公众意见及其价值取向的重要文本资料,也为相关的学术研究提供了不可多得的数据来源。

通过Python代码语言,爬取了从2014年1月1日至2020年9月30日各省会城市的市委书记及市长接受的所有留言记录。因政府网站对于爬虫技术存在一定的限制,故将留言量爬取不足的城市进行剔除,最终选取长春、沈阳、石家庄、哈尔滨、上海、重庆、昆明、福州、呼和浩特、乌鲁木齐、贵阳、济南、广州、银川、南昌、西宁、南京、长沙、杭州、海口、拉萨21个城市作为研究对象。以领域中的“城建”作为关键词对留言进行筛选,得到29013条留言记录。

1.2 研究方法

目前国内外对于大数据与政治学相结合的研究已经十分成熟,研究主题通常为公共政策、政治传播、社会运动等。面对海量的政务数据,文本挖掘的方法多种多样,包含自动文本分析、社会网络分析、可视化和空间分析等。

对于获取到的文本数据,首先进行数据清洗及预处理,包括删除重复性留言、去除停用词、文本分词等步骤,使用Python环境中的模块“jieba”库进行分词处理,之后对数据进行人工调整以确保分词的准确性。留言文本内容为城建领域相关的词语,故在采用哈工大停用词表的基础上,扩充了城市建设、城市规划、城市管理等相关自定义词,达到精确化分词的目的。自动文本分析是利用计算机对非结构化文本数据进行机器学习分析和挖掘的一系列技术,本研究采用自动文本分析方法下的LDA主题模型和情感分析算法进行文本挖掘。LDA模型是一种无监督机器学习的文本挖掘方法,通过判断文本数据库中的高频词来判断该文档库中所包含的主题。在此,设计4个研究主题,每个主题有8个主题词,根据主题词对主题内涵进行人工标记,得到城市建设领域的研究热点;情感分析是对不同主题的意见、情绪和态度进行检测、提取和分类的任务,采用机器学习算法对公众留言进行情感得分,根据每条留言的得分值进行归类,进而分析公众留言的情感倾向和强度。

2 研究结果与分析

2.1 热点分析

2.1.1 主题总体描述

经过预处理操作,去除243条不完整及重复性留言,最终保留有效留言28770条。对留言文本进行分词、词频统计等步骤后,绘制了图1所示的词云图。显然,在城市建设领域,公众最关心的主体为“开发商”和“物业”,这也是与市民日常居住息息相关的事情。由词云图中的字号大小可得,被频繁提及的关键词有“拆迁”“规划”“施工”“违建”等。公众在城建领域的关注点多以民生问题为主,聚焦市民自身的根本利益。

在词云图可视化体现的基础上,采用LDA主题模型进行主题分类,选取讨论热度最高的4类主题展开研究。结果显示,房产开发、城市规划、拆迁改造、物业管理是社会公众关注的热点。

如表1所示,房产开发主题留言数最多,占所有留言数的比例为35.14%。房地产开发是城市建设规划的有机组成部分,对国民经济及城市的发展起着不可估量的作用。从具体留言内容来看,购房过程中产权证、房产证的及时下发问题是市民留言的主要内容,房屋质量问题、合同违约、交房时间过晚等现象也频频出现。

其后3个热点主题的留言数量相差不大,分别占比23.34%、21.91%、19.61%,城市规划主题涵盖范围较广,留言主要内容为违章建筑及临时设施的摆放,在建工程项目及不合理的规划建设造成了噪音扰民、环境污染、交通堵塞、基础设施安全隐患等重大问题,影响到居民的美好生活及城市的市容市貌,阻碍了宜居城市的建设及城市高质量发展的进程。拆迁改造主题下,棚户区改造、老旧小区改造等住房保障项目与城市中低收入群体休戚相关,有效改善了居民的生活质量。但在拆迁改造的过程中存在众多争议,如拆迁改造时点滞后,改造房屋质量有缺陷,安置房的供暖、供水、燃氣等基本住房保障的不及时落实,近年来热议的老旧小区加装电梯等问题引起了中低收入阶层的不满,“惠民工程”遭到了人民群众的质疑。此外,物业管理也是居民关注的热点主题,留言内容从社区单元封闭到社区车位安排,从电梯费用的分摊到停车费用的规定,从公众设施的维修到物管公司的内部混乱及无作为等,深入到市民的日常社区生活。

2.1.2 时间演化趋势

整体来看,四类留言主题存在一定的共性,留言数量均呈上升趋势,前期缓慢增长,从2018年开始增长幅度变大,尤其是房产开发主题,不仅留言数量最多,上升幅度也最为显著。由此可见,未来我国公众通过网络问政这一形式参与城市建设的热情会保持高速增长的势头,在线留言将成为政府进行城市建设的重要参考依据,为城市发展奠定了稳固的民生基础。

如图2所示,2014、2015年房产开发主题留言数低于城市规划和拆迁改造,2016年有所增长,留言量居于首位,虽然在2017年出现小幅下降,但数量依然高于其他三类主题。结合国家相关政策来看,2014年楼市库存严重,房价进入盘整期,一些城市房价集体下降,在这种情况下,地方政府纷纷开始救市,部分地区撤消住房限购政策。2015年“去库存”政策出台,释放了大量改善性需求,大部分城市的成交量和房价快速上涨,但同时,购房问题频发,业主与开发商的争端逐渐显现。2016年是去库存政策落实的一年,房地产市场呈现了新局面,政策环境出现了新变化,中央层面多次表态抑制房地产泡沫、防范金融风险,坚持稳中求进的工作总基调。同时,租购并举政策的提出使住房租赁市场拔尖而出,缓解了部分市民的购房压力。为了促使房地产市场的平稳健康发展,从中央到地方各级持续收紧,强调“房住不炒”“住有所居”,多项政策的出台也引发了公众的广泛讨论。在此背景下,开发商更加注重民生问题,完善合同交易,提升房屋质量,社会舆论逐渐有所收缓,留言数量在2017年出现微弱下降。从2018年开始,房产开发的留言数依然维持高速增长的趋势,尽管国家在不断进行宏观调控,但房地产业作为我国国民经济的支柱产业,依然是城市居民最为关注的主题。

城市规划和拆迁改造两大主题具有相同的发展趋势,折线图近乎重合,直至2020年间发生差异,拆迁改造出现下降趋势,而城市规划增长幅度减缓。可能原因是数据截止时间为2020年9月30日,之后3个月的留言数未加入统计,造成数据量偏少。城市规划主题下的留言内容多为违章建筑及临时设施的摆放问题,不仅侵占了安全通道与城市公共空间,很多违建还隐藏在合法建筑里面,使不知情的公众对政府部门产生不满,损害了政府公信力,严重制约了城市规划建设的进度。拆迁改造主题在2014、2015年的数据量占据首位,随后一路小幅增长。在城市高质量发展的战略需求下,城市建设告别外延扩张,转向内涵式发展,通过对既有建筑的部分拆除,达到资源的合理利用,使城市风貌得以完善。2014年国务院提出完善旧城改造机制,优化提升旧城功能,全面改善人居环境。基于此,自2009年启动的棚户区改造在2014年进行政策加码,2015年进入攻坚之年,部分城市结合自身实际进行了创新性的探索,积极推进改造工作。然而,在拆迁改造工作陆续开展的同时,不可避免地会产生冲突争议。省市政府往往过度关注物理层面的改造,注重绩效竞争,忽视市民基本需求,拆迁行为不当、补偿标准不高、安置房屋质量堪忧等问题引发公众不满。

相比较,物业管理主题的上升趋势较为平缓,前期留言数较低,后期受关注度较多。随着我国城市化水平的不断提高,现代化社区拔地而起,住进小区的居民不再仅限于以往的权钱者,普通市民包括原来居住于农村的群众也可住进现代化城市小区,加深了小区的复杂程度与多样化;同时,社区的原始居住功能也逐渐转变为投资功能,小区内随处可见出租告示,出租房现象越来越多,社区充斥着各类人群。而居民有着不同的需求与利益倾向,小区环境、配套设施、物业管理水平的高低等影响着居民的幸福感与获得感,因此,物业管理工作的开展愈加困难,业主与物业管理人员的矛盾不断深化。

2.2 情感分析

2.2.1 总体性描述

如图3所示,从留言类型来看,投诉留言占比较高,为45.82%,求助留言占比35.17%,该两大类型均表现消极情感色彩,体现了公众的不满与无助。感谢留言占比仅为0.37%,公众普遍对于城市建设状况较不满意,在城市发展过程中存在着明显的民生问题,城市建设还有很大的提升空间。

为深入了解公众诉求,探寻公众情感倾向程度,进行情感极性分析。在机器学习算法识别情感倾向的过程中,正向情感留言被赋值为1,负向情感留言赋值为0。由于中性情感的研究意义不大,故将情感得分小于等于0.5的留言归为负面情感留言。由表2可得,负面留言占比最高,为83%;正面留言仅占总数的17%。

经过前文的留言主题分类后,在此对每个热点主题进行情感分析,比较主题之间的差异。统计每个主题正、负面情感留言占该主题留言总数的比例,绘制如图4所示的极端情感比例图。

由图4可得,4个热点主题的负面留言比例明显超过正面留言,居民消极情绪较为突出。其中物业管理主题的负面留言占比最高,为87%,表明居民对于物业管理服务较不满意,社区物业管理水平有待提高。虽然房产开发的总留言数最多,但负面留言以86%的比例低于物业管理。拆迁改造主题的消极留言也居于高位,占比83%。只有城市规划的负面留言未超过80%,相较其他3个主题,该主题下公众情绪有所缓和。

2.2.2 空间分布特征

公众的消极情感聚积到一定程度必然会影响社会的和谐稳定,故将负面情感倾向与地理空间尺度相结合,统计不同城市每个热点主题的负面留言数占该城市总体负面留言数的比例,绘制空间分布图,进行城市间的对比分析。如图5~图8所示。

在城市居民生活由“小康型”向“富裕型”过渡的过程中,必然要对城市住宅、基础设施、文娱设施和整体物质环境提出更高的要求。石家庄市的房产开发主题负面留言占比高于其他20个城市,住房问题最为严重。昆明、重庆位列其后,房产开发主题的负面留言数占总负面留言数比例均高达50%。东南沿海城市诸如福州、上海、广州等地分级符号较小,负面留言数占比较小,房产开发状况较为良好。空间格局差异主要与城市自身的政策导向相关。2014年9月,石家庄市撤消住房限购,2016年采取调控土地供应措施,开展商业服务业用房去库存,并发展房屋租赁市场,2017年实施楼市限购政策,2018年进行楼市严查,维护群众的合法权益,以上政策使房地产市场产生了较大震动,石家庄房地产市场发展起伏较大,直接影响居民的情绪波动。城市规划主题与房产开发主题恰好相反,负面留言占比最高的3个城市为福州、广州和上海,南昌、南京、杭州紧随其后,形成“东多西少”的空间格局。福州市历史文化底蕴浓厚,在保护文化名城的压力下,老城难以实现功能转移,新区发展也较为迟缓,城市路网结构不合理一直以来为市民诟病。东南沿海地区经济发展水平较高,但在城市快速发展的过程中,城市规划者往往忽略了城市“质”的发展,部分规划方案不合理,公众整体认同度较低,项目实施过程中的违建现象对市民的日常生活造成了极大的负面影响。相比之下,位于中西部地区的呼和浩特、银川、乌鲁木齐等城市的负面留言占比较小,处于10%左右。东北地区的哈尔滨市、长春市关于拆迁改造主题的负面留言占比最多,拆迁过程中容易产生矛盾冲突,公众抵制心理较强。东北地区作为老工业基地,经济发展势头曾经一度高涨,但以资源性产业为主导的结构单一性决定了城市功能的单一性,进而制约着东北地区城市竞争力的提升和经济转型的潜力。尽管我国开展了振兴东北老工业基地的战略实施,并进行了相应产业结构的调整,但东北地区的经济发展依然落后于东南沿海城市,城市建设状况较为滞后。昆明、拉萨等西部地区公众情感较为积极,在该主题下较少产生負面留言。物业管理问题主要集中在西宁、拉萨两地,东北地区的哈尔滨市、沈阳市问题也较为严重,物业服务体系尚未完善。而中部、东部地区城市物业管理服务水平较高,居民的社区幸福指数相对较高。

3 结论与建议

通过对人民网的城建留言进行文本挖掘,得出以下结论:

第一,热点主题提取发现,公众对于房产开发的关注度最高,城市规划与拆迁改造主题次之,物业管理的讨论热度相对较低,且四大主题的留言量整体呈逐年上涨的趋势,其中房产开发主题的增长速度最快。

第二,情感分析结果表明,对于城市建设情况,公众呈现消极情绪,物业管理主题的负面留言量占比最高,房产开发和拆迁改造次之,城市规划主题占比较小。

从空间角度来看,房产开发主题下,石家庄市负面留言最多,福州市的城市规划问题最多,拆迁改造问题最为显著的是哈尔滨市,物业管理则是西宁市。由此可见,不同城市居民对于不同主题表现出的情感态度存在较大差别。

根据以上研究结论,围绕促进民生改善,助力城市高质量发展,结合城市建设中存在的问题,提出以下对策建议:

(1)不断完善社会舆情引导机制,将各项政策措施进一步落实,化解社会公众的不满和质疑,营造积极正面的社会氛围。围绕城市居民关注的城建热点问题,及时采取有效、规范的整治措施,减少矛盾与冲突;完善公众参与机制,调动市民参与城市建设的积极性,增强公众对于政府的信任感,提升政府的公信力。

(2)健全网络保障体系,逐步提高城市数据的开放和共享程度,消除“数字鸿沟”现象。利用大数据和智能技术,建立城市各个部门的沟通与合作机制,减少部门条块化分割带来的信息封闭与重复行动。统筹东中西部及东北地区的协调发展,促进区域互联网建设的联动,对资金投入、基础设施建设、网络应用推广等事项进行整体规划与协调推进。

(3)加快产业结构调整,培育新兴产业,以经济发展动能推进城市高质量发展;加强第二产业和第三产业的互动,形成多元支撑的现代产业体系。在发展城市经济水平、加大城市化基础设施的同时,也应该反思城市的发展模式,注重保障民生,保护和优化城市生态环境,用严格的制度、严密的法治,促进建立“低能耗、低物耗、低排放”的产业体系,维持经济、社会、环境的协调发展,实现城市发展动力、发展质量和发展公平的有机统一。

城市化的根本目的是为人类生活创造更美好、更有效的生存环境,人是城市的主体,不了解人们的现实诉求与价值理念,就无法满足人的需要,也无法去建设一个人性化的城市,因此,从公众的角度探寻城市发展路径,对城市建设进行多主题的系统分析,对于不同城市建设的实际情况,认清自身发展的薄弱点,制定针对性的发展战略,走各具特色的发展路径;利用城市区域间的相互影响,促进产业融通、资源共享,着力解决城市建设过程中的不平衡、不充分问题,可有效提高城市的承載能力和内生动力。

参考文献:

1.陈志成 王锐.大数据提升城市治理能力的国际经验及其启示.电子政务.2017.06

2.Fu X, Tang Z.Planning for drought-resilient communities: An evaluation of local comprehensive plans in the fastest growing counties in the US.Cities.2013.32

3.Seok H, Joo Y, Nam Y.An Analysis of the Sustainable Tourism Value of Graffiti Tours through Social Media:Focusing on TripAdvisor Reviews of Graffiti Tours in Bogota, Colombia. Sustainability.2020.12 (11)

4.陈映雪 甄峰.基于居民活动数据的城市空间功能组织再探究——以南京市为例.城市规划学刊.2014.05

5.龚言浩 甄峰 席广亮.“一带一路”倡议关注与响应的空间格局——基于新浪微博数据的分析.地域研究与开发.2017.38 (02)

6.Munawir, Koerniawan M D, Dewancker B J. Visitor Perceptions and Effectiveness of Place Branding Strategies in Thematic Parks in Bandung City Using Text Mining Based on Google Maps User Reviews.Sustainability.2019.11 (7)

7.谢永俊 彭霞 黄舟 等.基于微博数据的北京市热点区域意象感知.地理科学进展.2017.36 (09)

8.Wang Z, Zhong Y.What were residents' petitions in Beijing-based on text mining.Journal of Urban Management.2020.02

9.彭晓 梁艳 许立言 等.基于“12345”市民服务热线的城市公共管理问题挖掘与治理优化途径.北京大学学报(自然科学版).2020.56 (04)

10.孟天广 李锋.网络空间的政治互动:公民诉求与政府回应性——基于全国性网络问政平台的大数据分析.清华大学学报(哲学社会科学版).2015.03

11.Su Z, Meng T.Selective responsiveness: Online public demands and government responsiveness in authoritarian China.Social Science Research.2016

12.孟天广 郭凤林.大数据政治学:新信息时代的政治现象及其探析路径.国外理论动态.2015.01

13.Grimmer J, Stewart B M.Text as Data:The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts.Political Analysis.2013.21(3)

14.Blei D M, Ng A Y, Jordan M I. Latent Dirichlet allocation.Journal of Machine Learning Research.2003.03

15.Montoyo A, Martinez-Barco P, Balahur A. Subjectivity and sentiment analysis: An overview of the current state of the area and envisaged developments.Decision Support Systems.2012.04

16.张平宇.城市再生:我国新型城市化的理论与实践问题.城市规划.2004.04

17.董锁成 李泽红 李斌 等.中国资源型城市经济转型问题与战略探索.中国人口·资源与环境.2007.05

18.彭晓 梁艳 许立言 等.基于“12345”市民服务热线的城市公共管理问题挖掘与治理优化途径.北京大学学报(自然科学版).2020.56 (04)

19.王晓楠 孙威.黄河流域资源型城市转型效率及其影响因素.地理科学进展.2020.39 (10)

20.文军.回到“人”的城市化:城市化的战略转型与意义重建.探索与争鸣.2013.01

21.马溯川.城市发展趋势的哲学意蕴——从“人”的本质论中国城市发展动力.现代城市研究.2010.25 (04)

猜你喜欢
文本挖掘空间分布城市建设
数据挖掘技术在电站设备故障分析中的应用
白龟山湿地重金属元素分布特征及其来源分析
基于LDA模型的95598热点业务工单挖掘分析
旅游综合体特征分析
生态文明城市建设中花卉旅游发展策略研究
江苏省臭氧污染变化特征
慧眼识璞玉,妙手炼浑金