基于LDA模型的我国乡村文化政策主题挖掘与演化分析
——与乡村文化科研论文对比视角

2024-02-28 01:42
图书馆研究 2024年1期
关键词:论文政策强度

胡 卉

(湘潭大学公共管理学院,湖南 湘潭 411100)

2017年10月18日在党的十九大报告中首次提出乡村振兴战略,并指出乡村振兴要满足“产业兴旺、生态宜居、乡风文明、治理有效、生活富裕”的总要求。自乡村振兴战略提出后,国家对于乡村振兴工作的关注与支持不断增加。2022年,党的二十大把乡村振兴工作的重要性提到了历史新高度。在党的二十大报告中明确指出,扎实推动乡村产业、人才、文化、生态、组织振兴,坚持农业农村优先发展。农村要全面振兴和优先发展,文化发展是重要内容。但是,农村文化在“三农”中属于基础性、潜在的隐性问题,是农村经济社会发展中的短板[1]123。具体表现为:乡村治理忽视文化建设,乡村文化建设缺少专门的政策和法律支持,乡村文化建设重量轻质,等等。鉴于乡村文化发展的重要性、复杂性、迫切性,需要政府部门结合乡村振兴的时代背景,出台专门政策来明确方向、汇聚资源、集中力量,有力推进乡村文化的发展[2]。在乡村文化发展过程中,政策制定与科学研究所承担的分工与发挥的作用不同,科学研究为建设提供理论解释、预测、总结,而政策主要为建设提供方向指引和基础保障。由此可见,科研与政策都是推动实践发展的重要力量,对两部分内容展开研究具有现实意义。此外,政策与科研之间还存在着协同发展的关系。研究表明科学研究能够为政策制定提供理论解释和证据,有利于推动政策制定和执行。所以,对科研主题内容进行挖掘和分析具有重要意义,能够为政策完善以及乡村文化发展提供支持[3]。基于以上因素,笔者采用主题建模的方法,以2013—2022 年乡村文化政策和科研论文为研究文本,分别对两类文本进行主题挖掘,从而探索政策与科研对于乡村文化主题表达的不同之处。通过对比预测,乡村文化政策的发展趋势,对进一步促进乡村文化政策的完善提供有价值的参考。

1 相关研究

在研究对象层面,我国以乡村文化政策为研究对象的论文,大多采用基于关键词的计量方法或者内容分析方法,对政策的特征和发展趋势做出分析。如刘彦武借用共词分析法,以历年“中央一号文件”为研究对象,分析农村文化政策主题的变迁历程和发展方向,为乡村振兴政策设计提供参考[1]124。张春春利用数学统计、人工编码、关键词分析等方法,从政策的外部结构、政策工具、政策主题中挖掘乡村文化政策的演化脉络与特征[4]。曾文通过梳理城乡一体化背景下的公共文化服务政策文本,探索政策的演变进程,从中发现关注农村文化发展,促进城乡融合的政策方向[5]。而以乡村文化论文文献为对象的研究,大多采用传统的文献计量方法,展现研究的现状,预测研究的趋势。尹莉运用文献计量分析、共词分析、聚类分析等方法和可视化工具VOSviewer,基于18种图情类核心期刊的发文统计,梳理了近几十年来中国图情界有关农村文化建设主要研究成果、热点主题及其脉络联系[6]。杨超超借助CiteSpace 对CSSCI收录的105篇关于图书馆文化扶贫与乡村振兴的研究成果进行知识图谱分析,通过知识图谱对论文作者、研究力量、发表期刊、知识基础、热点趋势进行梳理,从而为未来图书馆助力乡村文化振兴提供建议[7]。李妙然以CNKI 数据库收录的673 篇核心期刊论文为数据基础,运用CiteSpace对农村公共文化服务研究文献进行可视化分析,得到研究的基本外部特征、热点、变迁过程[8]。

在研究方法层面,以政策、论文、专利等文本数据为研究对象,以文本计量方法开展对比分析的研究较少。主要有文禹衡[9]以数据确权政策文本和科研论文为样本,利用CiteSpace 开展计量分析,发现政策和科研存在不协同的情况,并由此对政策和科研的发展提出建议。崔旭[10]通过构建LDA 模型,对档案馆官网和非遗保护中心网站的新闻报道进行主题挖掘与演化分析,以对比分析结果为基础,探讨档案馆非遗保护存在的突出问题。刘微[11]采用文本计算方法,对北京市科技金融政策文本及新闻文本进行主题挖掘,以评估科技金融政策是否满足市场主体的需求。

综上,目前单独以乡村文化政策文本或乡村文化论文文本为研究对象的研究较为丰富,聚焦乡村文化主题的比较分析较少、实证研究不足,尚未出现对乡村文化政策与论文之间影响关系进行探讨的研究。这意味着本研究有一定的创新空间,参考现有文本计量分析的研究成果,将主题建模的方法运用于乡村文化政策与科研对比研究之中,以预测未来政策发展的趋势。区别于现有的传统文本定量分析研究,本研究深入到文本内容作细粒化分析,基于农村文化政策和论文文本内容,引入机器辅助分析手段,对主题词库进行学习和训练,展开大样本分析,试图对以下问题进行解读:当前我国农村文化政策和学术研究的核心范畴、重点演变、发展全貌如何?通过对这些问题的解答,发现政策和研究领域文本的共现表达和差异性表述,从而展开政策与科研的对比研究,以做出未来政策发展趋势的客观预测。

2 研究设计

2.1 研究框架

为了探究政策内容与科研成果之间的关系,本文运用LDA 主题模型、word2vec 词向量模型对两类文本进行主题挖掘、主题强度计算、相似度计算,形成主题分布与演化的可视图,构建起领域、时间、热点、趋势多维度的分析框架。具体研究过程如下:(1)数据获取。笔者主要以北大法宝法律数据库和中国知网学术期刊数据库作为数据来源,以2013—2022 年为时间条件,将乡村文化及其近义词设置为检索关键词,剔除检索结果中无关、重复、不完整的语段,由此获得396 条政策条目、1 480 条论文数据。(2)数据预处理。数据预处理工作主要包括文本年限分类、分词、去停用词、词性标注(仅保留有实际意义的名词和名词词组)等步骤。(3)主题识别与演化分析。利用LDA 主题模型分别对政策文本和论文文本内容进行主题识别。再考虑时间因素,计算主题强度和主题相似度以反映主题变化的动态过程。(4)对比分析。基于主题建模方法得到政策和论文文本的主题内容、热点、发展趋势后,结合直观的可视化图像,识别出论文和政策文本的差异性,从而发现未来政策完善的方向。

2.2 研究方法

2.2.1 基于LDA模型的主题抽取

LDA(Latent Dirichlet Allocation)主题模型是主题抽取研究领域应用最为广泛的主题模型之一,是一种由词语、主题与文档所组成的三层贝叶斯网络概率模型。为了通过LDA 模型更好地找出主题-词分布和文档-主题分布,需要在主题提取前需要先设置三个超参数α、β、K(最优主题数)。α和β通常选取默认值。从现有研究来看,K值的确定大多使用困惑度计算得来,困惑度最低或是拐点处对应的K就为最佳主题数[12]。困惑度计算公式见公式1,公式1中p(w)代表语料库中出现的每一个词语的概率,N 表示测试集中出现的所有词或测试集的总长度。

2.2.2 基于主题强度计算的主题演化分析

主题强度指的是在该时间段中这些主题的研究热度和受关注程度[13],通过计算不同时间窗口下各个主题的强度,形成时间顺序下主题强度变化的折线图,从而分析主题强度演化的趋势。常见的主题强度计算是基于文档-主题概率分布的统计,以发现此时间段上的文档对于主题的支持程度。具体计算公式见公式2。公式2 中,St,k表示时间段t上第k个主题的主题强度,Pd,k为第d篇文档中第k个主题的概率,Dt为时间段t上的文档数量。

2.2.3 基于语义相似度的主题演化分析

主题演化分析是在LDA 主题模型提取的基础上,识别出各个时间段上的主题,并运用Word2vec 词向量表示方法对文档主题以及提取出的主题词进行词向量嵌入,由此得到准备进行语义相似度计算的向量组合。此后,对每两年各自的主题下的主题词进行语义相似度计算,形成各年研究主题的相似度衡量指标[14]。最后,为了更好地探究每年主题之间的主题分裂、主题融合、主题延续等主题演化特征,还需要设置相似度的阈值,用于评价主题间的演化关系[15]。当相邻子时期的主题向量相似度大于阈值时,则认为主题集合内部存在演化关系。按照以上规则,计算出每年间的主题演化关系,并利用Pyecharts 工具进行可视化,得到研究主题的演化趋势图,根据图像反映的主题演化趋势,分析研究主题演化特征,从而形成时间与语义维度的主题演化趋势结果。本研究通过计算余弦距离来衡量两个主题向量之间的相似性,具体计算距离的方法为夹角余弦相似度,计算公式见公式3。

公式中X1KX2k分别表示两个相邻时间窗口下的主题向量,两个向量的余弦值表示两个主题的相似度距离。计算结果取值范围为0 到1 之间,结果越接近1,表明夹角越接近0 度,余弦距离越小,两个计算样本之间越相似。

3 实证分析

3.1 政策文本的主题建模

3.1.1 政策主题识别

利用LDA 主题模型对政策文本进行主题识别。结合困惑度计算结果、实际运行情况以及主观需要,确定最优主题数为6。表1展示了识别出的6 个主题和10 个主题词。如表1 所示,Topic1主要反映政策对城乡文化融合发展的支持、激励、管控;Topic2主要体现政策满足农民文化生活需求的方面;Topic3 主要涉及政策对乡村文化产品与服务供给的设计;Topic4 主要涉及家风家庭建设、农村文化教育、农村文化艺术创造等文明乡村建设话题;Topic5 主要涉及建设农村文化市场,促进农民文化消费等的内容;Topic6主要涉及农村文化产业建设的相关内容。

表1 政策文本主题识别结果

3.1.2 政策主题强度演化

为了更好地实现对乡村文化政策、论文的主题演进分析,以相关标志性事件为分段依据,将党的十九大提出乡村振兴战略以及脱贫任务完成视作重要事件,由此将乡村文化发展分成3 个阶段,分别为初始阶段(2013—2016 年)、发展阶段(2017—2020 年)、优化阶段(2021—2022 年)。基于LDA 主题模型识别出的6 个政策主题,再依据主题强度计算公式,得到政策主题在3 个阶段的主题强度值。根据各阶段的主题强度值绘制技术主题强度变化图谱(见图1),由此可以看出,部分政策主题的主题强度呈现轻微的变化趋势,说明乡村文化政策领域的主题随着时间的发展、环境的变化,发生着调整。另外,T1、T3、T2、T6这4个政策主题的主题强度可以明显看出其上升的变化趋势,且T1、T2 的主题强度一直维持在较高的水平上,说明政策关注城乡文化融合发展,以城市文化带动乡村文化振兴,满足农民文化生活需求;T5 技术主题的主题强度下降,说明政策对文化消费的关注呈现走低态势。

图1 政策主题强度变化图

3.1.3 政策主题内容演化

首先,利用LDA主题模型对不同阶段的政策主题进行识别。每个阶段的最优主题数,根据困惑度大小初步确定,再对相似主题进行合并,最终3个阶段的主题数以及主题标签见表2。然后,根据余弦相似度公式,计算两个相邻时间段下各主题之间的相似度。本研究将相似度阈值设置为0.5,当相邻阶段主题相似度大于0.5,则确定为主题间有高演化强度,属于同一主题演化路径。为了能更好地研究主题演化过程的完整路径,本文采用桑基图实现政策主题的可视化展示,具体展示见图2。由图2可以看出,存在较粗的3条演化路径:①初始期主题1→发展期主题1→优化期主题3,该路径主要关注文化遗产和文化旅游主题;②初始期2→发展期3→优化期3,该路径主要关注文化空间和文化旅游主题;③初始期5→发展期2→优化期2,该路径主要关注农民文化生活、文化体育、文化艺术主题。

图2 政策主题内容演化图

表2 各时期政策主题列表

3.2 论文文献的主题建模

3.2.1 论文主题识别

计算论文文本的困惑度,选择困惑度值最小的主题数,结合主题聚类结果,对相似主题进行合并,最后确定论文主题数为10。表3 展示了识别出的10个主题和10个主题词。如表3所示,科学研究的主题更加丰富,对于乡村文化领域的研究更加细化,体现出了科学研究严谨、深刻的特征。从识别出的主题来看,科研主要关注实际的乡村文化发展问题,如城乡文化融合发展、文化服务体系建设、文化产业发展、公共文化服务建设、文化旅游产业发展、文化空间建设、文化建设主体研究、农民文化消费、传统文化发展、特殊区域文化发展等。

表3 论文文本主题识别结果

3.2.2 论文主题强度演化

基于以上基于LDA 主题模型识别出的10 个论文主题,再依据主题强度计算公式,得到论文主题在3个阶段的主题强度值。根据各阶段的主题强度值绘制技术主题强度变化图谱(见图3),由此可得到在不同的时间窗口下主题强度分布情况。可以看出,T7、T8 两个论文主题的主题强度呈现出直线上升趋势,且T7的主题强度一直维持在较高的水平上,说明乡村文化建设主体的研究是乡村文化科研领域的热点,相关研究较多;T2、T3 论文主题的主题强度呈直线下降趋势,说明服务体系建设和文化产业发展的研究属于早期科研热点,目前强度有所下降;T5、T10 主题强度在3 个阶段中都出现先升后降的趋势,T4、T6、T9主题强度都出现先降后升的趋势,这说明研究热度随着时代的发展保持着动态调整。

图3 论文主题强度变化图

3.2.3 论文主题内容演化

结合困惑度值和实际情况,确定3 个阶段的论文主题数以及主题标签,具体见表4。再根据余弦相似度公式,计算两个相邻时间段下各主题之间的相似度,并对相似度大于0.5 的主题采用桑基图展示其演化关系,展示图见图4。从图4可看出,图中所展示的主题动态演化中存在着3 条主要演化路径:①初始期主题2→发展期主题4→优化期主题8,该路径主要关注文化供给、文化公共服务、文化服务制度主题;②初始期5→发展期4→优化期8,该路径主要关注文化服务体系、公共文化服务、文化服务制度主题;③初始期2→发展期3→优化期7,该路径主要关注文化供给、文化旅游、文化资源建设主题。

图4 论文主题内容演化图

表4 各时期论文主题列表

4 基于主题建模结果的发现与对策建议

4.1 基于主题建模结果的发现

4.1.1 面临冲击:乡村文化认同感不足

在城乡文化融合发展主题层面,政策通过增加资金投入、夯实人才队伍、建立组织机制推动城乡文化一体化发展,提升乡村公共文化产品和服务的供给能力,开展城乡文化共建工作,实施文化援助项目,以缩小城乡之间的文化差距。此外,从主题强度演化趋势上看,政策对城乡文化融合发展主题的关注保持着上升趋势。然而,在面对新型城镇化快速发展时,科研成果更加关注发展所带来的文化冲击,明确指出当前融合发展中忽视城乡文化差异性特质,存在城乡文化互动机制缺位、城乡文化认同整合不足、乡村文化地位边缘化等问题,从而导致农村优秀文化难以传承,农民在多元文化的激荡下容易陷入自我迷失的困境,这些问题都可能对城乡文化共同发展产生负面影响。

4.1.2 缺乏机制:乡村公共文化服务体系有待完善

结合政策和论文主题强化变化图可知,乡村公共文化服务供给热点保持着协同增长的趋势,属于政策和科研领域都关注的热点话题。根据政策文本的主题演化路径可知,政策持续关注农村居民文化生活,努力提升公共文化服务水平和效能。但当前乡村文化服务体系面临服务效率较低、供需失衡、内生动力不足等困境,制约着乡村公共文化服务高质量发展。科研论文在立足于实现的基础上,为乡村公共文化服务建设提供调整和完善建议。从科研论文主题演化路径图中可以看出,文化服务体系建设、文化服务供给在不同阶段存在着持续演进关系,随着乡村振兴战略的深入实施,农村公共文化服务建设的研究内涵更加丰富和具体,出现创新资源配置和服务供给机制,创新数字化公共文化服务路径等学术观点。

4.1.3 亟待升级:文化产业政策滞后于发展

结合农村当地历史文化资源和景观资源打造特色文化产业,能够解决村民就业和收入问题,赋予农村经济发展新动能。在6 个政策主题中,农村文化产业发展主题的强度保持着上升趋势,这表明国家在不断加强乡村文化产业层面的战略部署,旨在为实现乡村全面振兴目标提供支持。但是,当前农村文化产业发展仍然存在产业配套设施不完善、文化资源破坏式开发、产业要素市场不健全等衍生问题,制约我国农村文化经济实现可持续发展。亟须政策层面加快建立清晰明确的顶层设计和制度体系,为文化产业发展提供具体可行的政策引导。

4.1.4 供需失衡:文化消费供不适求

为了丰富农村居民精神文化生活,传承优秀传统文化,政府打造一系列扶持基层文化建设的惠民工程,相关文化项目是当前农村居民主要的文化消费形式。从政策文本主题演化结果来看,随着物质条件的提升,新时代下农民的精神文化需求不断增加,政策也越发强调农村体育和艺术事业的建设与发展,强化农民参与文化活动的主体性。但是,当前文化内容的供给偏离农村居民真实的文化需求,文化惠民工程呈现参与率低、认可度低的失衡困境。面对供不适求的文化消费局面,相关科研成果提出培育农村文化消费市场,通过制度创新引领供给侧改革,以提升农村文化消费的质量和层次。

4.2 基于主题建模结果的对策建议

4.2.1 提升文化认同:构建乡村文化自信

乡村文化振兴需要在农民对乡村文化构建起强大的文化自信基础上实现[16],在城乡一体化高度发展的时代下,扭转乡村文化的弱势地位,化解乡村文化认同危机,树立正确的乡村文化价值观,需要深入挖掘并弘扬乡村文化中的优秀内容,完成乡村文化的价值重塑,使得乡村文化重新焕发出新的活力和吸引力;要重视青少年在文化传承中的重要作用,将乡村本土优秀文化融入乡村文化教育体系中,使青少年树立多元文化观和乡村文化自信;加强农村爱国主义、集体主义教育与宣传,鼓励农民利用现代先进传播手段自觉参与到乡村文化传播事业中,鼓励文化艺术工作者投入到乡村文化研究和艺术作品创作中,汇聚多重力量讲好乡村故事。

4.2.2 加强服务供给:完善乡村公共文化服务制度体系

提升农村公共文化服务水平,满足广大农村居民日益增长的文化需求是乡村振兴的重要任务。当前的科研成果为完善乡村公共文化服务体系提供了新的思路,可为未来的政策制定与完善提供借鉴。加大公共数字文化服务供给力度,提升服务的智慧化属性,扩宽公共文化服务场景,解决乡村公共文化服务“最后一公里”的问题;培育和扶持乡村文化社会组织,发挥其为公共文化服务建设助力的作用,为乡村文化发展提供内生动力;建立需求导向的乡村公共文化服务供给模式,实现公共文化服务的精准化供给,提升文化服务的效率与效果。

4.2.3 完善配套政策:实现乡村文化产业优化升级

乡村文化产业的发展关乎乡村振兴目标的实现,所以完善产业发展配套政策具有重要意义。加强对文化产业开发过程中的生态管理力度,确保人文景观和自然景观均衡发展,防止过度开发、扭曲化开发、破坏性开发;完善农村劳动力、资本、技术、土地等要素市场,以市场化手段实现资源的合理配置,满足高水平乡村文化产业发展的内在要求;推动乡村文化产业集群化建设,加大对产业集群化发展的扶持力度,提升乡村文化产业的竞争力;推动乡村文化产业从高速发展向高质量发展转变,深入挖掘地方特色,提升文化产业的国内、国际影响力。

4.2.4 培育消费市场:满足多样化的文化消费需求

提升乡村文化消费水平和品质,有利于推动文明乡风的形成,推动乡村文化产业和文化市场的繁荣,提升农村居民的幸福感和获得感[17]。利用数字乡村建设的良好契机,借助数字化技术和相关服务平台,提升农村居民对文化消费的参与度、满意度;加强与社会组织、企业、公共文化服务机构的合作,弥补政府建设力量的不足,实现文化服务的精准化供给;建立文化消费激励机制,在乡村开展文化消费试点工作,提升农村整体文化消费水平。

5 总结与展望

笔者基于LDA 主题模型对乡村文化主题的政策和论文文本数据进行主题挖掘,并对政策和论文文本的主题分布、主题热点、主题演化趋势进行对比分析,为完善乡村振兴战略下乡村文化发展政策提供参考。本研究尚有不足之处:在选择数据源方面,使用论文数据来代表科研产出物,使用中央层级的法律、法规来代表政策产出物,无法展示出科研和政策的全貌,在后续研究中还可以加入基金项目数据、政府规划报告、项目评估报告等其他数据来表征科研和政策。

猜你喜欢
论文政策强度
政策
政策
低强度自密实混凝土在房建中的应用
助企政策
政策
Vortex Rossby Waves in Asymmetric Basic Flow of Typhoons
地埋管绝热措施下的换热强度
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登