中国城市劳动力流动的网络特征
——基于百度迁徙大数据的研究①

2023-12-25 05:00王群勇孙倩
南方人口 2023年6期
关键词:劳动力流动

王群勇 孙倩

(南开大学 经济学院数量经济研究所,天津 300071)

1 提出问题

随着发展理念的更新,劳动力的流动格局也在不断演化。2000-2010 年间流动人口规模增加了117.6%,2010-2020 年间流动人口规模增加了69.8%,不仅流动总量出现下降趋势,流向也出现了由东部向西部回流的情形[1],劳动力流动过程的背后有着一系列非常复杂的作用机制,承载着资本流、信息流、技术流的大规模劳动力流动,既是经济结构、产业布局、资源配置的结果,同时也反向对城市的发展产生深远的影响。

在我国经济进入新常态的情势下,如何促进劳动力要素在本市聚集,实现劳动力资源的优化配置,已成为各地实现高质量发展的重要课题。那么,我国城市间呈现出怎样的劳动力流动格局?近年间发生了怎样的演变?促使劳动力流出与流入的主要驱动因素是什么?

2 文献综述

经典的劳动力理论试图对劳动力流动的原因及区位选择做出解释,早期新古典理论认为经济差异是促使人口流动的主要原因,由于传统经济部门与现代经济部门的边际生产力不同,导致现代经济部门的工资收入高于传统的农业部门,因此劳动力从传统的经济部门不断流向新兴经济部门[2-3],劳动者会在权衡城乡的真实收入差距与城市的就业概率下做出使个体效用最大化的流动决策[4],除收入影响外,个体效用还会受到其他多种因素的影响,“推拉理论”指出,有利于改善生活水平的因素成为了促使劳动力流入的拉力,而不利的生活条件因素成为了导致劳动力流出的推力[5]。新劳动力迁移理论在此基础上认为相对收入而不是绝对收入影响着劳动力的流动决策[6],人们会将自己的生活水平与周围人的生活水平进行比较,然后会产生相对满意与相对剥夺的心理状态,这种因感受到不平等的相对剥夺感,会加强劳动者的流出倾向。总体来说,新古典理论强调经济因素的重要作用,而与之相对应的是舒适度理论的兴起,随着人们对生活质量需求的不断提高,环境、气候、城市建设、公共服务等方面的因素越来越受到学者们的关注,舒适度理论认为,气候条件、环境资源、自然灾害,社会管理等因素都会促进或阻碍劳动力的流动[7],而城市也可以通过提供更优质的文化环境与公共服务来吸引劳动力进而促进经济的增长[8-9]。

基于上述理论,国内学者使用中国的相关数据开展了丰富的实证研究,其中一个核心的领域是对劳动力流动空间结构特征的描述,学者们运用分型理论与ESDA 方法[10]、热点分析与空间回归[11]、莫兰指数[12]、地理加权回归模型[13]等多种方法来刻画省、市、县不同层面的人口流动格局,近年来,随着信息化的发展,原有的地理空间结构正在被复杂的网络关系所重塑,网络分析方法逐渐走入人们的视野并发现,中国城市间的人口流动有明显的分层集聚现象,具有典型的“小世界”特征[14-15],呈现出一定的核心边缘结构[16],以广东、浙江、江苏、安徽、四川构成的“一主四副”的网络结构凸显,等级层次性加强[17],以区域内流动为主要的流动模型,省际间流动网络密度不大[18],以子群内流动为主,子群间联系较少[19]。基于此,学者们对劳动力流动的动因进行了研究,指出经济因素是劳动力流动的主要因素,地区的发展水平、开放程度、收入水平、人力资本等都是影响劳动力跨区流动的动因[20];城市的公共服务水平、基础设施建设对劳动力流入具有正向影响[21],方言文化的距离[22]、空气污染[23]等因素对劳动力的流入具有负向影响,而房屋价格对于劳动力流动的影响则呈现“倒U 型”[24]。使用社会网络分析方法的学者则指出,各地区在经济、社会、文化水平上的区域差异,是促使劳动力从低水平地区流向高水平地区的源动力[17][19][25]。

文献梳理发现,目前劳动力流动的研究多侧重考察省际间或特定区域内的劳动力流动,从城市层面考察全国劳动力流动网络的较少;多侧重于截面数据的影响因素分析,而对劳动力流动网络结构时空演化规律的研究较少;多侧重人为因素对流动的影响,对自然环境影响的关注较少。基于此,本文尝试做出以下改进:一是使用2020-2023 年元宵节后十天的百度迁徙大数据构建城市劳动力流动网络,基于网络视角考察劳动力流动的空间特征,并比较了2020-2022 年特殊时期与2023 年常态化后的劳动力流动网络的变化;二是通过时间指数随机图模型(TERGM)对劳动力流动网络形成的影响因素进行识别,并在时间维度上揭示网络变化规律,深入探究我国城市劳动力流动网络的发育机制;此外,构建城市民生资源指数来描述城市为劳动力提供的生存与发展资源,用自然舒适度指数与人为舒适度指数来衡量城市的宜居性。

3 数据来源与网络构建

3.1 数据来源及样本选择

本研究的数据源自百度地图慧眼-百度迁徙平台(https://qianxi.baidu.com)所提供的数据作为数据来源。该平台基于百度地图LBS 开放平台的大数据进行计算分析,展现了中国春节前后人口迁徙的动态趋势。平台提供2023 年实时迁徙数据以及2020-2023 年春运和国庆期间的人口迁徙数据,详细记录了各城市迁入来源地和迁出目的地的流动强度前100 位数据。

尽管百度迁徙数据覆盖了广泛的人口群体,但在代表性和准确性方面仍存在一定的挑战。该平台通过数十万款APP 提供的定位服务覆盖了数亿智能手机用户,但由于缺乏特定年龄段智能手机使用者的精确统计数据,因此难以准确判断覆盖人群中劳动力人口的比例。16-59 岁智能手机用户的确切分布可从其他报告中推算。例如,根据中国互联网信息中心(CNNIC)2021 年报告,我国60 岁及以上的老年网民占网民总数的11.5%;根据QuestMobile 在2022 年报告,18 岁以下的用户占移动互联网用户总数的12.6%,而51 岁以上用户占比26.4%。据此估计,百度迁徙平台所捕捉到的用户中,劳动力人口的比例可能至少达到了75%。尽管这一估算并非精确,但它为分析劳动力人口流动提供了一个相对可靠的基础。

此外,在数据时段选择上,考虑到与春节假期相比,元宵节后探亲旅游的游客大幅减少,以外出打工和上班就业为目的的人口流动占主体,在数据上更能体现劳动力的流动[26]。因此,本文爬取了2020-2023 年春运时段内,元宵节后10 天的数据,具体为:2020 年2 月8 日-2 月18 日;2021 年2 月26 日-3 月8 日;2022 年2 月15 日-3 月25 日;2023 年2 月5 日-2 月15 日,该数据集共包含337 个地级市在上述四个时间段内,每个城市及其每日流动强度排名前100 的迁出目的地,共约200 万条数据。考虑到匹配数据的可得性,模型的适应性,本文对数据进行了清洗和精简,最终保留了295 个城市的数据作为最终的研究样本。其余变量数据来自于《中国城市统计年鉴》。

3.2 网络构建

基于上述数据,本文整理构建了中国城市劳动力流动网络,以295 个地级市作为网络结点,以城市间的人口流动强度作为网络连带,组成了295*295 的邻接矩阵Yinitial(行为劳动力流出地,列为劳动力流入地),根据平台数据计算规则,yij代表了城市i 到城市j 的人口流动强度。由于TERGM 模型要求及计算网络特征与结点度分布均需要二值网络数据,故将2020-2023 年的原始网络矩阵元素统一排序,选择该序列的3/4 分位数做为临界值,大于等于此值的设置为1,小于此值的设置为0,各年份网络设置统一的临界值有助于观察到网络基本特征随时间的变化情况,由此将劳动力流动强度矩阵转化为0-1 邻接矩阵,记为Ybinary,TERGM 分析将基于此网络展开。

4 劳动力流动网络的动态结构特征

4.1 整体网络层面特征

对2020-2023 年的原始邻接矩阵Yinitial进行深入的社会网络分析及可视化处理,可发现城市间劳动力流动的微妙变化。鉴于城市节点众多,为精准捕捉并展现网络的核心特征,本研究筛选了每个年份中入度与出度排名前20 的城市,构建出一个凝练而富有代表性的网络图(见图1),并采取了一致的阈值标准来筛选网络连带,确保了不同年份网络图的可比性。从图中可以看出,2020 年的网络相对稀疏,而从2021-2023 年,流动的密度与强度均显著增加。在宏观结构上,除2020 年的中部地区流动略显稀薄之外,其余年份均展现出一种明显的菱形结构:以郑州和武汉为中枢,北京、上海、深圳和成都构成四个顶点。此菱形构型内部的流动活跃度远超其外围。在这些战略节点城市周围,可观察到以其为核心的区域性集群效应,城市间的劳动力流动强度异常突出,如北京与天津、石家庄之间,上海与南京、杭州之间,深圳与广州之间,成都与重庆,武汉与郑州、长沙之间的联动,均构成了区域劳动力流动的强力纽带。2023 年较前期的显著不同是,劳动力流动菱形区域内部与外围的分化更加显著,而菱形区域内部则更为均衡,菱形区域内网络密集程度增强但超高流动强度的线路减少,这说明有更多的中部城市发挥着越来越重要的枢纽作用。

通过所构建的二值网络Ybinary,本文分析了2020-2023 年期间劳动力流动网络的关键特征指标(见表1)。在节点数量(295 个)与二值网络构建阈值固定的条件下,劳动力网络的平均度由2020 年55.746上升至2023 年89.488,网络密度从0.190 增加到0.304,这一变化体现了网络节点之间的联系显著增多,揭示了劳动力流动的扩展和城市经济互动的增强。平均最短路径从1.910 减到1.757,指 示网络效率的增强,意味着劳动力从一个区域到另一个区域的流动更为迅捷和无阻。这可能得益于交通、信息技术的进步或者劳动市场政策的优化。网络中心势分析中,可见劳动力流动网络的出度中心势远低于入度中心势,这种“集中流入,分散流出”的格局意味着某些城市成为人才汇聚中心,而人才的流出来源则更趋广泛和分散;此外,中心势随年份呈现整体下降的趋势,这表明网络中的依赖程度不再集中于少数中心城市,而是向其他城市分散,显示出劳动力流动的地理分布正变得更加均衡,这意味着权力和影响力正在从传统的劳动力市场中心城市向其他城市转移,反映出经济发展机会的地理扩散。网络中小团体数量的下降强调了地区间劳动力流动模式的变迁。局部流动的格局及其凝聚子群的减少,指向了区域之间壁垒的打破和劳动力流动的均衡化。

表1 2020 年-2023 年城市劳动力流动网络统计特征

4.2 区域度分布特征

图2 展示了2020-2023 年劳动力流动网络入度与出度的区域分布特征,图2 左侧为各区域的平均入度,右侧为平均出度。首先,在劳动力流动的活跃度方面,东部地区的平均入度与出度均处于高位,劳动力流动最为活跃,随后依次是中部地区,西部地区与东北地区活跃度较低。其次,在流向方面,平均入度最高的是东部地区,平均出度最高的是中部地区;在度分布上,除东部地区存在明显的净流入外,其他三个地区均为净流出,东北地区的净流出特征最为明显。再次,从纵向时间维度上看,东部地区的平均入度与出度差逐年增加,中部地区的平均流出与流入差逐年缩小,西部与东北地区的平均流出与流入差逐年扩大,这说明东部地区一直保持着对劳动力的吸引力,且这种优势仍在扩大,中部地区的吸引力有所增强,而西部和东北地区则呈现出吸引力明显下降的趋势。

图2 2020-2023 年各区域平均入度与平均出度对比

4.3 结点层面特征

在网络结点层面,基于2020-2023 年的二值网络Ybinary,分别计算了295 个城市节点在网络中的入度与出度,四年间城市结点的入度与出度分布较为稳定,图3 仅展示2023 年入度与出度分布热力图。

图3 2023 年中国劳动力流动网络入度与出度空间分布

对城市结点入度与出度的分析可见:第一,劳动力流动网络的入度在3-289 之间分布,方差较大,存在着一些吸纳劳动力的“超级城市”,入度最高的城市为北京,向后排名前十的城市依次为:上海、苏州、杭州、武汉、广州、深圳、重庆、成都、西安,这些城市的入度均在270 以上,从地图上看,高入度地区集中在以上述城市为支点的菱形结构内;第二,劳动力网络的节点出度相较于入度较为平均,区间在4-134,出度最高的城市为河南省周口市,向后排名前十的城市依次为:南阳、驻马店、郑州、西安、渭南、洛阳、重庆、徐州、许昌这些城市的出度均在125 以上。从地图上看,出度较高的城市主要集中在中部与西部地区。

中介中心度也是分析网络节点特性的关键指标之一,它显现了一个节点在资源与信息传递过程中的协调和控制能力。本研究通过计算2020-2023 年期间各城市节点的中介中心度反映其在劳动力流动网络中的作用和地位。在中介中心度排名前20 的城市中,除了深圳、苏州、青岛、东莞外,其余16 座城市均为省会或直辖市。这些城市在经济实力上也居于领先地位,成为区域内的经济与文化核心,并且作为主要的交通枢纽,发挥着劳动力跨省流动的关键中转作用(见表2)。

表2 中国劳动力流动网络各城市中介中心度

中介中心度动态变化反映出大部分城市的中介中心度出现了不同程度的下降,其中尤以北京、深圳、成都、上海、广州和苏州等城市最为明显。这说明,京津冀、长三角、珠三角等区域的交通基础设施建设和完善程度超越了其他地区,进而提高了人口流动的便捷性,并相应减弱了这些关键节点城市在整个网络中的控制力。同时,中部地区的郑州、长沙和武汉城市的中介中心度有所上升,表明它们作为交通枢纽的功能正在增强。特别是武汉,尽管在2020 年因疫情冲击其中介中心度显著下降至294.26,但随恢复情况的改善,其网络中的协调作用及中心地位有显著提升。

5.劳动力流动网络内生格局及驱动因素分析

5.1 TERGM 模型

本文人口流动数据覆盖2020-2023 年间的关键时间段。为深入分析网络结构的时间演变,本文采用时间指数随机图模型(TERGM)。TERGM 是指数随机图模型(ERGM)的一种扩展,适用于分析动态网络数据,可揭示网络结构随时间变化的动态规律,它不仅可解释网络在特定时间点的状态,还能分析过去网络状态如何影响当前网络结构,为理解复杂网络时间演进的有力工具。

TERGM 的特点在于其能够同时解释网络中关系存在与否的内生和外生机制,这一点超越了传统回归分析方法的限制。它打破了独立性假定,基于极大伪似然估计,通过一系列的估计、模拟、诊断和改进步骤,对网络的时间依赖性进行细致分析,从而得到稳定且准确的实证结果。

在模型的具体运作中,TERGM 考虑了网络在不同时间点的状态,并将这些状态串联起来,形成对网络动态特性的全面握。模型的表达形式为:

其中,Yt代表时间时间t的网络状态,θ是一组待估参数,Yt网络状态的形成依赖于K个时点的历史网络Yt-k,……,Yt-1,函数h是从这些历史网络状态计算得到的统计量,涵盖了影响网络连接的各种因素,这些因素共同决定了当前时间点网络形成的概率P。

5.2 变量选取及指标构建

本文考察了劳动力流动的四类驱动因素:劳动力流动的网络结构、结点城市的特征变量、城市对间的二元关系变量、以及时间变量。综合考虑各统计量对劳动力流动网络形成的影响,以及优化模型的拟合效果,最终选取的用于TERGM 模型的统计量及其含义如表3 所示.

表3 TERGM 统计量说明

5.2.1 网络结构变量

分析劳动力流动模式时,TERGM 的一大优势是能够将网络结构效应考虑在内,网络结构定义为网络中存在的局部连接构型(如三角形、星形等),它们对网络形成的概率具有“内生效应”。边(edges)在模型中起到类似传统回归中截距项的作用,体现了在不考虑其他任何影响因素的情况下,网络连带形成的基本倾向。由于劳动力流动网络为有向网络,本文考虑网络的互惠性(mutuality)与传递性(transitivity),为防止模型退化,本文选择几何加权的边沿共享伙伴(gwesp)纳入模型。gwesp 具有多种模式,本文所考虑的三种结构模式如图4 所示,首先,TSP(传递共享伙伴)代表一种传递三角形结构,在有向网络中,可以被解释为一种社会等级[27],它所描述的是劳动力的等级性流动,如果城市i 的劳动力倾向于流向城市k,则说明城市k 比城市i 更有吸引力,而同时劳动力又倾向于从城市k 流向城市j,说明城市j 比k 更具吸引力,因此劳动力也会倾向于从城市i 流动到城市j,在此三角形结构中,城市j 对于劳动力来说具有最高的效用等级;与TSP类似,RTSP(互惠传递共享伙伴)表示互惠传递性,描述了两个城市同时与第三个城市存在劳动力互换,那么这两个城市间也倾向于发生劳动力流动的趋势;由于上述的劳动力流动的传递特征,本文认为劳动力不太可能遵循三个城市之间的循环模式,网络中循环三元关系发生概率更低,因此,本文也将纳入CSP(循环共享伙伴)结构进行验证。

图4 边沿共享伙伴类型示意图

5.2.2 结点城市属性变量

结点属性变量指各城市在经济、环境、文化等方面的特征与禀赋。本文所使用的TERGM 模型可将城市结点特征对劳动力流动网络形成的影响按“发送者、接收者效应”、“同配效应”、“差异效应”三个维度进行检验。本文选取的结点属性变量如表4 所示。

表4 外生变量及指标构成

本文构建了城市资源指数。“十四五”规划纲要中指出,7 个民生福祉类指标包括就业、收入、落户限制、教育、医疗、社会保障、养老育幼。由于收入、教育、医疗是劳动者选择就业城市时考虑的首要因素,故将收入、教育、医疗作为二级指标,构建“城市民生资源指数”,选择城市平均工资作为收入的三级指标,选择高考本科录取率、高校数量、每万人高中教师数、每万人小学教师书作为教育的三级指标,选择三甲医院数量、每万人口床位数、每万人医师数作为医疗的三级指标,在每一级指标中,利用主成分分析法,计算得出每个城市的“民生资源指数”。此外,在城市民生资源指数基础上,构建分类变量,取民生资源指数值的中位数,将城市分为高资源与低资源两个层次,以考察不同民生资源水平的城市组合之间的同配性。

本文选择人均GDP 作为衡量城市经济发展情况的指标;第三产业比重作为衡量就业机会的指标;选择总人口数作为衡量城市人口规模的指标。基于城市舒适度的迁移理论,从自然舒适与人为舒适度两个方面进行验证,利用主成分分析法,选择平均气温、温差、水资源总量、PM2.5 构建自然舒适度指标;利用文化设施、交通、绿化、公共服务构建人为舒适度指标。

5.2.3 结点城市间的二元关系变量

结点属性变量与二元关系协变量对网络的形成具有“外生效应”[28]。城市间的人口流动,不仅受到城市本身的影响,还可能受到城市对之间特定关系的影响。本文认为,城市间的劳动力流动,很大程度上取决于城市间的距离,这种距离包含三个方面:一是实际地理距离;二是行政距离(即是否属于同一省份),本文构建了一个以城市为结点的邻接矩阵,若城市i与城市j在同一省份,则xij=1,否则xij=0;三是文化距离,本文借鉴赵向阳关于中国区域文化的研究结论,根据其研究中通过GLOBE 文化习俗量[29]表计算得出的各省市文化得分,形成了代表地区间文化差异的邻接矩阵,矩阵中xij为城市i与城市j文化得分差的绝对值。

5.3 TERGM 结果分析

5.3.1 网络内生格局

表5 展示了网络互惠性的参数估计,其显著正值指出,人口流动在城市间呈现显著的双向性。这一现象表明,相较于单一方向的流动,双向交互更为常见,反映出劳动力流动网络的互补性和平衡性。此外,时间维度上,延迟互惠性参数的正值进一步证明了在特定流动路径上,城市间的密切交互不仅增强了信息交流,还可能触发劳动力的循环流动。在传递性分析中,研究辨识了边沿共享伙伴的三种模式(见图4)。特别是互惠传递性(RTC)的显著正向关联,揭示了城市间劳动力吸引力的聚合性特点。具体来说,若城市i 与城市j 在与第三方城市K 的劳动力交换中显示出高度互换,那么城市i 和城市j 之间的劳动力流向也将变得更为紧密。这种模式不断促成了以资源、经济力量、环境优势为纽带的城市网络,形成了结构上的强强联合。

表5 劳动力流动网络内生格局及驱动因素TERGM 估计结果

5.3.2 结点属性效应

城市特性与劳动力流向紧密相关。数据显示,城市民生资源的正向吸引效应和负向输出效应均统计显著,意味着资源丰富的城市更能吸引劳动力,而资源条件较差的城市则更多地输出劳动力。加入和时序变量模型中的经济发展水平、自然舒适度与人为舒适度对劳动力流入具有正面影响,但这一影响在流出方面并不显著,暗示经济水平与否、居住环境是否优越和社会服务体系对劳动力吸引力有重要影响,但不是推动劳动力流出的关键因素。人口规模的正向自增强效应表明,大城市的人口集聚态势进一步促进劳动力流入,反映出劳动力流动的趋势性和集聚特性。第三产业的比重高显著地与劳动力流入正相关,揭示了更多就业机会的吸引力。

就流动成本而言,收入与房价比对流入有显著的正向效应,表明劳动者在选择迁徙地点时偏好收入相对于房价更有优势的城市,而这一指标对于决定是否流出的影响则不显著。经济因素已非劳动力迁移唯一考量,城市的综合实力在公共服务、生态环境和文化发展层面等同样关键。

资源水平的匹配性分析显示,劳动力倾向于从资源较少的城市流向资源丰富的城市,高-高资源组合城市间亦展现较强流动性,提示城市间资源差异对流动趋势的影响可能存在异质性。

5.3.3 协变量网络效应

劳动力流动的协变量网络效应分析中,地理和行政因素显示出了对流动模式的明显影响。具体而言,地理距离与劳动力流动呈现负相关关系,而同一省份内的流动则呈现正相关性。这说明,相比跨省流动,我国劳动力的省内流动更频繁,这与长距离迁移会带来更高的经济成本和心理负担有关。此外,文化因素也在劳动力流动中扮演了关键角色,文化差异的负相关性表明文化异质性可能阻碍了人口的迁移,突显了文化融合和身份认同在劳动者选择居住地时的重要作用。

5.3.4 时间依赖效应

时间稳定性分析揭示了劳动力流动网络的历史连续性。通过加入不同的时间稳定性指标,研究发现二元稳定性显著为正,创新与消融显著为负,表明在2020-2023 年间劳动力流动网络保持较高的稳定性。即已存在的流动模式有继续保持的趋势,而之前未见的流动关系出现的可能性较低,突显出劳动力流动路径与模式的历史依赖性。

为了判断 TERGM 对观测网络的有效性和适用性,验证模型中的统计量能够较好地描述观测网络的形成机制,本文进行了拟合优度检验。评估拟合优度图的目的是检查观测到的网络对于模型隐含的分布是否异常,通过拟合模型进行网络仿真生成100 个模拟网络,形成网络特征的分布区间,用灰色箱线图表示,黑色折线为实际观测网络的统计值,若黑色折线越接近箱型图的中值,说明模型的拟合度越好,若黑线位于灰色箱型图区域内,说明拟合度在可接受范围之内。本文选取了度(Degree)、入度(Indegree)、二元共享伙伴(Dyad-wise shared partners)、边沿共享伙伴(Edge-wise shared partners)和测地线距离(Geodesic distances)五个典型统计量作为测量指标,拟合结果如图5所示。黑色拟合线经过大部分箱线图的中点,模型具有较好的拟合效果,此外,最后一张图中的黑色ROC 曲线十分接近左上角,说明模型具有良好的合。

图5 TERGM 样本内拟合优度检验

5.4 模型的稳健性分析

为了验证时间指数随机图模型(TERGM)的稳健性,本研究对2020-2023 年的数据分别进行了静态指数随机图模型(ERGM)的估计分析(见表6)。基本模型(模型1、3、5、7)只包含结点属性和二元关系的外生变量,而全模型(模型2、4、6、8)则包括了更全面的变量集合。模型拟合程度通常通过赤池信息准则(AIC)和贝叶斯信息准则(BIC)来评价,较小的AIC 和BIC 值表明更优的模型拟合。比较显示,在各年份中,全模型的AIC 和BIC 值普遍低于仅包含外生变量的模型,这表明全模型具有更高的解释力。

尽管2021-2023 年的静态ERGM 估计结果在参数具体数值上与TERGM 存在差异,但在符号和显著性方面与TERGM 结果高度一致,这说明TERGM 模型的稳健性。2020 年的ERGM 结果在城市民生资源、经济水平、人为舒适度上出现显著差异,这可能是由2020 年新冠疫情所致。TERGM动态时序分析中异常被有效弥补,凸显TERGM在处理动态网络数据上的优势。

5.5 城市间差异度对劳动力流动的影响效力分析

如前所述,城市资源、经济发展水平、人口基数、舒适度等特征对该城市劳动力的流动方向及流动范围具有一定的影响,已有研究也指出,地区差异是驱动劳动力流动的主要因素[17][19],但这种差异性对所有城市的驱动作用是否均等尚未明确。为此,本文从各个城市个体网络层面入手,分析差异度对不同城市劳动力流动驱动力的异质性。个体网络(ego network)由一个中心主体(ego)及其相关联的邻居(alter)构成。鉴于劳动力流动网络的有向性,本文将个体网络细分为流出和流入网络:前者由中心城市及其流出目的地构成,后者由中心城市及其流入来源地组成,如图6 所示。

图6 个体网络示意图

本研究选取城市资源、人均GDP、自然舒适度和人为舒适度这四项城市属性,在Ucinet6 软件中计算了这些属性在各城市流出和流入个体网络中的相似性。相似性指标的数值范围在[-1,1]之间,其中1 表示完全同质性(即相似度高),而-1 则表示完全异质性(即差异度高)。通过将相似性指标与城市属性值的相关性分析绘制在坐标系中,以揭示差异度对于城市间劳动力流动驱动力的具体影响。

图7 揭示了流出个体网络中“个体-邻居”异同度与个体城市属性值之间的关系。城市位于零线上方表明其劳动力倾向于流向属性相似的地区,反映了“同质性偏好”现象;而零线下方的城市则显示其劳动力更偏好流向属性不同的地区,体现了“异质性吸引”模式;接近零线的城市在趋同与趋异模式上较为中性。图7 的分析揭露了两个主要规律:绝大多数城市的劳动力在城市资源、人均GDP 和人为舒适度这三个维度上,倾向于流向与自身特征不同的地区。这表明,差异性在劳动力流动决策中发挥着显著的驱动作用,尤其是对于资源禀赋较低的城市而言,劳动力更加趋向于流向与自身存在显著差异的地区。第二,对于自然舒适度而言,多数城市的劳动力更倾向于流向与自身相似的地区,尤其是自然条件较优的城市,其劳动力对环境同质性的需求显著更高。这反映了自然舒适度作为一个重要的生活质量指标,在劳动力流动选择上起到了关键作用。这些发现为理解城市间劳动力流动的微观机制提供了新的视角,特别是考虑城市特征差异性对劳动力流动决策的影响时。

图7 流出个体网络中的“个体-邻居”异同度

图8 对流入个体网络中的“个体-邻居”相似度与个体城市属性值之间的关系进行了探索。与流出个体网络相比,流入网络中的规律性特征表现得不那么明显。在城市资源、人均GDP 和人为舒适度三个维度上,大多数城市更倾向于吸引来自于资源水平相近的地区的劳动力。特别是资源水平较高的城市,这种倾向更为显著。这一现象在表面上似乎与图7 中揭示的差异化流动规律相矛盾,但实际上反映了不同统计方法对结果的影响。百度迁徙数据的统计方法是基于流动强度比较,即城市i 到城市j 的流入强度等于城市i 流入j 城市的人数占j 城市总流入人数的比例。例如,一个落后地区A 到发达地区B 的劳动力流量可能在A 的总流出中占比较大,但在B 的总流入中却可能只占很小的比例。这一发现与TERGM 分析的结果一致,即发展水平较高的城市在劳动力流动网络中的入度和出度均较大,且高发展水平城市间的劳动力交换流量和密度远超过低发展水平地区向高发展水平地区的流动。这一结果揭示了劳动力流动网络中发展水平高的城市在吸引和发送劳动力方面的双重优势,反映了城市间劳动力流动的复杂性和动态性。

图8 流入个体网络中的“个体-邻居”异同度

6 结论与启示

本文基于2020-2023 年元宵节后的百度迁徙数据,构建劳动力流动时间网络,运用社会网络分析及时间指数随机图模型,分析劳动力流动的网络拓扑结构及时空分布特征。结果显示:

第一、在网络结构方面,我国现阶段劳动力流动分布东南密集,西北稀疏的总体态势并未改变,整体网络呈现出以郑州、武汉为中心,北京、上海、深圳、成都为顶点的菱形结构,2020-2023 年,菱形区域内部与外围的分化愈发显著,而菱形区域内部则更为均衡,体现在区域内网络密集程度增强但超高流动强度的线路减少,这说明有更多的中部城市发挥着越来越重要的枢纽作用。从节点的度分布可以明显看出“集中性流入“与”分散性流出“的态势。城市间的不平衡仍十分明显,发展水平较高的城市有着更强的吸引力,而行政地位更高的城市在网络中有着更强的控制力,随着交通便捷性的提高,这种控制力显现出减弱的趋势。第二、劳动力网络具有自我增强及溢出效应,流入的劳动力所带来的信息沟通可能会促进劳动力的回流,进而形成双向流动;两个同时与第三方进行劳动力互换的城市之间,也更加倾向于产生劳动力的流动,形成小团体格局。第三、影响劳动力流动的因素多维化,城市民生资源条件优越、经济发展水平高、人口基数大、就业机会多、自然与人为舒适度高、收入房价比高的城市对劳动力有着更强的吸引力,而地理距离与文化距离,是劳动力流动的阻力。第四、城市民生资源条件越低、经济发展水平越落后的城市的劳动力越倾向于流向与自身差异更大的地区,他们的流动选择往往更加集中;然而劳动力并非只在差异度高的城市间流动,在资源水平较高的城市中,强强联合的趋势同样十分明显。

劳动力的流动体现着经济的活力,促进城市间信息的交流、资源的交换、产业的融合,为城市的发展提供动力,但劳动力的大规模流动中也存在着危机,流动的不均衡性使得中小城市劳动力流失情势严峻的同时也给大城市带来过度拥挤的负担,因此,在确保劳动力自由流动的同时兼顾资源的优化配置,促进地区间的均衡发展是各级政府需要关注的问题,首先,制定城市发展战略应充分尊重劳动力流动的规律,顺应市场经济力量形成的劳动力分布格局,对不同城市群,采取差异化政策。其次,应通过丰富中小城市的民生资源、优化产业结构、提高城市舒适度去吸引劳动力回流,而不是通过抑制大城市的资源供给去调整劳动力分布。最后,西北地区地广人稀,地理距离是阻碍劳动力流动的重要因素,但发达的交通可以在一定程度上弥补地理区位上的不足,因此,应加快西北地区基础设施建设,减少流动成本,促进劳动力的流动。

猜你喜欢
劳动力流动
健康教育也要“流动”起来
2020年河南新增农村劳动力转移就业45.81万人
广东:实现贫困劳动力未就业动态清零
流动的光
流动几何的创新性
为什么海水会流动
相对剥夺对农村劳动力迁移的影响
流动的光线
在自动化投入与劳动力成本之间寻求平衡——工业4.0之我见