数据流空间视角下知识溢出的内生经济增长机制

2024-03-04 01:18郑安邦
经济与管理研究 2024年2期
关键词:数据流流动效应

郑安邦 冯 华

内容提要:数据流空间是数字经济时代非竞争的数据在各网络节点之间不断复制共享与往复传输所形成的虚拟空间场域。本文基于两部门的内生经济增长模型,将数据视为研发活动的“副产品”,分析有数据流动参与的内生经济增长机制;继而使用社会网络分析方法,验证发现中国的数据流空间网络结构呈现“核心-外围”特征,数据流空间中的数据流动联系弥补了现实空间的距离联系的不足。进一步,本文利用2014—2020年面板数据,构建空间杜宾模型对数据流空间中知识溢出对经济增长的促进效应进行实证分析。结果显示,在数字经济时代,虚拟的数据流空间能够成为知识溢出的新载体,研发活动所产生的知识溢出以数据流动的方式体现,促进了经济增长。

一、问题提出

随着信息和通信技术革命的出现,广泛的联系和高度的动态化成为信息时代的重要特征,也引发了“流空间”概念的出现[1]。卡斯泰尔(Castells,1996)将流空间定义为“通过流动而运作的共享时间之社会实践的物质组织”[2],其强调了时间层面的信息交流和空间层面的物质移动,构建了新的空间联系逻辑。在此基础上,诸多学者围绕人流[3]、物流[4]、交通流[5-6]、信息流[7-8]、多元要素流[9-10]等研究对象对这一概念进行了拓展,开展了基于不同视角的探讨。

党的二十大报告提出,要加快建设网络强国、数字中国。随着新一轮科技革命的蓬勃发展,数字经济已经成为未来的发展方向。在数字经济时代,数据成为新的生产要素。与资本、劳动、土地等传统生产要素相比,非竞争性是数据的重要特征[11],这意味着一组数据在不同主体间多次复制与使用不会产生另外的边际成本[12]。依托以5G通信、IPv6等为底层技术的互联网,数据得以在不同节点之间流动传输。一方面,数据流动是依托互联网而发生的,这在空间上克服了地理距离的限制;另一方面,数据流动是瞬时完成的,实现了非竞争的数据共享的即时性,这与卡斯泰尔(1996)[2]的流空间定义相契合,成为数字时代新的空间联系形式。本文从流空间的视角切入,提出数据流空间的定义:数据流空间是数字经济时代非竞争的数据在各网络节点之间不断复制共享与往复传输所形成的虚拟空间场域。

知识溢出是新经济地理学和内生增长理论用来解释经济增长的一个重要概念[13],知识所依托载体的流动是产生空间知识溢出效应的原因[14],知识溢出效应促进了经济增长[15]。但相关研究都是将知识溢出对经济增长的促进效应建立在现实空间的基础上[16-18],其考虑的载体是现实的载体,考虑的距离是物理的距离。随着数字经济的发展,数据流空间这一新的空间联系形式打破了传统空间中现实距离的限制,压缩了时空。空间进一步从物理层面拓延到了虚拟层面,以致难以使用现有理论对数字经济时代的知识溢出和经济增长的关系进行更进一步的分析。数字经济的优势很大程度依托于海量的数据资源,通过数据的流动打通数字经济的大动脉,释放经济增长动能。鉴于此,本文将探讨如下问题:在数字经济时代,区域间的数据流动共享所构成的数据流空间能否成为知识溢出效应的新载体?基于数据流空间的知识溢出效应,对区域经济增长有着怎样的影响?

本文余下部分安排如下:第二部分是文献述评,旨在厘清知识溢出、经济增长与流空间相关的文献发展脉络,阐述本文可能的边际创新点;第三部分为理论分析,旨在使用内生增长模型理论推导数据流空间中知识溢出的内生经济增长机制,进而提出理论假设;第四部分为实证设计,阐述研究方法及模型、变量选取和数据来源等内容;第五部分为实证结果与分析,一是对中国数据流空间的网络结构进行分析,二是以计量分析结果验证支持本文的理论假设;第六部分为研究结论与政策建议。

二、文献述评

(一)知识溢出与经济增长

知识具有正外部性的特征,基于区域知识存量的知识溢出能为经济增长提供动力,相关研究多从知识的空间外部性视角展开[19-21]。例如,白俊红等(2017)使用引力模型表征研发要素的空间流动,使用空间计量模型验证了研发要素流动的知识溢出效应及其对经济增长的影响[22]。此类研究都默契地将物理空间作为知识溢出的发生载体,并将物理空间内的知识溢出作为促进经济增长的因素。然而,虚拟空间也能成为区域经济联系的介质。安頔等(2022)等通过百度指数构建中国城市间联系的虚拟空间信息网络,借此考察城市经济增长之间的互动,研究发现城市通过虚拟的空间信息网络发生联系,产生了基于虚拟网络空间的增长溢出效应[23]。如果单纯地从物理空间研究知识溢出与经济增长,一是会忽视知识溢出在虚拟网络空间中的网络外部性特征,二是不能适应数字经济发展的实际,忽略了区域经济通过数据流动产生联系的这一重要途径。

(二)数据与流空间

数据具有非竞争性的重要特征,意味着对同一组数据的多次使用并不会带来额外的边际使用成本[24],而数据的虚拟性特征[1]带来了复制与传输的便捷。因此,如果互联网不同节点上的主体对一组数据存在着需求,非竞争的数据资源便能够在网络空间中形成数据流。不少学者基于非竞争数据的复制与共享,从动态视角考察了数据要素流动的经济效应,认为其会带来生产率提升的“倍增效应”[25]、改善社会福利效应[26]、缓解要素错配效应[27]。已有研究关注了数据的特征以及数据流动的影响,但是缺乏对数据流动网络形态的直接刻画和描述。

自卡斯泰尔(1996)[2]提出了流空间概念后,不少国内学者对流空间定义进行了拓展。沈丽珍和顾朝林(2009)指出,流空间是“围绕人流、物流、资金流、技术流和信息流等要素流动而建立起来的空间,以信息技术为基础的网络流线和快速交通流线为支撑,创造一种有目的的、反复的、可程式化的动态运动”[28]。随着信息和通信技术的发展与应用,信息的流动逐步被视作流空间的主导因素,流空间被认为是信息主导下的物质流动所形成的场域[29-30]。借助流空间理论和网络分析的方法,王宁宁等(2016)关注互联网空间的网络层级结构特征,基于互联网测速数据构建了省域互联网信息空间的复杂网络,并指出中国目前的互联网信息空间的网络特征仍然受约束于地理空间与现实区位特征[31]。在对中国互联网的网络结构进行分析时,相关研究将百度指数作为网络联系的表征。例如,熊丽芳等(2013)借助百度指数衡量长三角城市之间的两两相互关注度,并基于此构建城市间的信息流网络[32];赵映慧等(2015)基于百度指数的搜索数据,使用社会网络分析方法分析了东三省城市网络联系的结构和格局[33]。

(三)对已有文献的评价

相关研究从理论和实证层面肯定了知识溢出对经济增长的重要作用,但是其默契地将现实空间作为知识溢出的发生载体,而忽视了知识溢出能否通过虚拟空间产生这一命题。尽管已有研究借助流空间理论和网络分析方法对要素流动网络和互联网结构开展了讨论,也分析了数据流动的经济效应,但是尚缺乏文献从流空间视角出发研究非竞争数据流动的网络结构、带来的知识溢出效应及其对经济增长的影响。鉴于已有文献的不足,本文在以下方面进行了可能的边际创新:(1)提出数据流空间的定义,在此基础上,借助社会网络分析方法对数据流空间的结构进行分析并阐述虚拟时空的数据联系;(2)将虚拟的数据流动视作知识溢出效应的另一载体,借助内生增长模型考察以数据流空间为载体的知识溢出效应及其对经济增长的影响,以拓展现有研究对知识溢出的产生及载体的认识。

三、理论分析

(一)前提假定

本文将以数据流空间为载体的知识溢出纳入罗默(Romer,2000)[34]所构建的内生增长模型的框架,探讨数据流空间中数据流动共享带来的知识溢出效应及其对经济增长的影响。为了纯粹讨论知识溢出,本文仅从知识的生产部门即研发部门讨论数据产生过程,假定数据仅是研发活动的“副产品”,是研发过程数字化的“历史记录”,从而将数据的产生和流动聚焦在研发环节。假定有对称的N个区域;每个区域都有两个部门,物质生产部门和研发部门;每个区域都使用两种生产要素进行生产,劳动L(t)和资本K(t),这两种要素分别有αL和αK的比例投入研发部门进行生产,并且该比例是不变的。研发资本RDK(t)=αKK(t),研发人员RDL(t)=αLL(t)。物质生产部门的产品一部分用于储蓄即资本积累,储蓄率为s。研发部门主要负责生产知识,提高技术水平。研发部门在生产知识的同时,还产生了“副产品”数据。每个区域作为一个网络节点,所产生的数据全部接入数据流空间并被其他所有网络节点所共享。为了简化分析,将每个区域的劳动增长视为外生且稳定的,即gL=n>0。本文试图基于数据流动的知识溢出效应提出新的内生增长机制,因此在前提假定与模型设定上极大地简化和抽象了现实经济的诸多细节,而强调了已有研究所忽视的基于数据流空间的知识溢出在经济增长中的关键作用。

(二)资本积累与知识积累

对于i地的物质生产部门,参考罗默(2000)[34]的方法,设定物质生产函数的形式如下:

Yi(t)=[(1-αK)Ki(t)]α[Ai(t)(1-αL)Li(t)]β,α+β=1

(1)

物质资本增长率giK可以写成:

(2)

所以有:

(3)

对于研发部门而言,知识生产函数的形式为:

(4)

(5)

将数据流空间中的非竞争数据包以不变替代弹性(CES)的形式生成,在各个区域都是对称的这一假定下,可以将D(t)表述为如下形式:

(6)

其中,Di(t)是i地伴随着研发过程产生的节点数据量,其并不是知识,而是知识生产过程的“副产品”,或者可以理解为数字经济背景下研发活动的数字化历史记录。因此,研发活动越强,生成的数据也就越多,即Di(t)是i地研发活动的一系列投入品的单调增函数:

(7)

数据具有非竞争性,因此通过数据流动空间被所有区域所在的节点所共享。将式(5)代入知识生产函数可得:

(8)

(9)

即区域之间的知识生产存在着互动和关联,其他地区的研发活动产生了知识溢出效应,知识溢出以数据的流动和共享所构成的数据流空间为载体。

由式(4)可知,技术进步率可以表示为:

(10)

近似地,有以下表达式:

(11)

所以,知识积累可以表达为:

(12)

(三)数据流空间中数据增长

从式(7)可以看出数据是内生于经济系统本身的,原因是数据的生成函数是由研发投入所决定的。如果能对数据生产函数的形式进行适当的设定,便可将gD表示为技术进步率、资本增长率和劳动增长率的组合形式。由于数据是知识生产过程的“副产品”,是研发活动的数字化“历史记录”,设定数据生成函数形式为:

(13)

进一步有:

(14)

从式(13)和式(14)可以看出等式左右均有Di(t)这一项,即在各节点数据Di(t)参与知识生产的同时,作为“副产品”的数据Di(t)不断生成。其经济含义是非竞争的数据进入数据流空间被所有网络节点共享时,数据流空间中的非竞争性数据包D(t)的数据量增加,因此本地知识质量提升,知识生产增加。而知识生产增加使得非竞争的数据量增加,如此循环往复直至数据生成过程的均衡。由此,数据流空间中数据流动共享带来的知识溢出效应,使得知识生产过程得以自我强化。梅特卡夫(Metcalfe,2013)指出网络价值等于节点数量的平方[36]。在数据流空间中,数据在各网络节点之间不断往复传输共享,使得知识生产过程形成倍增的正反馈效应。

当数据生成过程达到均衡时有:

(15)

从式(15)的推导过程可以看出,节点数据Di(t)既参与了研发活动同时又伴随研发活动所产生,因此数据的生成是依附于经济系统的,是经济的内生变量。

将式(15)所求的数据量代入式(6)可得:

(16)

因此,数据流空间中非竞争数据包的增长率gD可以表示为giA、giK和giL的线性组合形式:

(17)

从式(17)的推导过程可以看出,数据流空间中的数据增长取决于知识积累、资本积累以及劳动增长,数据增长同样是经济系统运行的内生结果。

(四)内生经济增长路径

本文基于数据流空间的视角提出了知识溢出的内生增长机制,因此需要论证在数据流动的参与下,两部门经济如何收敛到内生的增长路径上。在上述推导中论述了包含数据增长gD的增长路径以及内生决定的gD表达形式,将数据增长gD代入式(12)可得:

(18)

因此,经济增长最终可以由以下一组方程所描述:

(19)

(20)

当增长的“刀锋条件”得以满足,即1>a+θ+ηθr时(1)可以证明,如果不满足1>a+θ+ηθr的“刀锋条件”,只要初始经济不处于极度的衰退中,经济仍可以实现非均衡的内生增长。,经济将收敛到稳态增长路径,稳态增长路径可以由以下一组解进行描述:

(21)

(22)

图1所示的增长相位图说明了增长的稳态路径。

图1 稳态增长路径相位

由式(1),经济增长率可以写成如下形式:

giY*=αgiK*+β(giA*+n)

(23)

则人均经济增长率表示为:

giy*=giY*-n

(24)

田秀娟和李睿(2022)认为,数字经济发展及传统产业的数字化升级,孕育了新的内生增长动能[37]。罗默内生增长理论超越了外生技术进步理论,从内生知识积累视角阐释了经济增长的机制。本文引入了数据的内生增长,并阐述了数据流动对知识生产的强化及知识溢出效应,从而提出数字经济时代的内生经济增长机制:内生于经济系统的数据通过往复流动传输构成了数据流空间,成为地区间知识溢出的载体;基于数据流动带来的知识溢出效应,两部门的经济系统实现了内生增长。

综上分析,本文提出理论假设:研发活动产生的知识溢出以数据流空间为载体,以数据流空间为载体的知识溢出成为经济增长的新动能。

四、实证设计

(一)研究方法及模型

1.基于引力模型构建数据流空间网络

本文分析的重点是非竞争的数据在以各个省份为中心的节点上不断复制共享与往复传输所构成的数据流空间,基于节点间的数据联系强度构建流空间的网络模型,是对数据流空间的网络特征进行分析以及在实证测度中构建数据流空间权重矩阵的重要基础。

不少学者将百度指数作为不同地区之间网络联系的表征,熊丽芳等(2013)、赵映慧等(2015)基于百度指数建立了区域间的网络联系关系[32-33]。安頔等(2022)指出,百度搜索引擎在中国的渗透率高,能综合反映地区间通过互联网联系的程度[23],而数据的流动共享是通过互联网这一载体而发生的。基于此,本文通过百度指数表征地区间的数据联系的强弱,记为linkij。为了消除联系的有向性,借鉴熊丽芳(2013)[32]的做法,定义linkij=Qi→jQj→i,其中Qi→j表示百度指数所衡量的i地对j地的关注程度。但是,百度指数所衡量的关注程度仅衡量了区域间互联网联系的强弱程度,并没有反映出传输的数据量的大小。白俊红等(2017)使用引力模型衡量要素流动量[22],本文参考这一做法,借助引力模型以同时考虑地区间的数据联系强弱以及数据传输量,测度不同省份节点间的数据流动大小。

引力模型源于物理学领域的万有引力公式,后逐渐被引入社会经济研究领域。其一般表达形式为:

(25)

其中,Fij为两地区之间的作用;G为引力系数;Mi、Mj是某种要素的测度,αi、αj为引力参数,Rij为联系强度,p为联系参数。

在此引力模型基础上,结合数据可得性的考虑,本文构建了两省份之间的数据流动强度Dataflowij。为了简化处理过程,本文将引力系数、引力参数、联系参数等简化为1,测度公式如下:

(26)

其中,Datai和Dataj分别表示两地的移动互联网接入流量,由于该变量的取值数目过于庞大且具有时间异质性,因此对其在年份维度上求平均,用经标准化处理的两地流量接入占所有省份流量接入之比表示两地接入数据量的相对大小。通过这种方式,可以生成30个省份(不包括香港、澳门、台湾和西藏)两两配对的数据流空间网络,从而定义了数据流空间网络WDF=(Dataflowij)。使用移动互联网接入流量表征数据传输总量具有合理性:第一,在数字经济时代,随着终端通信的发展,移动互联网成为数据传输和信息交流的重要渠道,接入流量衡量了节点接入网络的频繁和活跃程度;第二,该数据是可直接量化的指标,相比于使用间接方式推算节点的接入数据量,该指标更加合理。

同理,人均数据流动强度的测度如下:

(27)

其中,pDatai和pDataj分别表示两地的移动互联网人均接入流量。通过这种方式,定义了人均数据流空间网络pWDF=(pDataflowij)。

2.基于社会网络分析方法描述数据流空间网络特征

目前,尚缺乏从流空间的视角直接研究数据流动的文献。尽管汤森(Townsend,2001)基于信息基础设施构建了静态的信息网络[38],王宁宁等(2016)基于互联网网速描述分析了信息网络形态[31],但尚缺乏基于动态的数据流动量构建数据流空间模型并对其网络形态进行刻画和分析的研究。本文将借助社会网络分析(SNA)方法,研究省份之间非竞争的数据流动与共享所形成的数据流空间的网络结构特征。

3.计量模型设定

刘学良和陈琳(2011)指出,截面(时间)固定效应本质上是时间序列(截面)回归估计量的加权平均,估计系数体现的是时间序列(截面)维度上的相关关系;处理面板数据时应从经济逻辑上识别自变量和因变量相关关系所存在的维度,即变量是在时间还是空间维度上存在相关,并依据逻辑和理论判断所要采取的固定效应[39]。本文所研究的问题是经济在时间上的增长,自变量和因变量是在时间维度上存在相关关系,因此需要对截面效应进行固定。本文设定如下基准回归模型:

(28)

地区间的研发活动产生了数据流空间的知识溢出效应,存在着区域之间的关联和互动。为了验证本文的研究假设,论证研发活动基于数据流空间产生知识溢出效应从而促进经济增长,本文设定了如下形式的空间杜宾模型(SDM)。空间杜宾模型假定,本地区的因变量除了受到本地区的自变量影响之外,还受到其他地区的因变量以及自变量的溢出效应的间接影响,空间权重矩阵可以被视为发生溢出效应的“载体”。相关模型设定为:

(29)

(二)变量设定及数据来源

1.因变量

本文的因变量为人均实际GDP的对数值(lnpGDPit)。王智毓和冯华(2020)指出,人均GDP是衡量一个国家或地区宏观经济运行状况的重要工具[40],因此本文以此来衡量经济增长,并通过GDP平减指数消除通货膨胀因素。本文所涉及价格因素的变量,基期均设定为2013年。

2.自变量

人均研发资本存量(lnpRDKit):本文使用人均研发资本存量的对数值来表征研发活动。罗默(2000)将研发人员占劳动力的比例视为恒定的[34]。为了避免共线性问题,本文沿用研发人员占人口比例恒定这一假定,因此仅使用人均研发资本来表征研发活动。本文参考了吴延兵(2006)对于研发资本存量的永续盘存的核算方法[41],方式如下:

RDKit=(1-η)RDKi,t-1+RDIit

(30)

(31)

其中,η为研发资本折旧率,采取国际上通用的15%;RDIit为i地t年研发经费内部支出的实际量,通过白俊红等(2017)[22]构建的研发资本价格指数进行平减,2020年缺失的固定资本投资价格指数使用插值法补齐。g为考察期内研发资本实际存量的几何增长率。

3.控制变量

计量模型通过控制变量缓解外部因素对经济增长的影响。(1)人均物质基础设施(lnpIit):本文以各个省份铁路里程数作为物质基础设施的代理变量,然后计算人均值并取对数。(2)人力资本水平(lneduit):本文以平均受教育年限的对数值衡量人力资本水平,平均受教育年限使用各个教育层次年数结合所对应的人口数进行加权平均求得。卢卡斯(Lucas,1988)认为,人力资本积累是形成经济增长的内生机制[42]。(3)对外开放程度(openit):使用进出口总额与GDP之比表示,对外开放程度在很大程度上反映了宏观外部因素对经济增长的冲击。(4)政府干预(govit):使用地方财政一般预算支出与GDP之比表示。张璟和沈坤荣(2008)指出,政府干预同样会对经济增长产生影响[43],因此需要对此进行控制。

4.数据来源说明

本文使用百度指数衡量数据流空间中地区间数据联系强弱,其数据来源为百度指数官方网站,各个省份接入互联网的数据流量来源于《中国统计年鉴》;研发资本的原始数据来源于《中国科技统计年鉴》;人均受教育年限原始数据来源于《中国人口和就业统计年鉴》;用于计算研发资本平减指数的固定资本投资价格指数数据来源于《中国投资领域统计年鉴》;其他原始数据来源于《中国统计年鉴》。

五、实证结果与分析

(一)数据流空间的网络结构分析

1.数据流空间网络形态

使用软件Ucinet 6.0,对各个省份数据流空间从数据接入总量、人均数据接入量两个角度进行网络结构的分析,分别绘制各省份数据流空间中数据总量流动的网络结构、各省份人均数据量流动的网络结构,如图2、图3所示。其中,线的粗细表示数据流动量的大小;节点的大小表示数据流空间中节点的中心度。从图2、图3可以看出,数据流空间的网络结构从形态上呈现出“多核”的“茧状”特征。“多核”是指数据流空间存在多个网络核心,北京、上海、广东、浙江、江苏等省份处在数据流空间的多个核心节点上;“茧状”是指所有省份两两之间构建起了广泛的数据联系,如同蚕丝包裹成“茧”。

图2 数据流空间中数据接入总量的网络结构

图3 数据流空间中人均数据接入量的网络结构

2.基于数据联系强弱的数字距离

在现实空间中,联系的强弱反映了距离的大小,例如两地之间的贸易量、人口流动量会随着距离增加而减小。在数据流空间中,数据联系反映了节点间的数字距离:两个节点之间的数据联系越强,则二者的数字距离越近;而两个节点之间的数据联系越弱,则二者之间的数字距离越远。

在图2、图3中,网络节点间连线的粗细表征了区域数据联系的强弱,可以看出数据联系较强的省份并非在地理空间中处于接近的位置,例如广东省,无论在数据总量流动网络还是人均数据流动网络中,其与上海、北京等省份建立了较强的数据联系,而其在地理空间上并没有与这些省份有着较近的相邻关系。两地在现实空间中的实际距离很大,但有可能在数据流空间中的数字距离很小,数字距离和实际距离在增强区域联系上实现了“互补”。其中的原因是:数据流的产生依附于实体经济活动,当实际距离制约了区域联系的实现,而两地却又存在着联系和互动的需要时,便会派生出更强的数据流动的联系,从而缩短两地的数字距离。这也意味着,数据流空间中的联系弥补了现实空间的距离联系的局限,在数据流空间中传统的可达性概念又有了新的体现——即便克服地理距离的困难程度很大,通过虚拟的数据联系两地仍能够实现虚拟空间的“可达”。这反映出数字经济时代完善5G、IPv6等数字基础设施,缩短数字距离的重要性。

3.数据流空间的节点中心度与“核心-外围”结构

省份节点的中心度衡量了该省份在数据流空间网络中的重要程度,某个省份的中心度越大,意味着其在整个数据流空间网络中的影响力也就越大,在数据流空间中与其他省份有着越强的数据联系,在数字距离的层面上有着越强的“数字可达性”。本文计算出的数据流空间中各个省份的节点中心度结果如表1所示。

表1 数据流空间中各个省份节点中心度

从表1可以看出,数据流空间中的部分省份的中心度较大,在整个数据流空间中承担了“核心”支撑作用;而其余省份则处在数据流空间的“外围”。为了对此进行进一步的探究,使用软件Ucinet 6.0对数据流空间网络进行“核心-外围”聚类分析,输出结果如表2所示。

表2 数据流空间的“核心-外围”分布特征

由表2可以看出,数据流空间网络呈现出明显的“核心-外围”的分布特征,无论是从数据总量还是从人均数据接入量流动的角度来看,其都是由处于核心节点的省份作为支撑,核心省份及其数据联系构成了数据流空间的整体骨架。而处在外围的节点省份,主要是通过与核心节点省份建立数据联系参与数据流空间网络的分工。“核心-外围”聚类的结果并非与节点中心度排名一一对应。原因在于前者从单个节点的视角反映该节点在网络中的绝对重要程度;而后者是基于节点间两两相互联系的强弱进行的聚类,因此从节点相互联系的视角反映其是处在核心还是外围。从表2的结果还可以看出,处在核心节点的省份并非在地理上处于邻近,例如处在数据流空间核心节点的北京,与上海、江苏、广东等核心节点省份在地理位置上并没有相接近。在新经济地理学中的“核心-外围”概念中,“核心”是由经济在地理空间中集聚而产生的,因此处在“核心”区位的地理单元之间是区位邻近的;而数据流空间中的“核心”是由数据流动的密切联系所产生的,因此数据流空间中“核心”节点之间的实际距离可能很遥远,但是通过缩短数字距离的方式形成了虚拟的邻近。新经济地理学所认为的空间,是实体空间;而数字经济时代,虚拟的数据流动打破了传统地理区位的限制,产生了时空的压缩效应,部分数字经济龙头省份在虚拟的数据流空间中实现了“集聚”。因此,数据流空间中的数据流动弥补了实体空间中区域间相互作用的有限性。

(二)数据流空间中知识溢出效应对增长促进的测算

1.空间效应识别与空间计量模型的选择

本文采取拉格朗日乘数(LM)检验—似然比(LR)检验和沃尔德(Wald)检验的思路来确定空间效应存在,并对最佳模型进行识别。安瑟琳(Anselin,2003)、陶长琪和杨海文(2014)指出可以使用LM检验判断是否存在空间效应,从而接受或拒绝普通最小二乘(OLS)模型[44-45]。LR检验和Wald检验则是用于选取空间计量模型的具体形式,即可以使用这两种形式判断空间杜宾模型(SDM)是否会退化为空间误差模型(SEM)或空间自回归(SAR)模型,从而选择出最恰当的模型形式。表3报告了空间计量模型的选择检验结果。

表3 空间计量模型的选择检验结果

根据LM检验结果,LM-error检验与LM-lag检验的统计量均在1%的水平上显著,说明使用OLS模型会忽略掉基于虚拟的数据流空间的空间滞后效应和空间误差效应,从而导致估计模型的偏误。因此,需要采取空间计量模型对空间效应进行识别,以保证回归模型的稳健。根据LR检验和Wald检验结果,在两种检验方式下,都在1%的水平上显著拒绝了空间杜宾模型退化为空间误差模型或空间自相关模型的原假设,因此采取空间杜宾模型的设定是合理的。

2.模型回归结果

经过豪斯曼(Hausman)检验(Chi=29.03,P=0.002),本文使用固定效应(FE)的空间杜宾模型进行实证检验。考虑到上文的模型设定思路,为了便于比较分析,本文将OLS、FE和SDM的结果分别汇报,如表4所示。根据OLS和固定效应模型的结果,区域研发活动增强能促进经济增长。同时,人力资本积累均对经济增长有促进作用,而固定效应模型表明对外开放水平在一定程度上抑制了经济增长。考虑到模型中存在的空间效应及数据流空间的自相关性会导致一般回归的结果存在偏误,主要以表4的SDM结果为准。

表4 模型估计结果

根据表4 SDM的结果,可以看出人均研发资本存量(lnpRDK)的系数在1%的显著性水平上为正,表明研发活动能够直接促进本地的经济增长。同时,由于人均研发资本存量的溢出项(WDF·lnpRDK)的系数在5%的显著性水平上为正,即基于虚拟的数据流空间权重矩阵的空间溢出效应通过了显著性检验。虚拟的网络增强了地区间的经济联系,溢出效应的产生从实体转向了虚拟。因此,理论分析部分所提出的研究假设得以佐证:研发活动产生了知识溢出效应,这种知识溢出效应以非竞争的数据不断传输共享所形成的数据流空间为载体,知识伴随着虚拟的数据流动溢出到各个地区,从而促进了经济增长。更进一步,相比于OLS和固定效应模型结果,在考虑了数据流空间的空间溢出效应后,人均研发资本存量(lnpRDK)的系数减小到0.135,说明忽略研发活动的知识溢出效应会使直接效应被高估。

从因变量的空间滞后项(WDF·lnpGDP)来看,其系数在1%的显著性水平上为正,说明人均GDP在虚拟的数据流空间中产生了正向溢出效应,各个地区的经济增长产生了基于数据流空间的联系。因此在数字经济时代,随着区域间数据联系的增强,经济增长也会产生基于数据流动的相关性,经济增长势头较好的地区能够通过数据联系带动其他地区的经济增长。

从控制变量来看,由于人均物质基础设施的空间溢出项(WDF·lnpI)的系数在1%的显著性水平上为负,因此物质基础设施可以通过数据流空间对其他地区的经济增长产生较强的虹吸效应,抑制了其他地区的经济增长,其背后可能有如下原因。第一,区域间的数据流动加速了信息传输的便利、畅通了资本的流通渠道,从而加剧了增长的极化。第二,数据流动一方面增强了区域之间的联系,另一方面也加剧了区域间数字鸿沟的形成。例如,有研究表明数字经济时代会产生结构性的区域数字鸿沟,形成极化效应,凸显区域之间的差距[46]。对外开放程度(open)的系数在5%的显著性水平上为正,即对外开放程度的提高能够直接促进经济增长。但是从其空间溢出项来看,其系数为负,表明了在数字经济时代本地对外开放程度的提高会对其他地区产生增长的虹吸效应。从人力资本水平的空间溢出项来看,其系数在1%的显著性水平上为正。这说明了在数字经济时代,人力资本积累会基于数据流产生更大程度的溢出效应,因此通过发展数字经济、畅通数据流动能在老龄化背景下更大程度地发挥人力资本对经济增长的正面效应。

为了进一步考察研发活动对经济增长的直接促进效应以及以数据流空间为载体的知识溢出效应的相对大小,本文对空间杜宾模型结果进行空间效应分解,以考察研发活动对经济增长的直接促进效应以及数据流空间中知识溢出效应的相对大小。表5展示了研发活动对经济增长影响的效应分解结果。

表5 研发活动对经济增长影响的效应分解

根据表5所示的结果,可以看出研发活动增加对经济增长影响的直接效应、溢出效应和总效应分别为0.147、0.548和0.695,因此人均研发资本提高对经济增长影响的主要效应为基于数据流空间的知识溢出效应。数字经济发展遵循梅特卡夫准则[36],即网络价值等于节点数量的平方。数据流空间由数据在各个网络节点间往复传输而形成,因此数据在节点间的流动所带来的价值产生倍增效应,产生更强的知识溢出效应,进而成为促进经济增长的新动能。

3.稳健性检验

为了确保实证结果的稳健性,本文采取如下方式进行稳健性检验。

第一,考虑到本文所关注的数据流空间权重矩阵在设定方法上较为单一,为了确保模型的稳健性,本文将数据流空间权重矩阵替换为人均数据流空间权重矩阵,并再次对模型进行了估计;同时本文采取传统经济距离权重矩阵的构建方法,以互联网普及率指标作为数字经济的表征构建了数字经济距离矩阵。第二,考虑到可能存在异常值的影响,本文将所有变量进行了99%的缩尾处理,然后再次进行回归,作为稳健性检验。第三,本文同时替换人均数据流动空间权重矩阵以及对数据进行99%的缩尾处理,再次回归,作为稳健性检验。

根据稳健性检验结果(限于篇幅不再具体列示),人均研发资本存量的溢出项(WDF·lnpRDK)的系数仍保持在5%的显著性水平上为正,因此进一步验证了研发活动的知识溢出以数据流空间为载体,促进了经济增长。与此同时,多数变量的系数符号和显著性水平情况均没有发生明显变化,因此模型的稳健性表现较好。

六、研究结论与政策建议

(一)研究结论

在数字经济时代,数据成为重要的生产要素。非竞争的数据在各个省份之间不断复制、流动与共享,形成了数字化的虚拟空间场域——数据流空间,这构成了数字经济时代新的空间联系形式。本文基于数据流空间的视角,讨论了知识溢出的内生经济增长机制,并结合社会网络分析方法和构建空间计量模型进行了实证分析和讨论,得出了如下结论:

第一,数据流动构成了数字经济时代新的联系形式,从而弥补了现实空间单一距离联系的局限性。

第二,通过对中国以省份为节点的数据流空间网络结构的分析,发现数据流空间网络形态呈现出明显的“核心-外围”特征。部分省份作为核心网络节点,支撑了数据流空间的整体骨架;而其余省份则处在数据流空间的外围节点。

第三,数据是内生于经济系统的,是研发活动的历史记录和“副产品”。非竞争的数据往复传输共享所构成了数据流空间,成为知识溢出的载体,以数据流空间为载体的知识溢出推动了经济增长,成为数字经济时代的新内生增长动力。

(二)政策建议

根据本文结论,可以提出如下政策建议:

第一,完善数字基础设施建设,畅通数据流动渠道。从硬件设施来看,应当围绕数据流动的关键环节,强化部署5G、IPv6等新一代通信技术,完善促进数据流动的基础设施建设。首先,数据流动增强了区域间联系,弥补现实空间单一距离联系的不足,克服时空障碍。在数字经济时代,远程办公、网络就诊、分布式生产等场景逐步进入生产与生活,这些场景实质是主体间通过虚拟的数据流空间的互动过程。完善基础设施,能够使数字经济时代人们的生产和生活不再受到地理距离的制约。其次,通过硬件建设畅通数据流通渠道,能够实现数据要素的有序流动,从而充分发挥数据流空间的载体功能,促进经济高质量增长,打造基于数据流动的新的内生经济增长引擎。从配套机制来看,建议完善数据要素市场,促进数据交易流通。在数字经济时代,数据交易是实现数据流动的重要方式。完善数据要素市场,鼓励以数据交易的方式实现数据的流通流动,能够发挥知识溢出效应,充分释放经济增长的数据红利。

第二,打造数字经济区域标杆,建设数据流动枢纽。中国的数据流空间的网络结构呈现出“核心-外围”特征,部分标杆区域成为数据流动的核心枢纽,支撑了整体的数据流动网络。因此,打造区域数字经济标杆,有助于增强核心节点对数据流空间的支撑作用,形成数据流空间的战略“支点”。在开展网络强国和数字中国的建设环节,应当从顶层统筹规划,“以点带面”,通过建设区域数字标杆,打造区域数据流动枢纽,引领和带动其他地区数字经济发展,支撑起整体的数据循环流动的大格局。目前,中国数字经济发展的龙头省份与城市已经开展了具有前瞻性和引领性的数字经济建设的工作,例如北京2021年提出建设“全球数字经济标杆城市”,《上海市全面推进城市数字化转型“十四五”规划》明确了上海要“打造国际数字之都”,广东省“数字湾区”建设行动正加速推进等。为推进网络强国、数字中国建设,要给予地方发展数字经济的财政、税收等政策支持。

猜你喜欢
数据流流动效应
铀对大型溞的急性毒性效应
懒马效应
汽车维修数据流基础(下)
流动的光
流动的画
一种提高TCP与UDP数据流公平性的拥塞控制机制
应变效应及其应用
为什么海水会流动
基于数据流聚类的多目标跟踪算法
流动的光线