政府行政大数据运用于统计精准调查的探索实践

2024-05-06 16:37
统计科学与实践 2024年1期
关键词:画像精准行政

□ 王 婧

调查研究是我们党的传家宝,是一代代中国共产党人从胜利走向胜利的谋事之基、成事之道。新时代新起点,调查研究更是被赋予了新的深刻内涵和时代要求,要充分发挥数字技术推进精准调查、深度研究,不断提升发现问题、分析问题、解决问题的准度、力度。2023 年3 月,中办印发《关于在全党大兴调查研究的工作方案》(以下简称《方案》),《方案》强调,要坚持因地制宜,综合运用座谈访谈、随机走访、问卷调查、专家调查、抽样调查、统计分析等方式,充分运用互联网、大数据等现代信息技术开展调查研究,提高科学性和实效性。当前,为全面提升统计数据质量,节约政府统计成本,行政数据在统计中的应用也越来越频繁。本文就行政大数据在统计调查领域中的应用及在精准调查中的应用效果进行探索分析。

| 行政大数据内涵及开放应用情况

在当今信息化时代,数据已经成为驱动社会发展的重要生产要素,全球范围内运用大数据推动经济发展、完善社会治理、提升政府服务和监管能力已经成为趋势。政府作为最大的数据生产者和拥有者,在其管理过程中产生的行政数据在社会大数据中占有的比重最大且权威性最高。

(一)行政大数据内涵

行政大数据是政府部门在行使其行政管理职能过程中,通过审批、注册登记等记录的大量信息数据。一是个人信息记录数据,包括户籍、卫生医疗保障、教育、就业等信息。上述数据记录主要由公安、卫生、教育、人力资源和社会保障等部门在其行使管理职能过程中产生并管理。二是单位信息记录数据,包括对企业、事业和机关等单位的注册登记记录,主要由市场监督、税务、民政和编办等部门产生并管理。三是自然和资源记录数据,包括气象、地震、土地、矿产资源、环境资源等信息,主要由自然资源、生态环境、气象、地震、海洋等部门产生并管理。四是其他管理记录数据,包括知识产权申报、进出口报关登记、出入境登记记录、资质评定、传感器记录等,由相关的知识产权、海关及资质评定等部门产生并管理。

(二)行政大数据开放应用情况

1.国外行政数据开放情况。全球开放数据运动始于美国。2009 年,奥巴马签署了《透明与开放政府指令》,之后美国政府“一站式数据下载”网站“data.gov”正式上线。这个新生网站从开始仅有47 组数据,27 个数据分析工具到2014 年达到了88421 个数据集,囊括了交通、经济、医疗、教育和人口服务等方面的数据,其中1279 个由政府提供,236 个由居民提供,103 个由移动设备提供。2013 年5 月奥巴马签署了《政府信息默认开放和机器可读行政命令》,政府需建立一套政策框架,促进数据的可操作性和开放性,提升信息资源的利用效率和利用价值。

同样,早在2009 年,英国在《智慧型政府的行动方案》中就把数据开放作为政府工作的重要内容,2009 年建立的“data.gov.uk”网站涵盖了七个政府部门的1000 多个对外开放有效数据集,目前已增至8633 个数据集。为了促进公共数据的开放和利用,推进公共数据开放的标准化工作,英国政府规定各领域政府部门需要公布政府绩效和用户满意度的报告,如2012 年正式开放的包括学生、教师、健康等国家学生数据库,帮助家长和学生更好监督学校的工作。

2.国内行政数据开放与应用情况。我国的行政数据开放正处于探索起步阶段,中国政府公开信息整合服务平台(govinfo.nlc.cn)和新版国家统计数据库(http://data.stats.gov.cn/)分别于2011 年10 月和2013 年9 月上线提供数据服务。目前,我国的行政记录数据广泛应用于政府统计工作中,主要包括直接应用、统计估算等。

行政大数据在直接应用中具体包含三个方面。一是统计产品直接取自同一行政记录数据源,不需要链接其他行政记录数据。实践中,直接使用行政记录数据进行统计的指标包括人口性别、年龄结构、建筑物与居住地等。二是利用行政记录数据生产新的数据。例如,利用居住地编码即可生产住户单位的数据,即在没有家庭信息登记记录的情况下,一个住户单位可以定义为拥有相同住址编码的人群,不论其是否有血缘关系。三是更新基本单位名录库。例如,利用省级统计机构定期获取的“五证合一”部门共享的企业(农民专业合作社)新增、变更登记信息,企业年报信息,以及异常名录和失信企业信息,维护更新国家统计系统中的基本单位名录库。

统计估算是指在无法通过一种行政记录数据源获得统计所需的指标数据时,就需要利用多个行政记录数据源进行估算。例如,在统计个人的主要经济活动时,单个数据源往往不全面,需要同时访问多个行政记录数据源,做到互相补充。例如,目前,住户统计中,尝试利用税务部门掌握的年收入额12 万元以上人群数量、平均申报收入额等数据,评估校验住户调查中高收入人群比例及其收入水平,为准确测算基尼系数提供校准依据。

运用行政记录数据,还可以对抽样调查数据的质量进行检验。首先,通过比较行政记录数据库与抽样数据,可以检验发现抽样调查中数据录入等错误;其次,利用行政记录数据可以对在调查中没有反馈以及缺失的调查数据进行较好补充。

此外,行政记录数据还可以分别用于结构性统计、变动性统计和密度统计等。

| 政府行政大数据运用于精准调查的可行性分析

2022 年,中央全面深化改革委员会第二十五次会议审议通过了《关于加强数字政府建设的指导意见》,指出需把数字技术广泛应用于政府管理服务中,推动政府数字化与智能化运行,提升政府公共服务质量,增强政府公信力,以人民为中心,建设人民满意的服务型政府。为检验政府工作成效,本文以群众获得感作为切入点,利用政务数据“画像分析”技术为群众需求“画像”,并从中提炼形成改革任务,打通堵点、连接断点、解决难点,最终提升民生福祉。

(一)基于政府行政大数据的画像分析

用户画像是真实用户的虚拟代表,是建立在一系列真实数据之上的目标用户模型。用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签,可以用一些高度概括、容易理解的特征来描述用户,不仅可以更容易理解用户,而且可以方便计算机处理。

数字画像分析是基于政务大数据中心汇聚的多方数据资源为数据支撑,聚焦自然人、企业等政务核心主体对象,构建低学习成本的集配即用数字画像配置平台,实现法人库、自然人库等基础库归集数据的快速透视、基础库数据分析应用的敏捷无代码快速构建,支持核心主体对象全维信息的深度洞察,可帮助完成各种业务场景驱动下的群体特征分析模型的构建、维护及快速图形化渲染,满足新时期基础库分析应用敏捷构建及应用频繁变更需求。

(二)依托画像分析的数据架构体系

1.自然人全息档案。以人口基础数据库作为支撑,通过自然人全维数据聚合、提炼、展示,构建自然人个体的全息特征画像。自然人单体画像主题分类应包括人员基础信息、财产信息、任职信息、投资经营信息、税费缴纳信息、关联关系、信用历史及家庭信息等。

2.企业画像全息档案。以法人基础数据库作为支撑,通过企业全维数据聚合、提炼、展示,构建针对企业个体的全息特征画像。企业单体画像主题分类应包括企业基础信息、经营情况、经营风险、资产信息、纳税信息、人力结构、能源消耗等。

(三)画像分析在统计调查中的优势

1.提高调查效率。政府行政大数据具有较强的时效性和准确性,可以快速获取所需信息,提高调查效率。通过画像分析,可以针对不同的调查群体设计不同的调查方案,从而避免无效的调查工作,提高调查效率。

2.降低调查成本。利用政府行政大数据进行调查,可以减少实地调查、问卷调查等传统调查方式的成本。通过对调查对象的深入分析,可以减少样本量,从而降低调查成本,同时提高调查结果的可靠性。

3.提高调查精度。政府行政大数据涵盖了多个领域,可以从多维度、多层次对目标进行深入分析,提高调查精度。通过对调查对象的特征进行详细描述和分析,可以减少数据采集和处理的误差,提高数据质量。

4.增强调查的针对性。政府行政大数据可以为政策制定提供有力支持,使政策更加符合实际需求,提高政策的针对性和实效性。画像分析通过对调查对象的特点、需求、行为模式等进行深入分析,能够为调查设计提供更准确的依据,提高调查的针对性和有效性。

5.辅助决策制定。画像分析可以为决策者提供更准确、更全面的数据支持,帮助其更好地了解调查对象的需求和行为模式,从而制定更符合实际情况的决策。

| 浙江行政大数据运用于精准调查的探索与实践

浙江省统计局着眼精准细化,以一体化平台为依托,聚焦“人”的特征和活动属性,综合利用行政记录、社会大数据等资源,统筹学历、就业、职业、收入和支出等信息,构建基本信息明确、工作信息清晰、收支信息客观的“全面覆盖+精准画像”基础数据库,探索利用算法模型实现对以“人”和“家庭”为单元的群体精准画像,为社情民意精准调查提供数据支撑。

(一)共富库实现精细画像

一是高度集成信息,打造共同富裕“基础数据库”(简称“共富库”)。依托浙江省一体化智能化公共数据平台,充分运用大数据、人工智能、移动互联等信息技术,创新完善统计调查方式,打破部门数据壁垒,统筹基本信息、工作信息、收支信息、家庭资产信息等,截至2023 年12 月中旬,共梳理33 个部门228 类数据资源,归集到位30 个部门213 类数据资源46.9 亿条,完成数据清洗39.4 亿条。按照“科学规范、高效动态、准确翔实、安全可靠”原则,建成全国首个动态更新,覆盖常住人口、企业和个体工商户等的基础数据库。基础数据库的建成,为统计调查提供了广泛的数据来源、强大的数据处理能力、直观的数据可视化结果以及开放透明的数据管理方式,有助于提高民意调查的质量和效率,推动民意调查事业的发展。

二是精准分类群体,绘制重点人群“基本特征图”。围绕共同富裕“扩中提低”对象开展研究,确定重点群体,进行概念界定,明确统计口径,建立包含学历、社保、职业、技能职称等的3 个一级标签类目、12 个二级标签类目、170 多个具体标签、超540 个标签选项的特征标签体系。目前,已基本摸清进城务工人员、科研人员等“扩中提低”9 类重点群体底数,从群体规模、地区分布、年龄结构、受教育程度等方面提炼群体基本特征,为“扩中提低”改革精准施策提供坚实基础。

(二)“浙江民调在线”实现精准推送

基于共富基础库打造的精准调查场景,“浙江民调在线”平台支持通过地区(颗粒度可到社区、村一级)、年龄、职业、性别等标签字段对调查样本进行精细画像,由系统通过可用不可见的技术根据样本画像需求抽取样本并通过短信平台进行精准推送,实现快速触达目标人群,大幅提升调查效率。同时与共同富裕·民情在线、智慧民生、统计e 家、统计地理信息系统、基本单位名录库等平台深度融合,为加速构建整体智治、高效协同的社情民意调查数字化工作新模式,提升统计调查能力和统计调查方式现代化提供强劲动力。

(三)精准调查实践成果

1.丰富了民意调查手段,极大提升了调查效率。“浙江民调在线”开辟了智调功能,丰富了调查手段,增加了调查灵活度,调查效率呈几何级增长。上线以来共采集成功样本1381 万余个,收集社会各阶层意见建议超过150 万条,为基层减负50 万人次以上。例如,为深入贯彻落实浙江省委、省政府关于实施营商环境优化提升“一号改革工程”的决策部署,反映企业对浙江营商环境的具体评价,了解企业面临的主要困难和意见建议,开展营商环境企业满意度调查,历时5 天,涵盖不同地区、不同行业、不同规模和不同经济类型,定向收集有效样本企业5981 家,获取企业关于营商环境各类诉求、意见和建议共2295 条,获评实施三个“一号工程”典型案例。

2.实现了重点群体多维度分析,为精准施策提供有力支撑。利用“浙江民调在线”平台针对浙江省低收入农户、个体工商户、高校毕业生、新就业形态从业人员(包括网约车司机、外卖小哥、快递员)等“扩中”“提低”重点群体开展专项调查,了解重点群体现状及需求,分析当前重点群体综合帮扶政策存在的问题,实现帮扶策略的个性化和精准化,为政府部门决策提供有效实践指导,为实现共同富裕提供有力数据支撑。

3.重塑了民意调查体系,为国家层面工作推进提供浙江经验。浙江先行先试,改被动收集为主动汇集,变群众观望为群众感受,重塑了社情民意调查工作体系。基于精细画像、精准推动、智能排重等打造的智调功能为国家统计局相关应用开发提供了浙江思路。依托应用开展的全国群众安全感线上调查案例成为国家统计局开展相关工作的重要参照。

| 行政大数据应用于政府统计调查存在的问题与对策建议

(一)存在的主要问题

一是数据收集和整合困难。行政大数据的来源广泛,包括政府各部门、企业、社会组织等,数据类型和格式多样,给数据收集和整合带来了一定的困难。同时,由于数据标准不统一、数据质量参差不齐等问题,也增加了数据整合的难度。

二是数据更新不及时。基础数据库的数据质量和价值会随着时间的推移发生变化,如果不能及时更新,那么基于这些数据做出的决策就可能过时或错误,动态更新数据库对于提高决策的准确性和效率具有重要意义。

三是数据分析和利用能力不足。行政大数据的数据量庞大,需要专业的数据分析工具和方法进行挖掘和分析。然而,目前政府统计部门在数据分析和利用方面还存在一定的不足,缺乏足够的技术和人才支持,无法充分发挥大数据的价值。

四是法规和政策不完善。目前关于行政大数据的法规和政策还不够完善,缺乏明确的规范和标准。这导致在数据收集、存储、使用等方面存在一定的法律风险和政策不确定性,给政府统计调查工作带来了一定的困难。

(二)对策建议

一是加强数据共享和服务意识。要健全部门联动的数据样本库,推进部门行政记录信息互联互通,提升数据整合能力,推动数据规范化共享。建立统一的数据标准和规范,保证数据按照特定的技术标准和要求进行一致化处理,确保数据的完整性和准确性,全面提升信息化水平。

二是建立大数据动态更新机制。实现数据动态更新有利于保持行政大数据的时效性和代表性,能更好地反映当前的社会、经济、科技等方面的变化,对于提高决策的准确性和效率具有重要意义。动态更新基础数据库需要定期维护,不断优化数据库的结构,包括数据分类、标签设置、数据存储方式等,保持数据库多样性,同时应当通过建立反馈机制和定期评估调整等措施,提高数据库的管理效率和数据质量。

三是加大人才培引力度。发挥行政大数据作用,需要具备较高的数据分析和挖掘能力,高层次科技和管理人才队伍建设是重要一环。要引进和培养大数据统计应用人才,组建涵盖统计方法、数据科学、信息技术等专家的大数据统计应用研究团队,分工协作,联合攻关。同时,整合现有统计人才资源,创新工作模式,加强统计人员信息化培训和能力提升,将大数据、人工智能等技术与日常统计工作相结合,全力打造学习型、服务型、创新型统计人才队伍。

四是完善大数据安全保障机制。随着大数据广泛使用,个人隐私和数据安全面临挑战。因此,需要完善和规范相关法律法规来保障大数据的安全。政府有关部门应借鉴现代科技手段,结合内部数据防泄漏管理长效机制来防止数据泄露,利用人工智能身份识别认证数据管控技术与加密、隔离等技术相互结合,共同防止敏感数据的泄露与扩散,对个人敏感数据进行匿名化处理,有效防止个人及企业的内部敏感数据泄露。

猜你喜欢
画像精准行政
行政学人
威猛的画像
“00后”画像
精准防返贫,才能稳脱贫
画像
行政调解的实践与探索
精准的打铁
精准扶贫 齐奔小康
精准扶贫二首
行政为先 GMC SAVANA