大数据时代“平安中国”建设的新思考
——以犯罪数据公开为例

2021-01-30 01:16范淼任海月

山东警察学院学报 2021年6期

范淼，任海月

(辽宁大学法学院，辽宁沈阳 110031)

依托大数据进行犯罪防控成为大数据时代保障社会稳定、安全的重要着力点。全国公安机关在社会治安防控体系建设推进过程中，要牢固树立大数据理念，以大数据、信息化促进治安防控的质量变革、效率变革、动力变革，推动数据警务、智慧公安建设提档升级。公安机关要把大数据作为推动公安工作创新发展的大引擎、培育战斗力生成新的增长点。在此基础上，各地公安机关积极进行各类数据库的搭建，广泛采集人口、住宿、寄递、交通等业务相关信息，在指纹、DNA、Y-STR、视频监控、车辆管理以及流动人口管理等方面形成了较为成型的数据系统，并初步实现了各业务数据网络的连通。[1]

要以人民为中心，一切为了人民、一切依靠人民，动员全社会共同防范化解各类安全风险。为了建设更高水平的“平安中国”，需要进一步发挥人民群众的主体作用，可以总结疫情防控中联防联控、群访群治等经验，搭建群众参与“平安中国”建设的平台和载体，强化全社会广泛参与“平安中国”建设的积极性。[2]笔者认为，在大数据时代，犯罪数据公开可以成为强化全社会参与“平安中国”建设的着力点。公民通过公开的犯罪数据可以了解全国及周边的犯罪情势，从而提高自觉防控犯罪的意识，能有针对性地采取对应的防控措施。这可以极大提高犯罪防控的成功率，进而稳固“平安中国”建设的根基，提升人民的幸福感和安全感。除此之外，通过犯罪数据公开，可以充分发挥媒体和公众的监督作用，减少公权力机关在进行犯罪治理过程中滋生的寻租和滥用职权等行为，从而能够更好地开展防控犯罪活动。

但是，我国当前犯罪数据公开存在全面性不足的问题，无法有效支撑公众自主预防的需求。为使公众明晰周边的犯罪具体情况和发展趋势，从而有针对性地进行自主预防，进而提升整个社会的犯罪防控效果，需要深入分析犯罪数据公开全面性不足问题的症结所在。在犯罪数据公开时应针对问题对症下药，以完整的数据库和完善的制度、技术作为保障，构建公民私利保护和犯罪防控的二元并重格局。

一、犯罪数据公开的现状及问题

(一)犯罪数据公开的现状

本文讨论的数据既包括刑法学意义上的犯罪数据，也包括具有社会危害性但尚未达到应受刑罚处罚程度的治安案件数据。犯罪数据的公开主要分为两个阶段，第一个阶段为司法公权力机关犯罪数据库的构建阶段，主要是对公开数据进行收集和整理，要保证能够收集和整理到充足的犯罪数据；第二个阶段为司法公权力机关将数据库中的犯罪数据公开，使公众获知相关数据的阶段，本阶段要保证犯罪数据充分公开。

目前我国进行犯罪数据公开的司法公权力机关主要为法院、检察院和公安机关。其所公开数据的来源数据库主要由四个部分的数据组成，分别为该司法公权力本身所掌握的犯罪数据，企业所提供的犯罪数据(如电商平台移送的涉电商平台的违法犯罪线索)，公民所提供的犯罪数据(如被害人报案)，以及其他公权力机关移送的犯罪数据。

司法公权力机关将所收集的这四部分犯罪数据进行汇总整合后，向公众公开。公民可以从经整合后公开的犯罪统计数据和犯罪个案数据中获知犯罪情况。其中，犯罪统计数据是指，专门的犯罪统计工作机关在对大量犯罪个案数据调查、汇总、分析的基础上形成的具有宏观性的有关犯罪问题的数据。[3]其主要见于法院和检察院的工作报告、《中国统计年鉴》、地方统计年鉴、《中国法律年鉴》和地方法律年鉴中。犯罪统计数据的公开基本上仅是对传统重点罪名(如盗窃罪、故意杀人罪等)以及年度热点犯罪(如涉疫犯罪、涉黑涉恶犯罪、网络犯罪等)进行统计并公开，且仅是公开批准逮捕人数、提起公诉人数、案件数量同比上升或下降的百分比等，犯罪数据具有一定的局限性和笼统性。犯罪个案数据，即每一件单独独立的犯罪案件的相关数据。其主要见于“中国裁判文书网”中公开的刑事判决书和公安机关的警情通报。虽然“中国裁判文书网”公开的内容更为详实、具体，但是主要依赖法院的主动发布，导致其公开的个案数据具有局限性。有学者指出，“裁判文书网所收集、整理、统计的数据往往并不能称作‘法律大数据’，甚至有时数据质量可能还不如抽样调查中的‘代表性数据’。”[4]公安机关的警情通报大多较为简略，并且在公开犯罪情况时可能存在一些不便公开的情况，公众对于个案的知情权得不到充分满足，无法显著降低公众受侵害的风险。总体来讲，目前的犯罪数据公开还无法使公民把握犯罪的准确样态及全貌，也无法使其基于此进行精准的自主预防。

(二)犯罪数据公开的问题——全面性不足

从犯罪数据公开现状来看，我国目前犯罪数据公开存在全面性不足的问题。

从公开的数据角度来看，可公开的犯罪数据量不足。其一，公检法三机关并未建设统一的犯罪数据库，而是各自进行犯罪数据公开，导致其各自公开的犯罪数据出现遗漏或重复。其二，在域外，通过刑事司法外的机构获得的数据来预测某些犯罪趋势的可能性已经被发掘出来。[5]而在我国，这仍处于发展阶段。数据公开更多依赖官方数据而相对忽视公民、企业等主体掌握的犯罪数据，后一类数据并未被全面纳入到犯罪数据公开范畴，导致犯罪数据量缺失。

从数据公开角度来看，公权力机关是有选择地公开犯罪数据，而非全面公开犯罪数据，犯罪数据公开不充分。以裁判文书公开为例，《最高人民法院关于人民法院在互联网公布裁判文书的规定》第4条、第6条、第7条均体现了人民法院在互联网公布裁判文书时，为保护公民隐私而不全面公开案件的要求。另外，公权力机关还未重视公开没有刑事违法性的具有严重社会危害性的行为。“治安案件未能纳入公开范围，鉴于犯罪黑数的漏斗效应，比犯罪数据更为庞大的治安案件数据更有参考价值。”[6]在犯罪学视野中，最重要的是犯罪的“实体”，而不是规定这种“实体”的刑法。[7]虽然治安案件较刑事案件危害轻微，但却能直接影响公民的生活安宁和社会稳定。

二、犯罪数据公开全面性不足的原因

如前所述，目前我国犯罪数据公开存在全面性不足的问题，该问题直接影响我国以犯罪数据公开助力“平安中国”建设的目标实现。造成该问题的原因在于，首先，掌握犯罪数据的各主体之间存在数据壁垒，数据间缺乏关联性，可公开的犯罪数据量不足。其次，为防止公民的隐私和自由因犯罪数据公开而被侵害，公权力机关有选择地公开犯罪数据，而非全面公开犯罪数据，导致犯罪数据公开并不充分，不足以让公众了解犯罪全貌。

(一)可公开的犯罪数据量不足的原因——“数据孤岛”的存在

笔者认为，数据共享是大数据治理的一个基本前提，大数据治理必须保证海量数据的供给。“数据是大数据运转的基础，广泛的数据来源使大数据分析结果更加精确。”[8]在全国范围内，数据共享工作正如火如荼地展开。通常采用“构建数据共享交换平台、建立大数据产业标准、开发区块链技术、改进数据运输技术等措施来破解数据孤岛”[9]。例如，自新冠肺炎疫情爆发以来，全国各地实时共享交通、通信、医疗等多部门信息，增强了政府对有关情况的预警和响应能力。再如，多地成立大数据部门，推进政务数据共享、归集与交换。我国在打破数据孤岛、促进数据共享方面出台了多部法律法规及规范性文件，如《国家电子政务总体框架》《政务信息资源目录编制指南(试行)》《个人信息保护法》《数据安全法》等。可以看出，我国数据共享在技术和制度维度上均趋于完备，目前更重要的是推进犯罪数据共享的落实。在犯罪数据共享的落实上，主要涉及三大主体——公权力机关、企业、公民。公权力机关之间的犯罪数据共享涉及网信、工信等多个部门，但缺少有针对性地推进数据开放与共享的专门协调工作机构。[10]另外，政企数据和政民数据的共享和整合仍处于发展阶段。从犯罪数据共享实践来看，共享大多还停留在较低的水平上，难以为群防群控提供全面且有效的信息。

首先，在公权力机关中，尽管大多数公权力机关已初步实现了云办公、信息化办公，但是各系统之间的数据孤岛问题仍然存在。各部门之间的数据上下纵向共享通道已基本实现畅通，信息化建设取得了一定成效。但从横向上来看，审判数据、公诉数据、立案侦查数据仍由公检法三机关各自掌握，缺乏相互之间对犯罪数据的充分交流和沟通。在实践中，公安机关如果想要查阅某一犯罪嫌疑人的犯罪记录，虽然公安机关内部的有关平台也保存有部分信息，但对于该犯罪嫌疑人的刑罚记录仍需公安机关向法院、监狱等部门调取。并且，侦查、起诉、审判的标准不同，各地根据经济社会发展水平等因素设定的相关标准也略有不同，对三机关之间的数据共享也造成了一定阻碍。

其次，在公权力机关与企业之间数据共享方面，很多企业掌握了海量的公民个人信息和网络行为数据，这些数据对犯罪治理大有裨益。目前，企业和公权力机关的数据共享主要体现在，若社会治安防控有需要，公安机关针对个案可在案发后临时调取企业数据，或者企业不定期向公安机关移送违法犯罪线索。例如，阿里集团每年向公安机关移送涉电商平台的违法犯罪线索超过一万条。[11]虽然该做法实现了企业和公安机关的初步数据互通，但有关企业移送的犯罪线索对于整体犯罪治理来说仍是零散的、迟延的、不连续的。笔者认为，并不能将此种被移送的犯罪线索称为大数据犯罪防控中的“数据”。大数据分析可以满足数据量大、数据类型广泛、数据处理速度快的要求，实时分析是大数据分析的一项突出特色。例如，通过搜索引擎的热点搜索或者社交网络中频繁关系等内容可以实时获知网络动态。[12]虽然实时分析并不是大数据技术的唯一特点，但是该特点在犯罪防控领域不可或缺。以目前开展的电信网络诈骗犯罪预警平台建设为例，互联网科技公司通过与公安等部门合作研发预警平台，实时为公安机关推送涉电诈预警信息，助力公安机关及时进行电信网络诈骗预防和反制。

最后，在公权力机关与公民之间的数据共享方面，一些公民手中掌握有犯罪数据，但未提供给公权力机关。在世界范围内广泛存在因被害人不主动报案而产生的犯罪黑数问题。据调查显示，2004年，美国50%的暴力犯罪和61%的财产犯罪的被害人没有向警方报案。[13]因此，多国广泛开展被害人调查，以统计警方未记录的犯罪数据。该调查数据在决策部门、犯罪学家等处获得了广泛的关注，并且在警察力量部署和犯罪水平分析方面发挥了重要作用。[14]我国并无类似的收集公民所掌握犯罪数据的制度设置，无法补充这部分犯罪数据量，更遑论将此类数据公开了。

所以，加快数据共享方面的制度落实，实现技术手段和制度手段相辅相成，推动公权力机关之间、公权力机关与企业之间、公权力机关与公民之间的数据共享，对打破犯罪数据孤岛困境具有重要意义。

(二)犯罪数据公开不充分之原因——防止公民的隐私和自由被侵害

大数据时代，数据的价值不再单纯局限于初始用途，而更多源于对数据的反复挖掘和二次利用。[15]对犯罪数据的反复挖掘和二次利用主要体现在，依托大数据分析技术，对海量的犯罪数据进行分析、提炼、整合，进而洞察犯罪全貌和发展趋势，以此对特定的潜在违法犯罪行为进行预测，并对可疑人员和行为进行提前监控和干预，最终达到以大数据进行犯罪预防的目的。诚然，一旦犯罪数据全面公开，数据主体的隐私和自由在客观上将面临受侵害危险，数据主体也会因主观自我保护意识而抵触犯罪数据公开。这是公权力机关必须考虑和解决的问题。

1.客观原因——公民隐私和自由遭受侵害危险

在大数据时代，人们最担心的问题即个人隐私泄露和因此带来的自由丧失。一方面，侦查机关等公权力机关借助先进的技术手段，收集并储存了大量人像、身份、生活轨迹、犯罪等数据，这些数据足以在大多数场合精确识别个人。在刑事司法领域，这种个人信息权和公共安全之间的紧张态势更为明显。[16]另一方面，网络时代的到来使得个人隐私和自由产生了新的危机，网络时代在传统社会“国家—公民”的互动中新增了互联网企业，其在公民使用网络过程中收集并储存了大量公民个人数据，其中不乏犯罪数据。在刑事司法实践中，企业基于其数据提供的义务，依据公权力机关的要求履行了相关数据提供义务。这使得普通公民在要求公权力机关依法收集相关数据的同时，还需防范第三方主体对个人数据的非法获取。在大数据时代，公民的个人数据在国家和互联网企业面前无所遁形，隐私权的范围受到压缩，很多信息在很大程度上处于公开或半公开状态。[17]若将大量犯罪数据公开，则公民的相关关切需要得到有效回应。如果任何人均可以对公开的犯罪数据进行反复挖掘和利用，则数据主体的隐私和自由将面临更复杂的保护和侵害局面。

2.主观原因——公民的自我信息保护意识

人们对于被时刻收集个人数据尚且存在着恐惧和不信任，更不用说为了大数据犯罪防控的需要而将某些数据公开了。由于无处不在的数据收集和利用，公民的隐私和自由受到侵害威胁。所以，在传统法律框架中，个人信息保护和数据利用主要是从用户角度出发，将个人信息限制于隐私权或者人格权之中。立法政策倾向于对个人信息提供严格的保护，只在“知情—同意”基础上，允许数据业者收集、加工和处理用户数据。[18]传统“告知—同意”模式来源于“理性人”理念，将个人数据问题视为个人控制、个人选择和个人责任的问题。[19]然而，犯罪治理问题对于普通公众来说是复杂的，大数据犯罪防控问题则更加难以理解，在这个前提下公众还能保持“理性人”地位吗？“理性人”概念来源于古典经济学，后产生的行为法律经济学通过对真实世界中人们行为的研究，对“理性人”假设提出大量质疑。在真实世界中，“框架效应”(问题提出的方式往往会对结论产生影响)、“禀赋效应”(更珍惜自己所有的东西)、“现状偏好”(除非有特别强的吸引力，一般不愿意改变现状)等理论更具有现实基础。[20]笔者认为，基于上述理论可推知，一些群众在被告知自己的数据将被收集、共享、保存、分析、公开，以用于大数据犯罪防控时，可能会基于认为与自己无关、对现状满足、会对个人权利造成妨碍等考量而产生抵触情绪。若任由此种消极态度发展，将严重影响犯罪数据全面公开制度的有效建立和实施。

在大数据时代，数据安全是头等大事，《数据安全法》《个人信息保护法》等法律为数据保护提供了规范依据。也应当承认，在大数据犯罪防控下，犯罪数据溢出私人范畴，具备了公共属性。但是，贸然进行犯罪数据全面公开，尤其是对传统未公开的轻微治安案件数据进行公开，将威胁数据主体的自由和隐私等权利。在犯罪数据公开的推进过程中，不可忽视的是如何公开才能平衡犯罪治理和公民自由、隐私保护之间的关系。

三、犯罪数据公开的完善路径

犯罪数据的全面性对保证群防群控效果至关重要，海量犯罪数据宏观上可以体现我国犯罪整体概况，微观上可以显示每个公民个体周围的犯罪情况，将这些数据公开有利于全社会参与犯罪治理。虽然犯罪数据公开对公民隐私和自由的确造成了一定风险，但是我们仍需积极追求在控制风险的基础上充分公开犯罪数据。

(一)打破“数据孤岛”

前文已经提及，目前犯罪数据基本上独立掌握在各个公权力机关、企业和公民手中。为了更好地进行犯罪数据公开，有必要打破各主体之间的数据壁垒，以数据共享打破“数据孤岛”，打造尽可能全面的犯罪大数据库，为犯罪数据全面公开奠定稳固的数据基础。笔者认为，犯罪大数据库应当以公权力机关所掌握的犯罪数据为主要数据来源，以企业和公民所掌握的犯罪数据为辅助数据来源。同时，应设立犯罪数据专门协调机构，将不同主体共享的数据校准、整合后纳入犯罪大数据库。

1.打破公权力机关之间的“数据孤岛”

各公权力机关之间的犯罪数据共享障碍最小。由于公权力机关具有公共管理的职能，在公权力机关之间共享数据相比之下更加规范，数据泄露的风险也最小。因此，不管是在技术层面还是在制度层面都更容易建立数据共享体系。

首先，制定完善的数据共享相关法律规范，使公权力机关之间数据共享各环节均有法可依。有关法律规范要明确公权力机关间“以共享为原则、以不共享为例外”的基本态度。在犯罪学领域，不论进行理论研究还是在实践中预防犯罪和打击犯罪均更多依托实证化研究，大数据技术的飞速发展是犯罪学实证化研究走向新阶段的一个契机。在风险可控的情况下，公权力机关需要尽可能多地掌握犯罪数据，并以此作为实证研究和科学分析的参考，进而对犯罪态势、犯罪规律、犯罪理论有更为全面、清晰的掌握。除此之外，在共享程序、法律责任等方面也均应作出明确的法律规范。

其次，应当在现有大数据平台上完善数据共享功能。各地方警务云、智慧法院、智慧检务、电子政务办公系统等平台的建立，为数据共享提供了系统基础，在技术上“只需将各属数据系统打通并完成对接即可进行数据共享”[21]。

最后，应当建立针对犯罪数据共享的专门协调机构。由于侦查、起诉、审判的相关标准不同，且各地标准也存在差异，需要由专门协调机构对不同来源、不同标准的犯罪数据进行整合、校准、分类，保证三机关之间数据共享的顺利进行。

2.疏通公权力机关与企业之间的数据传输通道

在赋予企业一部分公共管理参与职能的同时，需要公权力给企业相关行为套上规范的“枷锁”。公权力机关和企业对公民数据的利益诉求不同，公权力机关对数据的利益诉求表现在社会管理效益方面，企业的诉求表现在追求商业利益方面。[22]二者收集和处理数据的权限不同，数据主体对二者的接受度也不同。由于企业追求利益最大化，在公权力机关与企业合作进行大数据治理时，公权力机关应当对企业的数据收集和共享进行规范和监督。

首先，为了使企业参与到犯罪治理中，需要赋予企业一部分公共管理参与职能，在其职能范围内疏通企业与公权力机关之间的数据传输通道。目前，部分企业已经顺应政府的引导，将日常经营中发现的违法犯罪线索上报给有关机关，初步履行了公共服务义务。但是，为了满足大数据犯罪防控的预测性、执法的实时性和有效性要求，应当建立数据共享体系，使公权力机关能够及时锁定犯罪线索。企业共享犯罪数据并不存在较大的技术难题，目前的重点应当放在国家对企业的政策引导、规则制定、支持、督促及行政处罚等法律监管活动上。[23]

其次，由于平台企业与用户直接对接，平台企业会掌握大量用户的偏好、住址、出行等个人信息，要提防公共管理参与职能外溢至企业之后，企业以此为挡箭牌而忽视对公民权利的保护。所以，在相关规范的制定上，“应当采取‘共享为原则，保护为底线’的立法理念。”[24]在大力推进犯罪数据共享、破除公权力与企业之间数据壁垒的同时，要以保护公民的隐私权和数据安全作为数据共享的“底线”，严禁借助数据共享之名行侵犯公民隐私之实的行为，为数据共享划定必要的禁区和红线。企业是实现犯罪治理目标的组织形式和技术形式[25]，应对企业收集和共享数据行为进行监管。如《个人信息保护法》第60条规定，国家网信部门及政府有关部门为履行个人信息保护职责的部门，在各自职责范围内负责个人信息保护和监督管理工作。《数据安全法》第6条要求各地区、各部门承担本地区、本部门工作中的数据安全监管职责；工业、电信、交通、金融、自然资源等主管部门承担本行业、本领域数据安全监管职责；公安机关、国家安全机关等在各自职责范围内承担数据安全监管职责；网信部门负责统筹协调和相关数据监管工作。

最后，为了保护公民的隐私权和数据安全，应当建立风险评估部门，以检验企业收集数据和共享数据的风险是否可控，需通过立法规定由专门的政府机构或者第三方机构承担风险评估职责。应当注意的是，风险评估应是一个动态的过程，主要包括事前风险预防和事后风险评估。一方面，检测已有的风险预防措施是否仍然适当或有效；另一方面，检测是否出现新的风险。[26]

3.激发公民共享犯罪数据的意愿

公民也是数据共享的主体，如被害人、目击者及加害人等。但是相比于公权力机关和经授权的企业，公民的自由度更高，随意性更大，很难用制度进行全面、具体约束。塑造参与型公民首先应当保证充足的犯罪数据供给，使公众对刑事政策目标作出正确判断，从而在感情上形成趋同。在此基础上，引导公众熟悉和了解自己可以通过哪些途径实现有效的参与，从而使其对刑事政策过程的各个方面都表现出高度的参与热情[27]，进而激发公众共享所掌握犯罪数据的意愿。以反电信网络诈骗预警机制为例，很多公民安装了国家反诈中心APP。该APP可以在公民接收涉诈电话或下载涉诈APP时自动或由人工对该公民进行预警提醒，防止公民遭受财产损失。越来越多的公民因为及时收到预警信息而避免了财产损失，其对通过该APP的举报功能与公权力机关进行涉诈线索共享也更有积极性。

(二)在控制风险的基础上充分公开犯罪数据

为谋求社会福祉而使得个人利益遭受巨大风险不是优质社会管理和运作的追求目标。笔者认为，应合理控制犯罪数据公开时客观存在的公民隐私和自由被侵犯的风险，在此基础之上，遵循新“告知—同意”思路以弥补公民理性不足的缺陷。

1.针对客观风险——构建去标识化标准

在利用犯罪数据进行自主预防的过程中，公众对数据主体的信息利用甚少，其关注的重点在于全国或周边的犯罪状况以及犯罪趋势。个人信息以可识别性为核心，要推进犯罪数据全面公开就应当对个人敏感信息进行去识别化处理。去识别化主要包括数据去标识化和数据匿名化两大途径。通过弱化个人数据的可识别性，可以避免个人数据主体身份暴露，有效实现隐私信息保护和数据价值挖掘之间的平衡。[28]我国2021年实施的《个人信息保护法》第73条界定了相关概念，即去标识化是指，个人信息经过处理，在不借助额外信息的情况下无法识别特定自然人的过程；匿名化是指，个人信息经过处理后无法识别特定自然人且不能复原的过程。

(1)匿名化标准存在现实难题。我国《个人信息保护法》第4条规定，个人信息是以电子或者其他方式记录的、与已识别或者可识别的自然人有关的各种信息，不包括匿名化处理后的信息。从该条规定可以看出，被匿名化处理后的信息得到了《个人信息保护法》的豁免。欧盟《通用数据保护条例》(GDPR)中的相关规定也体现了这一内容。这种立法路径要求在数据处理中对匿名化设定严格的标准。笔者认为，这种严格的、受数据保护规范豁免的匿名化处理路径在犯罪防控领域能发挥的作用值得商榷。

首先，绝对的匿名化可以实现吗？世界范围内几乎所有的关于匿名化的规定都大致表达了类似内容，即任何人均无法识别到个人或重新复原已匿名部分。然而，数据的绝对匿名在技术语境下不可能实现，因为依赖技术实现的匿名化状态，理论上仍然可为技术所破解与还原。[29]例如，2019年，瑞士苏黎世大学的研究人员通过人工智能和大数据的协同技术，把匿名记录和其他公开的信息相联系，成功在一个小时之内识别出了瑞士最高法院84%的参与案件。[30]实践中的匿名化状态就与制度上的匿名化规定产生了冲突，制度上的绝对匿名化在客观上无法实现。有学者对此表示，通常难以判定匿名化究竟能否使特定信息彻底丧失识别能力，必须抛弃对信息的绝对安全状态所持有的幻想，适度容忍因信息流动与使用所产生的风险，将风险持续控制在可接受的范围之内即可。[31]但是，笔者认为，如果该措施仍含有风险，就不能算是在数据保护规范上豁免的匿名化措施。所以，应当认为，法律规定中的匿名化措施在客观上难以实现。

其次，匿名化犯罪数据公开能否显著提升大数据犯罪防控效果？前文已经提到，在大数据犯罪防控中，犯罪数据的价值来源于对数据的反复挖掘和二次利用。例如，可以根据某个体的行动轨迹、过往违法犯罪经历、行为特征等因素进行综合分析，得出各因素之间的相关性，从而基于大数据算法得出该个体进行越轨行为的解释性和预测性结论。“建立在相关关系分析法基础上的预测是大数据的核心。”[32]每个个体一生都在活动之中，因此个体数据也在动态变化之中。那么，若每个个体的数据经过匿名化处理之后，任何人都无法对已有数据进行重新识别和复原，则该个体的新数据就无法关联到已有数据之中。如此，相关关系分析法不仅无用武之地，对数据的反复挖掘和二次利用也无从谈起，无法实现大数据犯罪预测的目标。隐私和数据的有用性在根本上存在冲突，完全匿名化可以完美保护隐私，但是毫无有用性。[33]所以，为了保证犯罪数据公开在犯罪防控中的效果，保证所公开犯罪数据的有用性，“匿名化”数据必须是“不完美匿名”[34]，在本文看来即去标识化。

最后，匿名化的简约化处理倾向是否降低了相关主体的责任？简约化处理倾向就是，“意欲通过匿名化处理一刀切地斩断个人信息与信息主体间的所有关联，从而达到一劳永逸的效果。”[35]笔者认为，这种倾向会导致数据的可识别化风险上升。众所周知，世界正处于科技飞速发展的时代，再识别技术也是处于不断更新迭代的过程之中，已有的匿名化防线随时可能被突破。“在这种背景下，数据控制者就通过‘匿名’而回避了应该承担的诸多法律责任。”[36]

因此，笔者认为，虽然各国均有数据匿名化处理的相关规定，但是在犯罪防控领域，犯罪数据匿名化的意义实在有限。

(2)应构建数据公开的去标识化标准。为了更好地发挥犯罪数据公开在犯罪防控领域的作用，有必要加强对去标识化措施的技术和制度建设。去标识化是指，一个通过技术处理去除目标数据集中定量识别属性和数据主体之间关联，并搭建充分防御重识别壁垒的过程。[37]去标识化措施能够解决上述匿名化的诸多难题，并能够协调数据利用和数据保护之间的关系。

其一，相较于绝对匿名化的技术难题，去标识化在客观上更容易实现。 “目前常用的去标识化技术主要有：统计技术、密码技术、抑制技术、假名化技术、泛化技术、随机化技术、数据合成技术、K-匿名模型和差分隐私模型九类。”[38]虽然各类技术略有差别，但去标识化在实践中具有相当大的可行性。其二，去标识化有助于大数据犯罪防控，且符合大数据技术的核心。即便相关犯罪数据已经进行了去标识化处理，但是该数据仍保留有再识别和复原的可能，这些历史数据仍可以与新数据产生关联关系，从而有助于预测性执法的实现。并且，去标识化与匿名化在大数据犯罪防控上有一个明显不同，匿名化更强调抽象化的群体预设，如公开的犯罪地图显示哪些地点具有高犯罪发生率，哪些地点需要重点布控等；而去标识化更强调独异性的单体预设，在数字技术支撑下，犯罪人不再是无差别的抽象均值人，而是能够通过数据彰显差异的微粒人或单体人。[39]在大数据犯罪防控下，更为精准的预测性执法显然是发展方向，而具有可逆性的去标识化处理顺应了这一发展方向。其三，去标识化处理不仅没降低反而强化了相关主体的责任。去标识化处理相比于匿名化保有了再识别和复原的可能性，因此经过去识别化的数据并不能被排除在数据保护法规的规制范围之外。借助这些数据的公开，政府允许公众在掌握这些数据的基础上，通过各种工具和算法进行有用信息挖掘及分析，针对数据分析中发现的问题向犯罪防控机构提出质疑和问询。[40]该过程在数据处理职责上对相关公权力机关和其他数据处理主体都赋予了更高的要求和责任，这是相关主体在享受数据公开对犯罪防控带来助力时必然带来的要求和责任，也是个人数据保护和数据利用并重的二元格局的必然要求。

首先，不能忽略犯罪数据公共属性和个人属性并存的特征，再加上去标识化固有的风险，在数据公开之前有必要进行风险评估工作。“明确个人信息处理者在去除直接识别符的情形下有条件豁免知情同意的前提是处理者综合考量了个人信息类型与敏感程度、数据集流转方式与目的、避免再识别的技术和协议保障等。”[41]在风险评估过程中，要强调社会参与力量，犯罪数据公开绝不能仅仅是单主体决定格局，而应当是多主体充分参与。犯罪数据公开有助于“平安中国”建设，而去标识化是化解数据公开风险并使其转化为社会福祉的重要措施，全社会共同参与的风险评估不可谓不重要。可以借助互联网技术打造“跨边界智库平台”，积极吸纳并鼓励各领域专家学者、行业经营者、基层技术人员等具有不同专长的人员对相关措施的合法性、可行性、必要性进行调查并提出建议，形成风险评估报告和技术、政策建议。[42]

其次，去标识化措施涉及的技术和算法要严格保密。去标识化和重识别化技术一定要保证掌握在数据管理者手中，犯罪数据公开的对象只能对经过处理的数据进行查询和利用。数据管理者可以使用不同技术对原始数据进行处理，在不提供原始数据的前提下保证所公开数据的可用性。根据技术原理的差异，可将去标识化技术划分为三类：数据通过变形、增加噪音、转化参数等增加隐私性；数据以敏感信息加密形式公开，只有借助经授权的应用程序才能予以解密；数据经安全算法加密转化后向外提供。[43]如此，既能够保证任何数据公开对象对已公开犯罪数据进行充分利用，也能够保证数据主体的个人权利。

最后，去标识化一定要遵循动态发展的思路进行，根据数据所处的环境不断完善和更新，避免简约化处理倾向。经过去标识化处理的犯罪数据应当长期留存，因为大数据犯罪防控要求对数据进行再挖掘和再利用，这需要立足于海量的数据聚集和沉淀。有些数据可能在当下看起来无价值，但是仍然可能与新数据产生关联，重新产生利用价值。这也是数字化时代公共管理从“单次闭环之治”转向“累进循环之治”的趋势体现，即数字化时代的社会治理不再是在某次监管或执法结束后相关数据就失去了治理价值的“单次闭环之治”，而是在向上一次监管执法结果能够作为后续监管执法的数据支撑的“累进循环之治”转型。[44]所以，为了防止长期留存的已经经过去标识化处理的数据因科技进步而增加隐私信息泄露的风险，技术掌握者要遵循一个理念，即在信息科技迭代下，去标识化技术呈现出相对化和流动化趋势，并无整齐划一的绝对答案[45]，要根据认知能力、科学技术等相应环境的改变更新迭代。

虽然去标识化相比于匿名化具有更大的风险，但是在犯罪数据公开势在必行的情况下，我们需要通过构建更加完备的去标识化技术和制度响应犯罪数据公开的浪潮。笔者认为，去标识化并不意味着经过处理的数据被再识别的风险为零，我们能做的是通过充足的准备将该风险降到最低。

2.针对主观自我保护意识——遵循新“告知—同意”思路

客观上可以以去标识化控制犯罪数据公开给数据主体带来的隐私和自由方面的风险，在此基础上还应缓解公民的强烈自我保护意识。随着社会治理体系和模式的不断发展，数据也开始具有了公共属性。传统个人信息保护框架已经无法适应大数据时代下的社会治理形势，所以产生了目前“原则—例外”的模式。如《个人信息保护法》第13条规定了处理个人信息若干不需取得个人同意的情形。欧盟GDPR也体现了相关理念，即基于合同的履行、法定义务的承担、数据主体及第三方的重要利益或权利，以及基于公共利益的公权力履行等原因而对必要数据进行处理时，数据控制者、数据处理者不需要事先征得数据主体的同意。[46]不论是从我国的《个人信息保护法》还是从欧盟GDPR相关规定出发，基于大数据犯罪防控而进行的犯罪数据处理属于不需取得个人同意的情形。但是应当认为，“原则—例外”模式并未突破数据处理授权原则。笔者认为，出于犯罪防控的公共治理目的，应将数据公开从专注于保护公民自主权转向规制数据利用者行为，遵循一种新“告知—同意”思路来回应犯罪数据的公共属性，即把传统个人数据处理的 “个人控制、个人选择和个人责任”在犯罪数据的利用领域转化为“国家控制、默认同意和利用者责任”。

首先，有别于民商事活动中场景化的用户同意，在犯罪数据公开领域，数据主体授权应通过制度层面、整体意义的法律授权来实现。[47]这不能看成是对个人权益的过度挤压和限缩，而是公权力机关通过自身所掌握的权力和资源，在基本不限制个人选择自由的前提下有所作为。[48]在犯罪治理领域，公权力机关以自己的专业性和权威性代替公民个人的“理性人”身份，在权衡个人利益和公共利益的前提下预先作出规定。面对冗杂的条文和未知的选项，数据主体仅凭自身的理性未必能够作出最优选择。此时，通过公权力机关的强制性要求，将精心设计、深思熟虑且经过权威审核的较优选项呈现在数据主体面前，以降低他们作出不理性决策的概率，是一种更有效率的做法。[49]

其次，在新“告知—同意”思路下，关注重点应转向数据利用者的责任，需在合法、合理的情况下分配不同主体责任，将数据利用者的行为关进制度笼子。[50]责任原则要求通过技术、制度等手段，确保数据利用者承担起不侵犯公民隐私和自由的责任，同时应保护公民数据不被泄露和滥用。通过对数据利用者责任的设计和执行，力图平衡犯罪防控和公民权利保护之间的关系。

四、结论

为了更好地进行“平安中国”建设，并且顺应大数据环境下犯罪防控的趋势，有必要将犯罪数据公开视为大数据时代犯罪防控的着力点。我国的犯罪数据公开存在需要改进的地方，犯罪数据公开全面性不足的问题让公众无法有效了解全国和周边的犯罪全貌，在一定程度上会影响公众基于犯罪数据进行有针对性的自主预防的效果。该问题出现的原因在于，存在“数据孤岛”以及公民隐私和自由遭受侵害威胁。犯罪数据在私人属性之外已经具有了公共属性，其对犯罪防控具有重要意义。在全社会呼吁在大数据时代应对数据进行严格保护的同时，也有必要通过完善制度和技术设计对犯罪数据的公共属性进行回应。首先，要推进公权力机关之间、公权力机关与企业之间、公权力机关和个人之间的数据共享，打破“数据孤岛”，以满足对基础数据量的要求。其次，要控制犯罪数据公开给隐私和自由带来的风险。通过去标识化处理在客观上控制风险，进而逐渐消除数据主体抵触犯罪数据公开的主观心态。但是，数据主体主观心态的转变必定是一个漫长且不可控的过程，遵循新“告知—同意”思路由政府代替数据主体的“理性人”身份是一条可行路径。笔者认为，要努力抓好犯罪数据公开这一个犯罪防控的着力点，促进全民在犯罪治理领域进行共治共享，将“平安中国”建设推上一个新的台阶。

大数据时代“平安中国”建设的新思考——以犯罪数据公开为例