大数据时代“数据信息引导侦查”模式研究

2016-11-11 09:39王玉宝魏延明
安徽警官职业学院学报 2016年3期
关键词:数据仓库侦查人员数据挖掘

王玉宝,魏延明

(西南政法大学 刑事侦查学院;重庆 401120)

大数据时代“数据信息引导侦查”模式研究

王玉宝,魏延明

(西南政法大学刑事侦查学院;重庆401120)

“数据信息引导侦查”模式是“信息引导侦查”模式在大数据时代的创新产物,具有坚实的理论与实践基础。但是,“数据信息引导侦查”模式具有典型的双面性,需要明确合法性、及时性、准确性、适度性的原则。在实践架构中,“数据信息引导侦查”模式首先在共享层面要加快构建数据仓库,其次在分析层面要提升基于云计算的OLAP与数据挖掘技术,最后在制度层面要完善一体化机制、信息化主体、保密性制度。

数据信息引导侦查;基本原则;数据仓库;数据分析

2011年5月,美国麦肯锡全球研究所(MGI)所发布的报告中指出:“大量的数据正在我们的世界中爆炸增长,分析大数据集即大数据成为竞争力、生产力、创新以及消费者盈余的一个重要基础…”[1]自此,大数据时代正式为人们所接受,各国警察机关开始接触与运用大数据,其中我国公安部便较早提出“加强大数据时代公安基础工作”[2],强调发挥大数据在打击与预防犯罪的作用。然而近年来国内关于大数据应用于侦查的相关研究比较缺乏,在此背景下,本文对“数据信息引导侦查”模式进行理论与实践的探讨。

一、“数据信息引导侦查”模式的概念界定

大数据时代下,我国侦查机关积极探索大数据与侦查活动的结合,对“信息引导侦查”模式深化发展,开辟出更加合理与创新的“数据信息引导侦查”模式。该模式是与时代生产力进一步结合的成果,需要我们对其提出基础与模式特性有深入的认识。

(一)“数据信息引导侦查”模式的概念提出

近来,学术界提出了 “大数据驱动的侦查模式”[3],实务界也存在着“数据信息引导侦查”的提法[4],这反映了“信息引导侦查”理论的变化发展,而实践中侦查机关对大数据的创新性应用,为侦查模式开辟了新的发展道路。这些理论发展与实践探索为“数据信息引导侦查”的概念提出奠定了基础。

1.信息论是“数据信息引导侦查”模式提出的理论基础

信息论是侦查学的核心理论之一,对此有学者较早地提出,“信息”在侦查活动中是 “犯罪行为信息”,由“犯罪行为信息”可以溯源到事物运动信息[5]。在工业化社会,信息要素与社会生产力结合,对侦查活动发挥了主导作用,继而成为“信息引导侦查”的理论根基。而在当前大数据时代,当前信息要素的收集利用已经达到了数据化的层面,有学者提出“数据到信息再到情报是一个线性转化的过程”[6],可将数据加工为侦查情报。因此,信息要素的数据化是侦查信息论在大数据时代的新发展,也是“数据信息引导侦查”模式发展的重要理论基础。具体而言,侦查工作要实现对犯罪活动的认识,要依赖于数据化的“犯罪行为信息”,通过对数据信息进行收集与分析,发挥数据信息对侦查的主导作用,这也是“数据信息引导侦查”模式的基础理论。

2.大数据与云计算是“数据信息引导侦查”模式的实践基础

大数据以其庞大的体量与潜藏的价值,为“数据信息引导侦查”提供了重要的数据资源。而“数据信息引导侦查”模式的难题在于大数据的合理利用,传统信息技术难以应付海量数据,那么就需要云计算来处理运用大数据。我国侦查机关高度重视大数据与云计算,其中公安部部长郭声琨提出运用大数据与云计算来加强对海量信息资源的深度挖掘和实战应用[7]。实践中,公安机关将大数据与云计算的实战应用,取得了巨大的成效,例如山东省寿光市公安局可以做到在0.15秒内检索6亿条车辆信息,并进行智能化的车辆特征识别[8]。

综上所述,“数据信息引导侦查”模式是指侦查人员对海量数据信息进行收集、管理,运用云计算技术加以挖掘、分析,从而起到对侦查活动的主导作用的一种侦查模式。

(二)“数据信息引导侦查”模式的概念辨析

20世纪90年代,公安机关提出“金盾工程”建设,开始了“侦查信息化”进程。与此同时,“第五次警务改革”促进了侦查理论的发展,并影响了“信息引导侦查”模式的发展。再到如今大数据时代,“数据信息引导侦查”模式又逐渐成为新的发展趋势,与前者存在着联系与创新。

1.“数据信息引导侦查”是“侦查信息化”的合理性路径

“侦查信息化”与“数据信息引导侦查”存在着内在联系,前者是后者的理论指导与总体方向,后者是前者的实践探索与具体路径。侦查信息化是指信息技术与计算机网络在侦查部门全面广泛应用,从而支持侦查工作的过程[9],而“数据信息引导侦查”模式是指利用云计算对大数据进行收集与分析,从而更好发挥对侦查活动的主导作用。从概念中不难看出,两者都以信息要素为基础,强调信息对侦查产生作用。同时,两者又存在明显区别:侦查信息化的核心在于将网络信息技术充分应用于以起到支持侦查的效果,这是强调普遍性的指导;数据信息引导侦查在此基础上,运用大数据与云计算来对信息要素进行细化,并发掘深化引导要素,从而形成在侦查信息化指导下的合理性路径。

2.“数据信息引导侦查”是“信息引导侦查”的创新性发展

“数据信息引导侦查”区别于“信息引导侦查”,大数据与侦查活动相结合产生了创新性发展。具体而言,大数据以及云计算带来了数据体量与数据技术的变化,扩展了信息要素的广度、加强了引导要素的深度。

一是信息要素的广度空前,扩展了侦查情报源,丰富了侦查思路。在现代信息技术的条件下,大数据实现对社会系统信息的全景化记录,实现结构性与非结构性数据的统一性处理,实现跨行业与地域的及时性共享。大数据的诸多特性,为侦查工作提供了更为广阔的情报资源。在“数据信息引导侦查”模式中,侦查机关可以与社会多个行业部门加强数据对接或共享,从而在更广层面上检索数据,为侦查工作提供更多线索情报。同时,线索情报的扩展会帮助侦查人员发现侦查盲点与误区所在,有利于及时修正侦查思路与方向。

二是引导要素的深度发掘,提高了情报转化效率,发掘出情报的预测价值。首先是情报转化效率提高。数据信息的重要特性便在于体量大但价值密度低,侦查机关构建云计算平台,利用数据分析技术来对视频、图像、音频等非结构性数据进行快速检索处理,可以大大缩短识别时间。其次就是情报的预测价值增强,利用大数据的数据挖掘来发现犯罪规律与预测犯罪趋势。基于云计算的数据挖掘技术,可以根据一种变量的变化预测出另一种变量的运动[10],从而实现根据现有线索情报来判断下一步侦查方向或防控重点。

二、“数据信息引导侦查”模式的双面性分析以及原则构建

“数据信息引导侦查”模式具有存在的必要性,对于提升侦查水平与打击防范犯罪都有促进作用。但是大数据与云计算作为尖端科技,不加约束的运用极易产生重大负面影响。因此,“数据信息引导侦查”模式需要侦查机关审慎运用大数据,进一步明确该模式的运行原则。

(一)大数据应用于“数据信息引导侦查”模式的双面性

随着信息化社会的发展,科学技术逐渐发挥出其重要作用。侦查机关也越发重视信息技术在实战中的运用,强调信息导侦、科技强侦。但是,大数据应用于侦查,既可以促进侦查活动的开展,又可能带来一定的风险性。

1.大数据应用于侦查具有必要性

大数据应用于侦查是十分必要的,首先,信息化社会中信息技术转化为先进生产力,使社会生活变得数据化。而侦查活动是与社会生活紧密结合的,要提升数据化生活中的侦查能力,与大数据的结合是必经之路。其次,复杂化犯罪形势愈加严峻,传统犯罪逐渐通过网络平台实现隐蔽化、智能化的转变,这急需侦查机关全面提升打击与预防犯罪的能力。最后,传统侦查模式转型需要大数据的推动。实践中传统模式逐渐暴露出调查取证与扩线深挖上的不足[11],而大数据以及云计算技术可以为侦查活动提供充足的情报来源与高效的应用方式。

2.大数据应用于侦查产生风险性

大数据应用于侦查具有风险性,其可能会降低侦查工作质量和侵犯公民合法权益。具体而言,在数据收集环节,大数据通常采用分布式文件系统,由中央机采集分端机的数据信息,而这种采集方式容易在分端机层面出现侦查保密问题;在数据管理环节,依据侦查需要对隐私数据进行获取,而在实践中数据信息的保密性制度仍不够完善,数据分级与泄密追责制度尚未健全,容易造成公民的个人隐私泄露;在数据分析环节,大数据意味着数据量的增大,错误率的上升,若不进行甄别鉴定,极易误导侦查视线,徒增侦查成本,甚至还可能导致错误追究无辜者。

(二)“数据信息引导侦查”模式的基本原则

刑事侦查活动作为一种公权力机关的职权活动,应当受到国家法律的约束,“数据信息引导侦查”模式要坚持合法性原则。与此同时,该模式还应符合侦查实战的要求,坚持及时性、准确性、适度性的原则。

1.“数据信息引导侦查”模式应当坚持合法性原则

我国2013年《刑事诉讼法》新增添了电子数据,大数据的运用可以依据该法律规定。从取证主体来看,侦查过程中取证主体应为侦查人员,或在侦查人员主持下由具备专门知识的人来进行。从取证客体来看,数据来源与取证范围必须要合法,需要获得相应机关与单位的授权许可,同时在范围方面需要以侦查需要为限。从取证方法来看,大数据的取证设备与技术要符合法律法规的要求,保证证据的原始性、无损性。从取证程序来看,大数据的电子取证需要合法审批与合法见证,形成具有法律效力的文书。

2.“数据信息引导侦查”模式应当坚持及时性原则

大数据时代,犯罪行为信息的数据化使侦查获取了便利与高效的情报源,但是基于电子数据的易变性与易损性,“数据信息引导侦查”模式必须强调及时性原则。数据信息存在一定的淘汰周期,同时容易受到变动与损坏,因此侦查人员需要对数据信息进行及时取证,同时对数据的自然与人为变动进行区分,防止行为人对数据进行伪装或伪造,必要时可以聘请具备专门知识的专家人员进行数据鉴定。因此,大数据取证时应先确定数据的真实性与可靠性,再对犯罪相关的数据进行迅速及时的取证。

3.“数据信息引导侦查”模式应当坚持准确性原则

在“数据信息引导侦查”模式中,侦查人员要灵活坚持准确性原则。具体而言,在查案初期上允许相对准确性,因为大数据的全体性与混杂性会对精确度产生影响,但却能帮助我们发现侦查的盲点与误区,例如对犯罪嫌疑人的所有通讯数据进行挖掘,虽然会缺乏针对性,但可能会从数据结果中发现尚未发觉的同伙或关系人;在侦查取证时应强调绝对准确性,侦查人员运用云计算进行数据分析,要采用科学方法进行取证,保障来源与手段的科学性。同时,侦查人员应当对数据挖掘的结果进行严格的客观的审查,结合经验法则与逻辑规则进行判断。

4.“数据信息引导侦查”模式应当坚持适度性原则

适度性原则也称措施比例原则,其基本内涵是侦查程序要与侦查结果要相称。从侦查价值来看,侦查人员处理好“大数据手段—侦查结果”的关系,就是对程序价值与结果价值进行兼顾与权衡[12]。具体而言,首先大数据手段的使用要具有必要性,即侦查工作遇到困境而必须使用大数据手段,这就要求大数据手段处于补充性地位。其次侦查结果与大数据手段要相称,采用大数据手段来获取犯罪嫌疑人及其关系人的数据信息,要明确该数据信息是否可作为证据使用,是否会对合法权益侵害,是否会对社会秩序造成不良影响。

三、“数据信息引导侦查”模式的实践架构

十八届五中全会明确提出国家大数据战略,强调“加快政府数据开放共享,推动资源整合,提升治理能力”。我国公安机关作为打击犯罪的公权机关,更应当利用大数据来发挥犯罪治理能力,重视“数据信息引导侦查”模式的建设。具体而言,模式构建首要应着重于强化数据共享程度,其次应当深度提升数据分析技术,最后还要完善相关制度来加强保障。

(一)共享层面的数据仓库构建

随着平安城市与智慧警务的不断推进,公安机关已在不同部门与区域中建设了分块分片的数据库,带来了短期的即时性的侦查效益回报,但却出现了功能冗余、信息不畅的“信息孤岛”效应,这导致信息决策趋于低效化。为了解决这种数据库的弊端,公安机关应当注重于数据仓库的构建。

1.数据仓库是数据库的深化

数据库之父W.H.Inmon提出:“数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。”通俗而言,数据仓库在侦查活动可以实现三个深化。第一,大量数据库深化为统一数据池。数据仓库是将独立的数据库进行集合,统一存储为数据资源池。第二,实时性数据深化为历史性数据。数据仓库可以存储不同数据库的不同时期的数据,可以对数据信息的历史变化逐一记录。第三,存储型数据深化为分析型数据。数据仓库消除数据间的不一致性,利用数据模型来对数据资源整合,使之成为适合于分析技术所运用的对象。

图一 星形模型部分设想图

2.侦查数据仓库的构建

当前侦查信息化建设中,金盾工程二期工程圆满竣工,公安系统内的诸多业务数据库与系统逐步完善。而侦查数据仓库则有两方面的要求,一是集合不同警种的数据库,二是要以侦查破案为主题。那么,这就要求侦查数据仓库要设计好数据模型,既要对不同数据库通过抽取转化技术来实现集成,又要能为数据分析与挖掘提供合适数据。结合侦查实践来看,星型模式(Star-schema)是比较适合于侦查活动的实践现状与目标要求的,具体来说,首先要选取刑事案件的五要素(人、事、物、时、空)作为主题事实表,其次将各类数据库与业务系统作为相关维度表,形成面向侦查主题的数据仓库,见图一。

随着数据仓库建设的不断深入,侦查机关还应当主动扩展外部数据源。一是完善与行政执法机关的数据衔接,如加强与工商、审计等行政执法部门的数据对接,完善司法移送与数据共享。二是侦查机关还应当注重与商业服务数据的对接,可以收集银行证券等金融数据、移动通信等电信数据、交通旅游等通行数据……因此,综合内外部数据源来看,侦查机关的数据仓库深度构建应注意三方面,即内部业务数据、行政执法数据、商业服务数据。

(二)分析层面的基于云平台的OLAP与数据挖掘

云计算是将数据仓库资源池与数据分析技术进行有机结合的平台与架构。国内公安机关已开始构建云计算平台,对大数据进行综合应用,例如山东省济南市公安局启用了全国首个“公安云计算中心”[13]。而在数据分析技术上,公安机关的侦查数据仓库大多采用OLAP技术,但在大数据时代,还应当重视数据挖掘技术。

1.OLAP技术在侦查的应用

OLAP是一种多维度的数据分析技术,由使用者预先提出假设,然后建立模型分析,最后验证假设是否成立。在实践中,侦查人员在对案件线索物证进行主观加工的基础上,提出可能的特定数据与犯罪活动间的关联,然后对特定数据进行建模分析,反复验证并最终确定关联。这种数据分析技术便于侦查人员快速地验证侦查思路的准确性,可以有力减少侦查活动的错误决断,更加能够促进粗放型侦查向精细型侦查转型。然而OLAP同样存在局限性,对于侦查线索缺失、侦查方向模糊的难题,OLAP缺乏可靠的线索物证作为侦查假设的理论支撑,其对侦查困境的破解存在低效性。

2.数据挖掘技术在侦查的应用

数据挖掘相较于OLAP,更为强调智能性,不再依据经验提出假设,而是对全体数据进行比对与碰撞,自行发掘出数据间潜在的价值,从而为侦查找到科学假设。对应到侦查活动中,一方面,侦查人员在面临侦查困境时,可以对与案件相关的人、事、物、时、空等要素(全体的非特定变量)进行处理,选好挖掘算法(聚类分析、关联分析)并且建立数据模型,从而发现尚未发觉的数据情报。另一方面,数据挖掘在预防犯罪上同样有巨大作用,侦查人员可以对数据之间的相关关系进行运用,从犯罪预兆中推测出犯罪趋势,例如美国洛杉矶警方便成功运用大数据的数据挖掘,从历史数据总结犯罪征兆,利用地震模型来预测犯罪趋势,从而极大程度地降低了当地犯罪率[14]。我国侦查机关也应当重视数据挖掘,加强防治犯罪的能力,同样也为侦查工作打好基础。

综合来看,OLAP和数据挖掘都是建立在云平台上的分析方法,其在侦查中的应用各有所长,OLAP是帮助侦查人员验证已经发觉的侦查数据与犯罪活动的直接联系,是一个验证假设的过程;而数据挖掘是帮助侦查人员发掘尚未发觉的侦查数据与犯罪活动的潜在联系,但两者最终都是为侦查目标所服务,见图二。

图二 OLAP与数据挖掘的侦查流程图

(三)制度层面的配套机制完善

“数据信息引导侦查”模式的关键在于对信息要素的广度与引导要素的深度进行提升,但是,我们仍需认识到“数据信息引导侦查”模式是一种整体性的侦查模式与机制,仅靠数据与技术是难以运行的,需要相应配套机制来做好制度保障。

1.完善内部连通、外部协调的一体化机制

首先是内部连通的侦查一体化,公安机关要系统内部跨部门的数据共享。公安机关的不同部门要打破部门局限,将刑侦、治安、交管、户籍、巡逻、网监等部门数据实现快速查询,整合内部系统的数据资源。其次是外部协调的侦查一体化,跨区域的侦查机关要加快数据共享的协调。不同地域的侦查数据库存在数据标准与通讯技术的差别,应当制度规范性标准;同时不同侦查机关间存在“地方保护主义”,应当树立“大数据”观念,实现侦查活动的通力合作。

2.建立信息化的数据机构与人才队伍

首先侦查机关需要设立专门的数据机构,其在对外上要接受上级侦查机关的领导指挥,要负责与同级侦查机关的数据共享;其在对内上既要对数据信息进行汇集与管理,也要对数据信息进行挖掘与研判。其次,侦查机关要优化人才队伍结构,既要引入具有专业技能的数据工程师来负责数据收集与挖掘,又要抽调实战经验丰富的侦查骨干来进行数据分析与研判。同时,信息队伍要明确好责任分工,由侦查骨干作为侦查工作的指挥决策力量,数据工程师作为调查取证的辅助力量。

3.健全数据信息的保密性制度

首先侦查机关要建立数据分级制度,应当对所获取的数据信息进行分级管理,根据侦查要求与隐私因素,明确各级数据信息的适用范围,区分不同级别侦查人员的秘钥权限。其次要完善数据安全制度,包括数据信息网络的安全规定、数据收集分析研判的保密规定以及突发安全事件的处置规定。最后是要落实泄密追责制度,侦查人员在办案过程中若有不规范与不合法的行为,极为容易造成重大不良后果,因此应当确立办案责任终身制,做到有权慎用、越权必究。

[1]Manyika J,Chui M,Brown B.Big data:The next frontier for innovation,competition,and productivity[R/OL].Las Vegas:The McKinesey.com/institute.[2013-07-24].http://www.mckinsey.com/business-functions/business-technology/our-insights/big-data-the-next-frontier-for-innovation.

[2]刘洋.郭声琨在湖南调研时强调提升大数据时代预防打击犯罪本领 [EB/OL].[2014-05-10].http://news.xinhuanet.com/politics/2014-05/09/c_1110623112.htm.

[3]何军.大数据与侦查模式变革研究[J].中国人民公安大学学报,2015,31(1):72-80.

[4]邵娟英.浅谈大数据时代的职务犯罪侦查模式的几点思考[EB/OL].[2015-06-09].http://jgdj.sx.gov.cn/art/2015/6/9/art_6757_635987.html.

[5]武汉.武汉论文集[C].上海:百家出版社,2005:68-79.

[6]郑彦宁.数据、信息、知识与情报转化关系的探讨[J].情报理论与实践,2011,34(7):1-4.

[7]佚名.郭声琨:深化公安改革,推进“四项建设”[EB/OL].[2015-01-09].http://news.xinhuanet.com/legal/2015-01/09/c_1113944611.htm.

[8]石如宽等.有了“神眼”,办案快了[EB/OL].[2014-.07-18]http://paper.dzwww.com/dzrb/content/20140718/Articel21004MT.htm.

[9]郝宏奎.论侦查信息化[J].中国人民公安大学学报,2005,21(6):120-126.

[10][美]维克托·迈尔·恩舍伯格.大数据时代[M].周涛,译.浙江:浙江人民出版社,2013:67-68.

[11]李丹,陈晓辉,张俊,孔登榜.网络犯罪案件的侦查难点及打击对策[J].湖北警官学院学报,2015(8):27-30.

[12]任惠华等.侦查学原理[M].北京:法律出版社,2012:27-29.

[13]王志等.全国首个城市“公安云计算中心”在济南启用[EB/OL].[2012-11-08].http://www.sd.xinhuanet.com/xhsksd/2012-11/08/c_113642495.htm.

[14]张培.美国应用大数据预防犯罪[J].检察风云,2015(4):95-96.

Research on Data Information Guide Crime Investigation System under the Age of Big Data

Wang Yubao,Wei Yanming
(Southwest University of Political science and Law,Chongqing 401120)

Data information guiding investigation mode is the innovative development of information guiding investigation mode in the era of big data,and has a solid theoretical and practical foundation.However,data information guided investigation model has the typical characteristics of both sides,and needs to be clear on the principle of legality,timeliness,accuracy,and appropriateness.In the practical architecture,firstly,this model needs to speed up the construction of data warehouse in the sharing level;secondly,to enhance the OLAP and data mining technology based on Cloud Computing in the analysis level;finally,to improve the integration mechanism,information technology and security system in the system level.

data information guiding investigation;basic principle;data warehouses;data analysis

D918.2

A

1671-5101(2016)03-0045-06

2016-04-20

王玉宝(1963-),男,山东人,西南政法大学刑事侦查学院副教授,大学本科,研究方向:治安学、国家安全学。魏延明(1995-),男,山东潍坊人,西南政法大学2012级刑事侦查专业本科生。

猜你喜欢
数据仓库侦查人员数据挖掘
侦查人员出庭问题实证研究
探讨人工智能与数据挖掘发展趋势
基于数据仓库的数据倾斜解决方案研究
基于数据仓库的住房城乡建设信息系统整合研究
侦查人员出庭作证问题研究
基于并行计算的大数据挖掘在电网中的应用
我国侦查人员出庭作证制度的构建
侦查人员出庭作证的困境及完善策略
探析电力系统调度中数据仓库技术的应用
一种基于Hadoop的大数据挖掘云服务及应用