法律视野下的大数据问题研究

2016-12-18 23:49邵俊武
法治社会 2016年2期
关键词:证据法律

邵俊武

法律视野下的大数据问题研究

邵俊武*

内容提要:大数据作为一种新型的资源和工具,在法律领域运用广泛。同时,大数据活动也可能涉及国家安全、危及他人的各种权益,应当依法予以规范使用。为此,本文从数据的采集、转让和权属认定,数据的披露,数据活动违法行为的法律责任,数据证据的类型分析,诉讼中使用大数据及其分析结果的法律问题等方面进行了研究和探讨。

大数据法律问题司法认定

法律工作涉及大量的事实判断问题,大数据作为一种决策的依据,对法律工作有着重要的意义。在犯罪的预防、侦查方向的确定、同一认定、因果关系的判断、损害后果的测算等法律领域有着广泛的应用。但是,大数据活动也可能危及国家安全和损害他人权益,大数据证据的司法应用也需要、因此,法律 (学)界必须重视大数据在法律领域的运用问题。

一、数据取得的合法性问题

(一)数据的原始采集要符合法律的规定

由于数据的采集可能影响到国家安全、公共安全、商业秘密、知识产权、公民的个人隐私等,所以,数据的采集行为必须严格按照法律的规定进行。

根据我国法律的规定,数据的采集主要应注意两方面的问题。

一是采集的主体要取得相关数据采集的资格。如:1993年公安部 《关于禁止开设 “私人侦探所”性质的民间机构的通知》规定,严禁任何单位和个人开办各种形式的 “民事事务调查所”、“安全事务调查所”等私人侦探所性质的民间机构。据此,这些具有私人侦探性质的机构不可以进行数据调查和搜集的工作。2000年国家测绘局关于 《测绘资格审查认证管理规定》,国务院测绘行政主管部门负责管理全国的测绘资格审查认证工作;省、自治区、直辖市人民政府管理测绘工作的部门负责管理本行政区域内的测绘资格审查认证工作。经测绘资格审查,取得 《测绘资格证书》的单位,方可进入测绘市场承揽测绘任务。未取得 《测绘资格证书》而违法经营测绘业务的,由省、自治区、直辖市人民政府管理测绘工作的部门责令其停止测绘业务,没收违法所得,可以并处违法所得百分之五十至百分之百的罚款。

二是采集的行为要符合法律的规定和要求。如:2009年商务部起草的 《关于保护网上商业数据的指导意见 (征求意见稿)》规定,在收集网上商业数据时,收集人应告知数据提供人收集人的真实身份以及收集数据的目的和用途。此外,收集人不得任意修改或歪曲收集到的数据,网上商业数据的收集也不得采用盗窃、欺诈、胁迫、非法访问或其他不正当手段进行。网上商业数据的使用应符合数据提供人认可的使用目的、范围和用途。未经数据提供人同意,不得改变用途。未经数据提供人同意,不得将其提供的数据公开或告知第三人。转让网上商业数据,也应当征得数据提供人的同意。1赵倩:《网上收集商业数据未经同意不得公开》,载 《成都商报》2009年5月15日。此外,根据我国法律关于诉讼证据的有关规定,以违反法律的禁止性规定和侵犯他人的合法权益的方式所获得的证据,在诉讼中不得作为定案的依据。

(二)数据的受让取得要符合法律的规定和当事人双方的约定

随着大数据产业的发展,数据资源的商业化服务和数据交易行为将逐渐广泛,提供数据资源的商业公司,对于其提供的数据也应当遵守相关的法律和与其他当事人之间订立的协议,对依法取得所有权的数据,方可转让给客户使用。

通过他人转让获得数据的受让人应当拥有该项数据的使用权利,并在转让合同约定的范围内和约定的使用方法内,使用该项数据。因此,数据的交易必须依法进行,并在转让合同中对数据的数量、使用范围、使用时间、使用方式等做明确具体的约定,以保证受让数据达到预想的目的。

在数据权利转让的过程中,受让方要审查数据转让方对其所提供的数据是否是合法拥有并依法可转让的数据,如果明知某项数据是转让方以盗窃、利诱、胁迫或者其他不正当手段获取权利人的商业秘密而获取、使用或者披露的,以侵犯商业秘密罪论处。转让方允许他人使用以盗窃、利诱、胁迫或者其他不正当手段获取的权利人的商业秘密的,也要以侵犯商业秘密罪论处。

关于数据的二次使用问题,我国法律尚未有具体的规定。在美国根据对隐私权保护程度最严格的规则要求,再度披露行为必须获得书面许可。这特别体现在一些关于特别敏感的医疗记录的法律中,例如关于药品、酗酒、精神健康治疗和HIV的记录。对于一般的商业记录,则适用两种较为宽松的规则:一种是,如果没有权利人的同意,则禁止信息的二次使用;另一种是,除非权利人书面通知禁止信息的二次使用,则推定他同意。对于商业机构应采用这两种规则中的哪一种规则,法律并没有统一规定。2[美]阿丽塔·L·艾伦、理查德·C·托克音顿:《美国隐私法——学说、判例与立法》,冯建妹等编译,中国民主法制出版社2004年版,第208页。根据2009年商务部起草的 《关于保护网上商业数据的指导意见 (征求意见稿)》规定,网上收集商业数据,未经数据提供人同意,不得将数据公开或告知第三人。

(三)公共数据的采集

涉及社会公共生活领域内的公共数据,虽然其权属具有公共性,但为了维护公共安全,通常情况下某些公共数据的取得主体往往要求有法定授权方可进行。

行政机关作为国家的公共事务管理主体,是主要的采集公共数据的法定机关。为保证国家公共管理权力的有效实施,法律授权行政机关采集某些公共数据并加以使用,并将其作为行政机关行使行政调查权的专属性权力。

在刑事诉讼和行政诉讼中,行政机关采集的公共数据可以由行政机关直接提交法庭作为诉讼的证据使用;在民事诉讼中,当事人的律师可以向公共数据的持有机关申请取得该项数据,当事人不能取得的,可以申请法院依职权调取。

在社会生活中,公民、法人或者其他组织根据自身生产、生活、科研等特殊需要,可以根据《政府信息公开条例》,申请持有相关公共数据的国务院部门、地方各级人民政府及县级以上地方人民政府部门申请获取相关政府信息。

事实上,在一个信息化、网络化、新媒体支撑下的大数据时代,公共数据采集的方便、低廉以及公共数据应用的广泛性,已经远远超出了我们过去的认识,以往关于公共数据采集的相关规范已经远不能适应现实生活的需要。正如专家所言,如今,不再只是负责反恐的秘密机关需要采集更多的数据,所有的政府部门都需要,所以,数据的采集扩展到了金融交易、医疗记录和Facebook状态更新等各个领域,数据量之巨可想而知。企业即使不具备国家强制力,但各种各样的公司在我们不知情的情况下采集了我们日常生活方方面面的数据,并且进行了数据共享以及一些我们未知的运用,这还是很恐怖的。3[英]维克多·迈尔·舍恩伯格、肯尼斯·库克耶:《大数据时代——生活、工作与思维大变革》,盛杨燕、周涛译,浙江人民出版社2013年版,第201页。法律作为人们行为的规范,应当及时回应现实生活的这一巨变,完善现有的立法,以保障以数据为内容的各项活动的依法、有序、健康进行。

二、数据的权属界定

权利是一个法律概念,而非天然存在。因此,是否存在权利以及谁拥有该项权利需要依据法律加以界定。多数情况下,数据记录者并非数据内容主体,数据内容主体与数据载体主体的分离及其二元结构增加了数据权利问题的复杂性。有论者主张,将数据划分为专有数据 (如个人数据、企业数据、政府数据)、共有数据 (无明确主体指向的数据)、原生数据 (不依赖于现有数据而产生的数据)、衍生数据 (原生数据被记录储存后经过算法加工、计算、聚合成系统可读取的数据),并据此确定数据的权利。4陈小江:《数据权利初探》,《法制日报》2015年7月11日。从一般意义上将,对数据做如此分类,不无其合理性。但是,我们应当看到,大数据和一般的信息还是有所区别的。例如,个人信息可以是一项法律权利,但它本身并不是大数据。与一般信息相比,大数据是经过人为收集、加工、分析等处理后生成的信息,它不是信息的原始存在状态。因此,应当从大数据的角度对它进行分类,而不应从大数据的信息来源的角度对大数据进行分类。而且,个体信息的问题,相关的法律已经有了相应的规定,在研究大数据问题时,不必要再重复研究大数据的样本信息问题。

实际上,由于大数据已经成为了一种商业利益,并已经开始了商业化运作,其权利类型已经通过市场进行了类型化处理,我们只需要依此对其权利加以确认即可。根据所提供的价值的不同来源,与大数据有关的主体通常分为三类:5同前3引书,第160页。

一是基于数据本身的主体。这些主体拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。最好的例子就是Twitter,它拥有海量的数据,但是它的数据都是授权给别人使用。

二是基于技能的主体。它们通常是咨询主体、技术供应主体或者分析主体。它们掌握了专业技能但并不一定拥有数据或者提出数据创新性用途的才能。如沃尔玛和Pop-Tarts这两个零售商就是借助天睿公司 (Teradate)的分析来获得营销电子,天睿就是一家数据分析公司。

三是基于思维的公司。皮特·华登 (Pete Warden),Jetpac的联合创始人,就是通过想法获得价值的一个例子。Jetpac通过用户分享到网上的旅行照片来为人们推荐下次旅行的目的地。对于某些公司来说,数据和技能并不是成功的关键。让这些公司脱颖而出的是其创始人和员工的创新思维,他们有怎样挖掘数据的新价值的独特想法。

基于数据主体的这一分类,我们也可以相应地将与数据有关的权利分为三种:

一是数据权利及其方法。此类主体收集拥有一定的数据,且具有一定的商业价值,通过将其拥有的数据提供给他人使用从而获取一定的商业利益,受法律保护。此类收集数据的工作虽然本身并不是一项智力活动,其数据本身并不构成著作权,但如果其收集数据的方法是自己独创的,该方法可以作为著作权并受法律保护。

二是数据分析成果权利。此类主体的工作主要是通过其技术专家对数据的价值进行挖掘,从而产生对他人有价值的分析报告。此类主体对数据的挖掘和生成的分析报告,属于著作权的范畴,受法律的保护。此类主体可以通过出让的方式将其拥有的该项权利转让给他人使用,也可以受他人的委托为他人提供分析报告,该项分析报告的著作权的归属由委托人和受托人通过合同约定,合同未作明确约定或者没有订立合同的,著作权属于受托人。

三是基于数据的创新权利。此类主体自己提出创意,并通过对相关数据的分析,发现新的问题并提出解决问题的方案。该项权利是典型的知识产权,依法受到法律的保护。

三、数据的披露要依法进行

(一)数据的商业披露

数据的披露是大数据的功能发挥和价值体现。一般来讲,数据权利人或者持有人有权根据自己的需要选择是否披露数据、何时披露数据、如何披露数据以及披露多少数据。我国对数据权利人或者持有人披露数据并无具体的规定。但是,从法律的基本原理和我国法律的基本规定来讲,数据的披露需要遵守以下几方面基本规则:

第一,商主体公开信息,应当以对公开的信息拥有权利为前提,有权属争议的数据的公开,可能引发权属纠纷并承担侵权责任。

第二,商主体公开的信息,必须不违反与被采集人之间在信息采集时的约定。商主体在采集数据时应当与被采集人就采集的数据能否公开、哪些可以公开、以何种形式公开、在何时公开、在什么范围公开等,做明确、具体的约定,并严格按照约定公开信息。

第三,商主体公开信息,不得违反法律的禁止性规定,不损害他人的合法权益,不危害社会的公序良俗。

(二)数据证据在诉讼中的公开

大数据在诉讼中,主要是作为诉讼证据来使用的。根据我国法律规定,如果数据证据涉及国家机密、商业秘密、个人隐私等,该项数据证据需要在法庭上披露的,要在不公开审理过程中进行。

(三)政府信息的公开

根据 《政府信息公开条例》的规定,行政机关应当遵循公正、公平、便民的原则,及时、准确地公开政府信息。对依照国家有关规定需要批准的政府信息,未经批准不得发布。行政机关发现影响或者可能影响社会稳定、扰乱社会管理秩序的虚假或者不完整信息的,应当在其职责范围内发布准确的政府信息予以澄清。行政机关发布政府信息涉及其他行政机关的,应当与有关行政机关进行沟通、确认,保证行政机关发布的政府信息准确一致。行政机关公开政府信息,不得危及国家安全、公共安全、经济安全和社会稳定。

行政机关在公开政府信息前,应当依照 《保守国家秘密法》以及其他法律、法规和国家有关规定对拟公开的政府信息进行审查。行政机关对政府信息不能确定是否可以公开时,应当依照法律、法规和国家有关规定报有关主管部门或者同级保密工作部门确定。行政机关不得公开涉及国家秘密、商业秘密、个人隐私的政府信息。但是,经权利人同意公开或者行政机关认为不公开可能对公共利益造成重大影响的涉及商业秘密、个人隐私的政府信息,可以予以公开。

四、与数据活动有关的违法行为的法律责任

对违法的数据采集、转让和使用等行为,我国法律作了相应的处罚规定。如:

根据 《测绘资格审查认证管理规定》,未取得 《测绘资格证书》而违法经营测绘业务的,由省、自治区、直辖市人民政府管理测绘工作的部门责令其停止测绘业务,没收违法所得,可以并处违法所得百分之五十至百分之百的罚款。

根据 《治安管理处罚法》的规定,违反国家规定,侵入计算机信息系统,造成危害的,或者对计算机信息系统中存储、处理、传输的数据和应用程序进行删除、修改、增加的,处五日以下拘留,情节较重的,处五日以上十日以下拘留;或者偷窥、偷拍、窃听、散布他人隐私的,处五日以下拘留或者五百元以下罚款,情节较重的,处五日以上十日以下拘留,可以并处五百元以下罚款。

根据 《保守国家秘密法》的规定,非法获取、持有国家秘密载体的;买卖、转送或者私自销毁国家秘密载体的,通过普通邮政、快递等无保密措施的渠道传递国家秘密载体的;通过普通邮政、快递等无保密措施的渠道传递国家秘密载体的;邮寄、托运国家秘密载体出境,或者未经有关主管部门批准,携带、传递国家秘密载体出境的;非法复制、记录、存储国家秘密的;在私人交往和通信中涉及国家秘密的;在互联网及其他公共信息网络或者未采取保密措施的有线和无线通信中传递国家秘密的;将涉密计算机、涉密存储设备接入互联网及其他公共信息网络的;在未采取防护措施的情况下,在涉密信息系统与互联网及其他公共信息网络之间进行信息交换的;使用非涉密计算机、非涉密存储设备存储、处理国家秘密信息的;擅自卸载、修改涉密信息系统的安全技术程序、管理程序的;将未经安全技术处理的退出使用的涉密计算机、涉密存储设备赠送、出售、丢弃或者改作其他用途的,将依法给予处分,构成犯罪的,依法追究刑事责任。

根据 《刑法》的规定,以下非法获取、使用数据的行为均构成犯罪。如:为境外的机构、组织、人员窃取、刺探、收买、非法提供国家秘密或者情报的;编造并且传播影响证券、期货交易的虚假信息,扰乱证券、期货交易市场,造成严重后果的;以盗窃、利诱、胁迫或者其他不正当手段获取权利人的商业秘密的;披露、使用或者允许他人使用以前项手段获取的权利人的商业秘密的;违反约定或者违反权利人有关保守商业秘密的要求,披露、使用或者允许他人使用其所掌握的商业秘密的;违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的,或者将在履行职责或者提供服务过程中获得的公民个人信息,出售或者提供给他人的;以窃取、刺探、收买方法,非法获取国家秘密的;非法持有属于国家绝密、机密的文件、资料或者其他物品,拒不说明来源与用途的;非法使用窃听、窃照专用器材,造成严重后果的;违反国家规定,侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,或者侵入前款规定以外的计算机信息系统或者采用其他技术手段,获取该计算机信息系统中存储、处理或者传输的数据,或者对该计算机信息系统实施非法控制,情节严重的,或者提供专门用于侵入、非法控制计算机信息系统的程序、工具,或者明知他人实施侵入、非法控制计算机信息系统的违法犯罪行为而为其提供程序、工具,情节严重的;网络服务提供者不履行法律、行政法规规定的信息网络安全管理义务,经监管部门责令采取改正措施拒不改正,致使违法信息大量传播的,致使用户信息泄露,造成严重后果的,致使刑事案件证据灭失,情节严重的;国家机关工作人员违反保守国家秘密法规定,故意或者过失泄露国家秘密,情节严重的;中国人民解放军的现役军官、文职干部、士兵及具有军籍的学员和中国人民武装警察部队的现役警官、文职干部、士兵及具有军籍的学员以及执行军事任务的预备役人员和其他人员,以窃取、刺探、收买方法,非法获取军事秘密的,为境外的机构、组织、人员窃取、刺探、收买、非法提供军事秘密的,违反保守国家秘密法规,故意或者过失泄露军事秘密,情节严重的等等。

我国法律明确规定,凡是知道案件情况的单位个人,都有作证的义务。为此,在诉讼过程中,遇有需要有关单位和个人提供数据证据的情况,数据的持有者依法应当提供,否则,将承担不利于己的法律后果。如:我国 《民事诉讼法》及相关司法解释的规定,有义务协助调查、执行的有关单位拒绝或者妨碍人民法院调查取证的;伪造、隐藏、毁灭或者拒绝交出有关被执行人履行能力的重要证据,妨碍人民法院查明被执行人财产状况的等行为,均构成对民事诉讼的妨害,并承担相应的法律责任。

五、诉讼中使用大数据及其分析结果的法律问题

在以往的年代里,诉讼证明通常采用概率推理的方式进行,但二者之间的关系也并不是风平浪静。上世纪60-70年代,曾经发生一起引起较大争议的被称之为 “数字审判”的案件,证人证言称一名白人女性袭击并试图抢劫一名老年妇女,这名女性袭击者,乘坐一辆由非裔美国男性驾驶的轿车从现场逃离。证人们描述了这两个作案者,以及他们逃离现场所驾驶车辆的各种细节。符合这些描述的一名白人女性和一名非裔美国男性随之被捕并被送交审判。检控方邀请了一名概率学家,通过计算具有证人们所描述并为被告所具有的同样特征的任意两个人的概率统计估计,概率估计值非常之小。检控方据此认为在押的人肯定就是事实该犯罪的那两个人。但也有统计学家反驳说,检控方依据的概率计算非常不恰当。有一位叫劳伦斯·特赖布的教授发表了一篇名为 《以数学进行的审判:法律过程中的精确和礼制》的文章,认为作为一项政策,反对将任何数字化概率运用于审判过程。其理由有三:一是从交流角度说,只要法官和陪审团成员可被假定为不精通数学,他们就不应当用自己无法理解的语言接受信息;二是数学论证很可能过于具有诱导性或产生偏见,因为,那些貌似 “硬”的量化变数,很容易排挤那些 “软”的非量化变数;三是在诸如给无辜者定罪风险之可接受水平问题上,对特定事务的量化,在政治上是不适当的。6[美]特伦斯·安德森、戴维·舒姆、威廉·特文宁:《证据分析 (第二版)》,张保生等译,中国人民大学出版社2012年版,第331-332页。但是,特赖布的观点并没有平息法学家研究概率问题的兴趣,也不可能因此而阻止概率分析在法庭上的应用。在大数据时代,大数据作为一种资源、一种工具,在诉讼过程中用以证明案件事实的情况将普遍发生。

(一)大数据证据的类型界定

我国的法律将证据做了类型化规定,即某项证据在诉讼中均有一个具体类型分类。大数据时代的数据证据,根据其表现形式可以分为两类。一是电子数据证据。广义上讲,电子数据是指储存在计算机及网络上的以电子、数字、磁、光电、电磁等形式来证明案件真实情况的信息,他包括电子记录和电子记录的系统。7刘广三主编:《刑事证据法学 (第二版)》,中国人民大学出版社2015年版,第193页。此类证据,法庭可以借助于仪器及相关的程序等,直接予以审查和判断。二是鉴定意见。有些数据,需要通晓专门知识的人对数据进行专业分析和处理,并将其研判所得的意见提交法庭后,法庭才能识别和使用。此类证据即为鉴定意见。

以上两类证据,虽然都基于数据而生成,但二者之间的区别鲜明。电子数据证据是一种客观事实,存储于专门的设备和材料之中,法庭只需借助相关的仪器设备,利用相关的程序即可直接发现和识别。而鉴定意见证据,则需要将存储于专门设备和材料之中的数据,交由专家分析并得出研判意见,法庭才能识别;或者由专家运用专业知识和手段,对案件所涉事实进行数据搜集和整理后提交给法庭,法庭才能知晓。

(二)大数据分析的相关性结果与法律要求的因果关系之间的关系

建立在相关关系分析法基础上的预测是大数据的核心。8同前3引书,第75页。而在法律领域内,我们则以因果关系为标准判断案件事实关系。如果要以大数据分析结果作为判断案件事实的依据,似乎二者之间存在一定的紧张关系。但是,事实上,法律的判断并不一定是一种完全因果关系的判断。从理论上来说,审判权本质上就是一种判断权,而根据现代法律理论,审判权就是一种自由裁量权。根据 《最高人民法院关于民事诉讼证据的若干规定》,审判人员应当依照法定程序,全面、客观地审核证据,依照法律的规定,遵循法官职业道德,运用逻辑推理和日常生活经验,对证据有无证明力和证明力大小独立进行判断,并公开判断的理由和结果。不独我国如此,以证明标准为例,大陆法国家的内心确认标准与英美法国家的排除合理怀疑标准,实际上都只是一种可能性的判断。因此,从总体上来说,运用大数据分析结果对诉讼中的案件事实进行判断是可行的。

即使如此,我们还是应当注意,数据统计之间的相关性与能否产生相关的法律作用之间还是有区别的。如一个宣称两组之间在 “统计上具意义的差异”的结论只是表明两组之间的差异足够大,不大可能是由于偶然造成的。也就是说,它意味着提出样本的两组全体之间可能存在着 “真实”的差异。它并不保证这一差异足够产生某种法律或者社会意义上的 “意义”。党研究中所用的样本非常大的时候这一点尤其有关。当样本足够大的时候,全体之间的任何 “真实”差异,不管多么微小甚至是无关紧要,都会是具统计意义的。比如说,如果选取的组有足够大,两组保释犯的再犯率之间的0.5%的 “真实”差异将会是统计上具意义的。但是,没有任何法律判决或者社会政策会认为0.5%的再犯率差别是足够有用的。9[美]约翰·莫纳什、劳伦斯·沃克:《法律中的社会科学 (第六版)》,何美欣等译,法律出版社2007年版,第89页。

(三)大数据证据是一种专家分析结果

大数据证据是由相关领域的专家运用其专业知识所进行的一种技术分析和专业判断,法官由于不具备该项专业知识与技能,无法对大数据证据直接进行判断。因此,需要专家的协助,法庭才能正确认识大数据证据的意义和价值。

不仅如此,法官对案件事实的判断,除了依据大数据证据进行分析判断以外,还需要依据其他的价值准则。例如,对于一个刑事案件的犯罪事实的证明,大数据证据可能从概率的角度给出了一个犯罪嫌疑人可能有罪的分析。但是,如果法官不能从全案事实中综合判断得出犯罪嫌疑人有罪的内心确认,该项案件的指控将根据疑案从无的原则,判决刑事被告人无罪。为了维护司法的公信力和廉洁性,对于用非法手段获取的证据,即使大数据正确显示其真实性无疑,法庭也会加以排除。

对法庭而言,如何识别概率的意义和价值,也是一个比较复杂的问题。大数据只是对一种可能性作出判断,且以一般情况为条件,而法庭则是对具体问题的判断。就如同随机抛掷硬币的结果,从概率的角度而言,正反两面出现的结果会随着抛掷次数的增加而逐渐趋同。但法庭却不能以该项概率分析和试验的结果,作为判断本案的这一次抛掷硬币的结果是哪面在上。以判断证人证言的可信性为例,专家可以通过大数据进行分析得出一个证人证言真实性的概率判断,但对本案面对的特定的证人证言,却无法据此直接得出该项证人证言是否真实的结论。如果一个案件中,对于一项争议事实,两个或者两个以上的证人分别做出了完全相反的陈述,则更加难以运用对证人证言一般情况的大数据分析结论。

(四)大数据证据的形式要求

为了保证大数据证据能为法庭正确识别和认可,大数据证据本身首先要保证其形式规范。为此,大数据问题专家给出的意见是,为了保证依据大数据预测作出决策的准确性,需要注意一下四个原则:一是公开原则,公开用来进行预测分析的数据和算法系统。二是公正原则,具备由第三方专家公证的可靠、有效的算法系统。三是可反驳原则,明确提出个人可以对其预测进行反驳的具体方式。四是确保个人动因能防范 “数据独裁”的危害。10同前3引书,第224页。

除此之外,大数据证据也要符合法律的一般形式要求,如:大数据分析主体不是本案当事人或者与本案当事人没有利害关系,案件的处理结果与其没有法律上的利害关系,没有其他可能影响大数据证据可信性的因素;大数据服务商接受当事人和法院的委托,进行大数据搜集和分析的,其活动还应符合司法部 《司法鉴定程序规则》的要求等等。

(五)大数据证据的司法认定需要注意的问题

虽然法律的判断方法与大数据专家的判断方法不同,但是,在一个具体案件中,法官却必须面对大数据证据,并对大数据证据的内容作出是否采信的司法判断。

1.专家协助原则

在涉及大数据证据的案件中,即使我们能够读懂大数据结论的内容,也应当尽可能就教于相关领域的专家,以避免由于想当然而发生对大数据分析结论的错误解读和妄自假定,同时尽可能充分掌握大数据分析结论所能提供的各种信息,发现大数据分析结论之外的其他有效信息。在诉讼过程中,法庭不仅要审查大数据证据中的数据采集过程和数据结果的准确性问题,还要审查专家基于专业知识、运用技术手段对大数据所作的分析和研判。

在这个问题上,美国关于科学证据在法庭上应用的经验值得借鉴。1923年,在Frye v. UnitedStates一案中,最初确立了某种科学理论或技术必须证明在其所属的特定领域中已经获得普遍接受法庭才予认定的原则;但是考虑该原则可能造成将可采性问题的决定权交给相关的科学界的担心,1993年,在Daubert v.Merrell Dow Pharmaceuticals,Inc.一案中,确立了法官要对所提供的科学证据的可靠性进行审查的原则。11[美]Edward J.Imwinkelried:《从过去30年美国使用专家证言的法律经历中应吸取的教训》,王进喜、甄秦峰译,载 《证据科学》2007年第1期。Daubert规则的具体标准包括:(1)形成专家证言所依靠的科学理论与科学方法是否建立在可检验的假设之上;(2)形成专家证言所使用的科学理论与科学方法是否与现有的专业出版物中记载的原理相同;(3)有关理论已知的或者潜在的错误率以及该理论现存的研究标准;(4)指导相关理论的方法论及研究方法为相关科学团体所接受的程度。12徐继军:《专家证人研究》,中国人民大学出版社2004年版,第54页。目前上述两个判例所确立的Frye规则和Daubert规则在美国各州法院都在适用。此外,也有科学家列出了他们自己的专家意见采信的要素清单。例如:独立可检验性 (能独立检验因之而引起该检验的某些案例),统一性 (把一小族问题解决战略用于内容广泛的案例的结果),多产性 (当某个理论开辟了新的效果良好的领域),以及精确性 (即数据的精确和准确),系统的重要性 (对科学来讲),对主题的内在兴趣等。13[美]肯尼斯·R·福斯特、彼得·W·休伯:《对科学证据的认定——科学知识与联邦法院》,王增森译,法律出版社2001年版,第270页。

事实上,在鉴定结论与专家证言的可靠性问题的判断上,无论设计出多么具体与科学的采信标准,最终还是要依赖科学界自身的力量加以实现。难以想象一个道德沦丧的科学工作者团体能够在诉讼中良心突然发现。但是,这也并不意味着诉讼中专门性问题的证明仅事关科学界的问题,法律对此无能为力。由于诉讼中的专门性问题实际上已经演变成为一个法律性质的问题,具化为诉讼中的一个事实问题,因此,要求法律必须搭建一个有利于科学充分争论的舞台,建立健全相应的事实调查和证明规则,提供一套保证科学公平争论的规则,并使之按照法律的程序进行,而不能以某个科学领域的自有方式进行。

2.综合全案事实判断原则

有些貌似合理的东西,事实上却只是一种假象。将因果关系与普通联系关系混为一谈是经常可见的一种现象。例如在某种职业与某种疾病的关联性问题上,只要在职业小组和疾病之间进行的比较足够充分,就会发现很多统计学上有重大意义的结果,但是,其中很多结果通常只是统计上的偶然巧合而已。因此,对各种的数据统计应当保持必要的审慎。统计是以数字形式存在的证据,该类证据因为披上了科学和精确的外衣,彷佛就代表了事实,更具欺骗性。假如说暴力犯罪比去年增长了67%,似乎令人担忧,但可能只是由去年的3件增长到今年的5件。

3.审慎取舍原则

大数据对法律判断有着十分重要的价值,但大数据本身不会自己说话,它必须依赖可靠的专家并借助过硬的软件设计和分析程序。大数据的特色是在复杂中发现线索,其中起决定性作用的是人,而只要是人设计的东西和分析得出的结论,难免会发生错误,有时基于一个真实的事实,也会推导出错误的结论。科学事实可能是可靠的、有效的 (如损害结果),但由此得出的推论可能是混乱的或者具有严重误导性的 (致害原因),真实的事实脱离背景或从错误的角度看来可能会暗示错误的结论。

在涉及大数据证据的诉讼中,还须注意要避免对科学的迷信。科学研究是一种人类活动,科学家和其他人一样,也可能会犯各种错误。但现实生活中存在一种极端的认识,认为任何称之为科学的东西都肯定是完全客观、完全正确并且不带一点主观色彩的。且不说科学技术已经走上了产业化,实际上已经形成了一种利益共同体,它可能会利用大家对科学技术的迷信为自己谋取利益,即使在客观公正的科学研究活动中,也难以保证绝对的正确性。如:2001年由当今世界第一大烟草公司菲利普·莫里斯发起的臭名昭著的研究,这项研究告诉捷克政府吸烟有利,因为烟民的早亡能够节约政府在养老金、保健及相关方面所花费的资金。14[美]丹尼尔·科顿姆:《教育为何是无用的》,仇蓓玲、卫鑫译,江苏人民出版社2005年版,第213页。

诉讼中的大数据分析意见因为是由具有某种专门知识的人做出的,其外观也被笼罩上了浓厚的科学的色彩,甚至认为大数据证据的证明力大于其他书证、视听资料和证人证言。这种对专家意见证据的证明力未审先定的做法,不仅违反诉讼科学,也不符合自然科学活动规律,是 “把科学知识凌驾于其他知识之上,”对 “科学知识的不恰当运用”(中国科学院学部主席团 《关于科学理念的宣言》)的典型表现,也是受了科学技术的胜利所造成的新思维习惯影响的结果。15[英]弗里德里希·A·哈耶克:《科学的反革命——理性滥用之研究》,冯克利译,译林出版社2003年版,第116页。

需要强调的是,作为法律人,我们必须重视包括大数据在内的科学,树立正确的科学问题态度,并学会正确地运用科学。法律作为人们行为的规范,也包含了对科学技术领域人类活动的规范,它不仅平衡了科学技术发展与人类社会其他重要利益之间的关系,也赋予科学技术发展以良心、责任、公益等价值的追求。对诉讼中所涉及的科学问题的调查与证明,既要避免唯科学主义对诉讼证明的负面影响,防止各种伪科学对诉讼的侵袭,同时要对诉讼证明制度进行科学的建构,探索科学的诉讼证明制度与方法,并展示出法治的价值与精神。

(责任编辑:卢护锋)

*广东工业大学政法学院院长、教授,广东工业大学大数据战略研究院副院长,广东工业大学大数据战略研究院大数据法律问题研究中心主任。本文系广东省教育厅质量工程建设项目 《以工业法为导向的法学专业综合改革》项目的阶段性研究成果;本研究工作受广东省人文社会科学重点研究基地——汕头大学地方政府发展研究所开放基金项目资助。

猜你喜欢
证据法律
垃圾袋里有证据
法律解释与自然法
法律讲堂之——管住自己的馋嘴巴
法律讲堂之——交通安全我最棒
隐藏的证据
手上的证据
家庭暴力证据搜集指南
让人死亡的法律
手上的证据
让法律做主