大数据证据的法律审视及算法规制探析

2023-02-27 09:47陈晓璇吕泽华
关键词:庭审证据算法

陈晓璇,吕泽华

(中国海洋大学,山东 青岛 226100)

上世纪50年代起,国外法学界开始出现人工智能介入司法庭审样态(1)Lucien Mehl,Automation in the Legal World,Proceedings of conference on the Mechanisation of Thought Processes.Teddington,1958.的理论探索,实务界也出现了将汽车事件数据记录系统数据(2)Commonwealth v.Safa,95 A.3d 304,308,309(Pa.Super.Ct.2014).、GPS坐标数据(3)United States v.Lizarraga-Tirado,789 F.3d1107,1109,1110(9th Cir.2015).等用作庭审证据的案例;上世纪90年代,国内也逐步开展了大数据证据的研究与应用。尤其是近年来,随着多项法律政策的修改完善,大量的新兴证据材料涌向法庭,大数据证据的理论研究与实践探索方兴未艾,各种相关的问题和挑战也应运而生。本文拟通过分析算法的规制路径及大数据证据在庭审各阶段的功能,对当前大数据证据的定位以及面临的困境作出回应,进而提出完善大数据算法规制的建议,以期为大数据证据的发展提供可行的思路导向。

一、“定位”:明晰大数据证据的审判角色

(一)大数据证据与电子数据证据之辨析

大数据助力刑事审判的核心问题与诉求在于其对证据体系的革新与作用(4)参见杨继文,范彦英:《大数据证据的事实认定原理》,载《浙江社会科学》2021年第10期,第46-54页。。大数据转化为证据需要按序经过三个步骤:对海量数据信息进行汇总、分析,建构模型或算法,最后通过数据运算生成结论。在此基础上,有学者对大数据证据定义为“基于海量电子数据形成的分析结果或报告”(5)参见刘品新:《论大数据证据》,载《环球法律评论》2019年第1期,第21-34页。,其中所指的“电子数据”应当为证明案件的信息来源,也可以直接理解为电子数据证据,即《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》中对电子数据的定义:“电子数据,也称电子证据,是指案件发生过程中形成的,以数字化形式存储、处理、传输的,能够证明案件事实的数据”。也有学者认为,大数据证据不同于运用电子数据分析形成的证据(6)参见郑飞,马国洋:《大数据证据适用的三重困境及出路》,载《重庆大学学报(社会科学版)》2022年第3期,第1-13页。,因为后者在一定程度上仍然是对传统证据的汇总,而现代意义上的大数据证据应当是对电子数据进行筛选、提炼形成的对裁判有实际效用的可采证据。

本文认为,上述观点并不冲突。大数据之父舍恩伯格从证据的价值属性出发,强调大数据证据需要以海量证据(包括电子数据)为基础提取价值和服务(7)参见刘显鹏:《电子证据认证规则研究——以三大诉讼法研究为背景》,北京:中国社会科学出版社2016年版,第25页。,从而进一步对比和分析提炼涉案有效证据。可以说,大数据既是一种形式,又是一种技术和方法,它既没有改变数据的原始形态(8)参见王燃:《大数据侦查》,北京:《清华大学出版社》2017年版,第109-116页。,又分析证成于客观数据本身。

面对海量的数据材料,应当是“抱令守律”,将其因循全部归纳为案件线索和证据;还是应当“不落窠臼”,延展大数据作为进一步审判环节的可采证据,需要明晰大数据证据在证据体系中的功能与定位来加以断定。

(二)大数据证据的功能与定位——辅助性

1.作为证据手段进行事实认定

大数据基于算法模型进行分析。由于事实认定是一个经验推论过程(9)参见张保生:《事实、证据与事实认定》,载《中国社会科学》2017年第8期,第110-130+206页。,司法工作人员仅凭对证据进行收集、汇总、提炼等人力劳动和理性经验,难以完成对海量数据的提取以及规模化数据分析。在这个过程中,大数据虽然不能对证据的资格和能力进行实质性的审查判断,但是通过算法筛选,可以在海量非结构化的数据中提炼出有效、规律的集合,以便发现、找寻规律,对个案甚至类案的方向和结果作出预测。上述工作对判断证据在形式上是否具备证据能力,或通过证据汇总进行案件细节的筛查和分析预测大有裨益(10)参见〔美〕Pamela S.Katz:《专家机器人:利用人工智能协助法官采纳科学性专家证言》,载《证据科学》2017年第4期,第487-513页。。大数据的判断预测,应当遵循辅助参考、效率优先、安全限定等原则(11)参见宋静:《人工智能在刑事案件证据审查中的应用路径研究》,载《法制与经济》2020年第1期,第106-107页。,不能“越俎代庖”,完全取代司法机关及裁判者的法律地位。

2.大数据证据属性的立场定位

目前,理论和实务界对于大数据证据的认识和定位未作统一明确。若按证据形式判断,仅有电子数据和鉴定意见两种大数据证据形式(12)参见钟明曦:《论刑事诉讼大数据证据的效力》,载《铁道警察学院学报》2018年第28期,第83-87页。。划分证据种类,反对大数据证据直接作为证据种类的学说并不多见,更多的是探讨其能否独立地成为某种证据种类,应归为何种证据种类,以便在审判中发挥作用(13)参见林喜芬:《大数据证据在刑事司法中的运用初探》,载《法学论坛》2021年第31期,第27-36页。。有学者根据“资金大数据分析结论”,将大数据证据归并到鉴定意见种类中(14)参见何家弘等:《大数据侦查给证据法带来的挑战》,载《人民检察》2018年第1期,第56页。;也有学者提出,大数据证据本质上是一种电子证据,而且是电子证据的体现(15)参见杨继文,范彦英:《大数据证据的事实认定原理》,载《浙江社会科学》2021年第10期,第46-54页。。还有学者认为,大数据证据“综合性”和“重方法”的特点,使其区别于其他证据,应当将其作为单独的证据种类;或可以借鉴英美法系关于人证、物证、书证这一更具有开放性的证据分类方式(16)参见徐惠,李晓东:《大数据证据之证据属性证成研究》,载《中国人民公安大学学报(社会科学版)》2020年第1期,第47-57页。。司法实务中,倾向选择将大数据证据归入鉴定意见中使用(17)参见龙宗智:《司法改革与中国刑事证据制度的完善》,北京:中国民主法制出版社2016年版,第16-18页。。

综合考量大数据智能推理的逻辑形式,以及推理过程中可能出现的技术等因素,可以发现以下问题。首先,将大数据证据直接作为证据类型使用,会影响到“实体真实”的发现。证据搭建了主观认识客观的媒介(18)樊崇义:《客观真实管见——兼论刑事诉讼证明标准》,《中国法学》,2000年第1期,第115~121页。,当前大数据技术不成熟、黑箱化等因素,使得算法在推理过程中容易出现失误、歧视等偏差。过分信赖大数据得出的分析、预测结论,会直接影响裁判结果。其次,大数据证据具有不同于其他证据形式的特点,如动态性、预测性和非结构性,现有各种法定证据种类的审查标准,并不完全适用于大数据证据。将大数据证据归入某一证据种类,不仅会弱化大数据证据本身的证明力和证据能力,也会在一定程度上模糊这一证据种类的概念和性质。最后,若将大数据证据作为独立的证据种类,极有可能颠覆现有的诉讼模式和体系,由原来对照式的、多主体多机关共同发现实体真实和证据,转变为单一主体(人工智能)即可以发现实体真实的诉讼模式。

因此,理性的做法是不管在定罪程序还是量刑程序(量刑程序中,国内学者对大数据证据的辅助性定位意见趋向一致(19)刘笑寒:《论刑事审判中的大数据证据》,济南:山东大学硕士学位论文,2020年。),都应将大数据看作一种“AI助手”,辅助裁判者进行理性决策,为司法审判提供偏向效率层面的帮助。有学者提出,“大数据分析是辅助事实认定过程中的重要进路”(20)周蔚:《大数据在事实认定中作用机制分析》,《中国政法大学学报》,2015年第6期,第64~82页。“法律人工智能应定位于做辅助法律人决策的助手与参谋角色”(21)左卫民:《关于法律人工智能在中国运用前景的若干思考》,《清华法学》,2018年第12期,第108~124页。,将其更多运用于技术层面的工作等。当未来算法技术显著成熟时,可再行进一步探讨大数据分析提炼的证据是否可作为证据种类直接在庭审中运用。

二、“迷雾”:大数据证据运用困境与难题

(一)司法适用层面——尚未形成系统的大数据证据规范

1.数据失真

一方面,大数据证据的真实性取决于生成该证据的机器学习程序代码,但程序代码需要根据算法设计者的指令运行(22)参见孙清白:《人工智能算法的“公共性”应用风险及其二元规制》,载《行政法学研究》2020年第4期,第58-66页。;另一方面,由于人工智能机器运行的自动性,在整合数据时进行格式化处理或者再加工,可能使得原始数据失真(23)参见陈瑞华:《实物证据的鉴真问题》,载《法学研究》2012年第4期,第6页。。笔者在北大法宝以及裁判文书网,以“大数据”“大数据证据”“真实性”为关键词进行检索,共收集到193件案例。以此为基础进行数据分析,可以发现刑事审判中大数据证据的实践现状如下:

表1 大数据证据的真实性审查认定结果

可见,在刑事案件审判中,质疑数据真实性的案例过半。因此,在大数据证据的真实性审查环节,需要严格的准则和专业鉴真。在理论上,现有学说观点并未落实到具体的大数据证据审查和算法规制路径(24)参见吴才毓:《大数据公共安全治理的法治化路径:算法伦理、数据隐私及大数据证据规则》,载《政法学刊》2020年第5期,第33-41页。;立法实践中,我国尚未确立大数据证据的审查规则;审判实务中,裁判者囿于经验认知或专业受限等原因,也未对大数据证据进行细致、合理的全面审查。

2.取证受限

大数据证据取证环节中取证主体引发的问题主要表现在以下两个方面。第一,取证主体各方的取证能力和诉讼地位不平等。一般而言,公诉方在大数据获取和分析上占有支配性优势,其不仅享有由国家匹配的各种数据库等资源,而且也具备在必要时调取社会机构数据的权力。相比之下,辩护方在数据收集与处理方面的能力与公诉方存在一定差距。第二,取证主体的技术素养难以把握,甚至会侵犯公民个人隐私。在大数据时代,个人信息表现为“个人弱控制”与“产业强需求”,在《民法典》“人格权编”中被定位为“弱支配”程度的人格权益,亟须加强立法保护。有学者进一步提出,在犯罪确定前收集、分析个人信息,本身就是与无罪推定原则的冲突(25)参见林喜芬:《大数据证据在刑事司法中的运用初探》,载《法学论坛》2021年第3期,第27-36页。。由此可见,大数据取证的环节引发的一系列问题,需要我们认真反思,并进一步探索合理完善的大数据证据规则。

3.质证低效

有学者提出,大数据证据的审查,应当聚焦于证据能力和证明力两个层面,需要对证据内容的相关性和可靠性进行审查;有学者指出,裁判者在审查大数据证据时,需要进一步对证据属于电子证据还是人工智能证据进行二次区分(26)参见马国洋:《论刑事诉讼中人工智能证据的审查》,载《中国刑事法杂志》2021年第5期,第158-176页。。当前,我国大数据质证环节的证据审查效率较低,开庭过程中,裁判者需要在大量卷宗材料中找到关联信息并进行标注,影响庭审进度;大数据证据的编程代码等无法进行有效的展示,极易漏掉关键质证意见,影响审判结果;庭审中,当事人与专业人员需要对专业性问题进行反复讨论和解释,影响审判流程;审查证据的完整性、关联性、证明力强弱等问题时,鉴于上述对大数据证据的辅助性质和定位分析,那么大数据证据的证明力和法定证据形式的证明力何者更强,抑或具有同等的证明力,质证环节中仍有许多细节需要进一步准确界定。

(二)技术层面——算法沦为“算计”

除了大数据处理的证据真实性需要加以判断审查外,还有一些实质性的问题需要深入探讨。技术真实并不等同于法律真实,大数据在自主化决策过程中,存在许多不确定因素,使大数据证据的运用面临着数据维度、算法维度和程序维度的风险[30]。一方面,大数据庞大的计算能力和储备系统,使其在很多领域上超脱了人类决策,甚至比人类决策更有智慧、更难以控制。因此,大数据统计的结果有可能不为人类所理解和接受,设计算法的决策者有时也无法作出令人信服的解释。另一方面,大数据证据可能具有建构性。司法的目的往往出于社会可接受性的需要,不仅会裁剪案件事实,甚至会故意偏离客观真实,因此算法设计必定由数据决策者所追求的功能定位和价值目标、群体偏好以及利益衡量等多方面所共同决定(27)参见林钰雄:《自由心证:真的很“自由”吗》,载《台湾本土法学杂志》,2001年第27卷。,有可能导致算法与结果偏离公平正义的轨道。

综上所述,社会公众甚至裁判者都无从知晓大数据分析证据的依据和原理,算法的决策者也不可能对簿公堂明示编程设计,会导致决策过程不透明,大数据系统有可能变成“黑箱”,进行政治经济等方面的垄断,成为少数人统治的工具。例如,广受质疑的美国犯罪风险评估系统COMPAS算法(28)参见[美]约书亚·德雷勒斯、艾伦·C·迈克尔斯:《美国刑事诉讼法精解(第1卷)》,吴宏耀译,北京:北京大学出版社2009年版,第98页。,在对不同肤色人群进行犯罪统计并预估再犯率时,评估黑人再犯指数达到白人的两倍,但实际结果却截然相反。算法设计生成的统计结果将文化水平、犯罪前科等因素相关联,这种无视法理逻辑,仅凭算法推理得出的结论,无疑违背了品格证据排除规则。设计者基于自身对某些群体的偏见,可能会在算法设计中加入歧视性因素。将这种算法大数据自主化决策形成的结果提交给法庭作为证据使用,无疑会对相关人群造成严重伤害。

人工智能大数据介入刑事司法证据体系,引发了一系列质疑:大数据证据是否能够做到公正且不失偏颇;是否可以被量化、形式化;是否可以被翻译成具有可操作性的通俗易懂的证据,在诉讼中直接使用;应当由何主体来保障大数据处理后,证据的公平性和透明性,等等。

三、“破冰”:多元视角下的规制路径

与其他传统证据大相径庭,在缺乏监督约束的条件下,大数据证据的性质和作用往往是未知且无法控制的(29)参见孙清白:《人工智能算法的“公共性”应用风险及其二元规制》,载《行政法学研究》2020年第4期,第58-66页。。如何在顺应时代创新和发展要求的前提下,维护人类的基本法律权利和决策能力,将算法决策产生的风险控制在固定阈值或合理范围内,本文拟在参考和评析以往学术经验的基础上,提出笔者的观点。

(一)大数据证据的审查体系建构:“鉴——取——审”

1.证据“鉴真”

鉴真(authentication),是指证据提出者必须用证据充分证明,其所提出的特定证据确实是其所主张的证据,以规避“失真”作为大数据证据审查的前置步骤。鉴真不仅能够对证据的真实性进行鉴别,同时也能保证证据之间的相关性(30)参见刘品新:《电子证据的鉴真问题:基于快播案的反思》,载《中外法学》2017年第1期,第89-103页。。区别于其他传统证据的鉴真模式,有学者认为,大数据证据应采用存储介质和物质载体的双重鉴真(31)参见吴同,周丽:《论刑事诉讼中电子证据的鉴真》,载《山东警察学院学报》2014年第1期,第73-81页。。本文认为,“双重鉴真”首先应审查大数据物质载体的真实性,着重审查证据的物质载体与介质是否完好无损,证据流转的链条是否顺畅连续,相关主体是否尽到保管义务等;其次,应对数据分析后的证据与原始证据对比审查,如果处理后的数据与原始数据的关键信息与内容无二致,那么基本可以确定,数据分析环节中没有“失真”。

此外,完善大数据证据的鉴真规则和机制,需要对相关主体进行规制,以丰富鉴真的手段和方式。例如,运用 AI 技术,对人工智能算法加工的图像进行鉴真(32)参见刘译矾:《论电子数据的双重鉴真》,载《当代法学》2018年第5期,第88-98页。;尝试引入自我鉴真规则,由政府机关收集的数据或认证的源代码生成的大数据证据,或由独立第三方评估过的程序代码生成的大数据证据等,均可以纳入自我鉴真的情形(33)参见郭金霞:《电子数据鉴真规则解构》,载《政法论坛》2019年第3期,第56-66页。。此外,法官在对大数据证据进行审查时,不仅应依据辨认鉴真规则的要求审查,还应该起到 “守门人”的作用,确保鉴真工作建立在可靠的基础之上。

2.取证设计

一方面,针对实践中取证主体能力和诉讼地位不平等的问题,建议赋予公诉方、当事人同等的委托第三方专业机构搜集分析大数据的权利。接受委托的第三方专业机构必须是专业数据处理者,根据特定的适用人员和范围,数据处理的目的、内容、方式,以及法律明确规定的权利、职责和义务,向诉讼主体提供专业服务,并自觉接受企业合规的约束。当事人自行调取数据证据程序复杂、成本高昂,需要接受较长的诉讼周期并承担高额的诉讼费用。人民法院可以参考法律援助的标准,为当事人或辩护方申请专业机构提供相应的帮助。在当事人未委托专业机构的情况下,人民法院可以指定专业机构或人员进行证据鉴定和处理,并通过后续的制度设计,将社会大数据平台接入司法机关证据平台,确保数据证据助力司法办案的机制良性运行(34)参见田晶林:《第三方存证平台中电子数据证据效力研究》,上海:华东政法大学硕士学位论文,2019年。。

另一方面,针对侵犯个人隐私的情形,需要赋予当事人庭审前获得、调取和分析大数据证据的申请权。在具体设计中,在《中华人民共和国网络安全法》规定的执法协助义务的基础上,进一步建立完善的大数据证据个人信息保护规则;采取信息的分类处置规则,借鉴国外的成功经验和技术标准,将个人信息分为一般个人信息和个人敏感信息,大数据系统在取证阶段,根据主体和范围分类汇总不同敏感程度的信息,并对个人敏感信息重点标注、审慎使用,尽到合理提醒与保护义务。

3.质证提效

有学者提出,大数据证据的证据能力审查,应该能经受住相关性检验和科学可靠性检验。在证明力评价层面,应结合大数据应用的信息连接点选择、逻辑架构合理性等,判断大数据证据的可信性以及对待证事实的证明程度(35)参见程龙:《论大数据证据质证的形式化及其实质化路径》,载《政治与法律》2022年第5期,第96-114页。。

为避免影响庭审进度,对于通过规律性认识的数据报告或易引发争议的证据,建议在法庭上慎用精用,以免陷入质证困境;为避免无效证据影响审判结果,可以吸纳符合条件的专业人员作为人民陪审员,参与庭审共同解纷,以防遗漏关键信息和质证意见;为避免影响审判流程,应当仅就关键数据证据和争议焦点信息展开质证,重复性同种类证据归类解释,非必要证据提交书面分析和讨论即可。对于证据相关性可靠性等方面的质证,首先明确证据审查的顺序。由于证据的相关性审查难度较小,应当采取“先相关性后可靠性”(36)参见马国洋:《论刑事诉讼中人工智能证据的审查》,载《中国刑事法杂志》2021年第5期,第158-176页。的次序,通过筛选后应直接过渡到可靠性审查,以利于精准审查范围。对于证明力强弱等问题的界定,同时涉及到大数据证据对法官自由心证的影响,对证明力评价要遵循论理法则和经验法则的内在约束(37)参见吴桐:《任意侦查视角下信息化侦查的规制进程》,载《贵州警官职业学院学报》2017年第4期,第62-69页。。既然已经赋予大数据证据辅助性的定位,在审判过程中就不应高估其证明力,应当在斟酌数据本身逻辑合理性、结论稳健性等问题的基础上,做出合理判断。

(二)搭建数据信任的桥梁

1.厘定获取大数据证据的有限“第三方理论”

通常情况下,公民明知个人信息数据会被第三方平台留存而依然使用各类网络服务,可以将其推定为符合任意侦查“自愿”与“同意”的主观标准,侦查机关收集这类个人信息数据作证据不构成对公民权利的侵害(38)参见赵艳红:《大数据监控措施的法律规制研究——以隐私权为中心的探讨》,载《交大法学》2020年第4期,第132-148页。。但是,社会公众很难认识到这些留存的数据可能成为在日后诉讼中对自身不利的涉案证据,我国目前在对侦查行为的规制中,也无明确的“第三方理论”适用等问题。因此,侦查机关在办案过程中提取证据,需要设置公民对隐私信息被公用的合理期待阈值,厘定“第三方理论”提取数据的界限和范围。首先,在隐私告知中,声明个人在使用平台服务时,可以有选择地将信息提交给第三方,以此甄别公民使用网络服务而留存的数据是否属于隐私权对象,可以作为证据调取;其次,通过醒目方式,提示公民未来侦查机关可能会对用户提交的数据同步监控和办案取证,达成用户、侦查机关以及第三方信任的提前介入。

2.大数据证据的信息披露义务——特定指向的公开

我国法律并未明确禁止算法垄断,因此,在社会需要或者公权力机关等主体需要获取算法进行决策或审查时,要在合适范围以及情形下,进行大数据内部分析证据的开示,或决策者以将数据转化为通俗易懂的语言等方式,向社会公众进行解释(39)参见李婕:《垄断抑或公开:算法规制的法经济学分析》,载《理论视野》2019年第1期,第66-69页。,尽可能公开和获得反馈,以提高社会的接纳度和信任度。可以公开特定的数据源代码,以接受社会公众的质疑和检测(40)参见丁晓东:《论算法的法律规制》,载《中国社会科学》2020年第12期,第138-159页。。公开应当在数据开发早期进行,以便更好地接受社会监督,避免发生算法垄断的不利后果。

某些特殊情况下,例如公开数据系统可能会侵犯商业知识产权等利益时(41)参见《互联网巨头应设立伦理委员会》,载财新网,http://opnion.caixin.com/2018-01-12/101196908.html,最后访问时间:2023年7月28日。,应当采取局部公开或小范围公开披露的方式,进行适度合理的解释和说明;同时,鼓励数据设计者建立内部合规审查制度,在算法应用的各个阶段进行审查并及时修正,并设置一定比例的人工复查要求,尽量将合规风险降到最低。可以考虑成立算法伦理委员会,对采集证据的安全风险进行评估;设立专业审查机构,保证大数据分析的证据合法性与正当性(42)参见杨国荣:《道德系统中的德性》,载《中国社会科学》2000年第3期,第94页。;设置统一的专业评议机构,对原始数据进行审查、评估和监督,将优化后的数据提交给法庭使用。

3.为算法信任设置正确导向

在大数据分析证据时,自然人(设计者、专业人员)的参与是否会让公众更加信任;当“算法歧视”“算法黑箱”等术语甚嚣尘上,如何平衡对数据的依赖和怀疑;面对大数据时代的来临,应当如何发现“数据之美”,构造安全、公平、透明、可问责的算法,从而迈向数据信任的社会,都是大数据介入证据体系所面临的现实问题。

首先,应当强化数据算法的德性,对算法进行道德内化,将道德伦理外化于法律规制行为模式、法律后果等。“科学技术发展既能促进伦理道德进步,也能导致道德退步”(43)参见谢澍:《人工智能如何“无偏见”地助力刑事司法——由“证据指引”转向“证明辅助”》,载《法律科学(西北政法大学学报)》2020年第5期,第109-119页。。因此,应当积极引导技术道德向良性发展,在充分认识分析数据的基础上,输入教育成分,防止算法异化。数据是理性客观的,但操作数据是人为主观的体现。将良好的道德观融入数据设计、应用的全过程,不仅能够使裁判者与其他诉讼参与人对庭审中证据的分析与使用更加信赖,而且有利于提升社会公众对大数据证据、对庭审公开公正以及对整个司法工作的信任。

其次,应当摒弃对大数据分析决策的偏见,确保大数据能够“无偏见”地助力司法审判。应当从形式意义上的证据指引转向实质意义上的证明辅助,实现基于证据评价的概率测算(44)参见刘友华:《算法偏见及其规制路径研究》,载《法学杂志》,2019年第6期,第55-66页。,为算法提供更多无偏见色彩的、透明的训练数据。裁判者根据大数据证据作出的决策,应受算法的支持而非支配;法官作为审判主体,在庭审中应保持中立裁判,避免因算法造成偏见和狭隘认知。

最后,建议以“目的/结果”为导向,择优考量算法的内容。例如,“减少再犯率”是数据分析的目的,只要经过实践验证为更优的方法(成本合理、降低错判率)即值得信任,无论数据分析过程中,是否有专业人员等介入因素影响算法决策。

四、“远瞻”:大数据介入证据体系的未来图景

(一)算法的规范改进

大数据首要考虑算法的准确度和科学性问题,因为“放在天平上的分量不是证据的数量,而是由证据产生的盖然性以及案件的全部环境决定的”(45)参见沈达明:《英美证据法》,北京:中信出版社1996年版,第46页。。美国参议员罗恩·怀登(Ron Wyden)、科里·布克(Cory Booker)等提出了《2022年算法责任法案》,这项法案为软件、算法和其他自动化系统带来更好的透明度和更新的监督方式。这些系统被用来对美国人生活的各个方面做出关键决定。算法决策者不能再对自动化系统的有害影响视而不见,无论是否有意为之。

我们必须确保算法为大数据分析证据提供中立而透明的帮助,而不是边缘化和隔离。当前,亟需探索契合我国法律实践的算法规范方案,以便迅速、有效地挖掘大数据的证据价值。一方面,应当提高专业准入的人才门槛,通过培养“法律+计算机”专业人才队伍,强化对数据证据体系的深度融合理解,以便将数据分析的偏差降到最低(46)See Bennett Moses,Lyria and Chan,Janet,Using Big Data for Legal and Law Enforcement Decisions:Testing the New Tools.University of New South Wales Law Journal,Vol.37,No.2,2014,pp 643-678.;另一方面,大力推进算法技术的提升,在数据“开源”的基础上挖掘革新,尽快落实算法设计者和操作者的责任机制,建立与大数据技术发展相关的法律规范体系,通过“数据的理性+人的解读”,构造人与数据协同一体的证据体系。

(二)大数据证据在庭审各阶段的价值运用

在对大数据证据功能定位分析的基础上,应当进一步明确庭审前、庭审中、庭审后三个阶段的证据价值运用。

庭前阶段,大数据应当作为证据手段进行形式事实认定。主要目的是发现案件中证据的瑕疵、矛盾之处,以及判断其是否满足证据资格,但不应赋予其单个证据证明力或全案证据的判断功能,以此为庭审举证质证作铺垫。不能以发现实体事实为主要目的,否则将削弱庭审程序的存在意义(47)参见纵博:《人工智能在刑事证据判断中的运用问题探析》,载《法律科学(西北政法大学学报)》2019年第1期,第61-69页。。

庭审过程中,由于庭审实质化对法官自由心证的要求,大数据容易影响裁判者,导致其“先入为主”,因此不能完全借助大数据进行证据分析判断。此时,应当丰富创新大数据证据的庭审展示方式。根据大数据证据的辅助性质与功能定位,在证据展示时应当灵活结合,不拘泥于对号入座的形式,既可以将大数据证据作为其他证据的支持或反驳材料使用,也可以通过现场数据模拟和重演的方法,弥补分析报告或其他证据的证明力。

庭审结束后,裁判者可以借助大数据辅助心证的形成。庭审后,控辩双方可以根据大数据分析的报告结论,进行充分的举证和质证;法官在举证质证和法庭辩论的基础上,综合案件全过程进行裁判,最后通过举例说明和解释判决结果。数据挖掘证据的过程较为晦涩难懂,庭审数据分析报告中,如果结合示例加以阐释,能够更充分有效地发挥数据证据的结果价值,不仅为控辩双方理解和接受,也会为社会公众普遍理解和接受。

在大力推进大数据技术在司法领域中的应用时,应当始终保持对大数据证据的高度审慎态度和开放包容的姿态,为数字化庭审构筑可持续上升空间。未来大数据在庭审中应当分阶段、分情况介入和发挥作用,在最大化发挥大数据价值的同时,充分保障司法公正性和权威性在庭审各环节的实现。

猜你喜欢
庭审证据算法
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
进位加法的两种算法
民事庭审优质化的标准
对于家庭暴力应当如何搜集证据
一种改进的整周模糊度去相关算法
手上的证据
“大禹治水”有了新证据
手上的证据
自动到案后仅在庭审时如实供述能否认定自首