“类案类判”智能化与刑事类案检索应用研究

2024-04-27 08:22周凤萍
华章 2024年3期

[摘 要]在刑事司法中,类案检索对保障司法公正和维护法制统一具有重要意义。类案检索作为实现“类案类判”的基础模块,其检索的精细化程度将直接影响量刑辅助、偏离预警、文书自动生成等模块的结果。随着智慧法律的出现,类案智能平台应运而生,在发挥其价值功能的同时也存在一定局限,如刑事数据整合缺乏有效性、语义技术限制检索的精准性、检索需求与刑事类案供应不匹配等问题。通过建立完整的刑事案件分类数据库、设置智能语义识别“标签”及填补刑事类案库中“特殊案件”空白等措施完善类案检索系统,能最大程度发挥智能司法效能,同时兼顾司法公正与司法效率,完善“智慧法治”的体系建设。

[关键词]类案类判;类案检索;智能司法

“类案类判”是司法责任制改革背景下裁判者应遵循的必然要求。近年来,最高人民法院为进一步全面落实司法责任制,发布了一系列关于“类案”的要求。类案检索是实现“类案类判”的关键途径之一[1]。在国家大力推进“智慧法治”建设的背景下,中国裁判文书网、法信等检索平台成为承載类案的重要工具。类案检索在司法辅助任务中因其庞大的数据量和高度智能的算法而起到了至关重要的作用,但当前司法人工智能技术仍然存在一定的局限性,导致司法实践中,类案检索的应用并没有达到预期效果。

一、刑事类案检索系统的价值

(一)保障刑事司法公正

在刑事司法过程中,保障司法公正即要使被告人在法律面前都能够平等地接受审判和处理,并最终得到公正判决。刑事类案检索对于刑事司法公正具有积极影响,主要体现为:第一,刑事类案检索提供了大量的案例文本和法律判例,为法官、检察官和律师在刑事审判过程中提供了先例参考。通过对类似案例的检索和分析,可以确保类似案件在司法决策中得到一致和公正的处理。第二,刑事类案件检索有助于确保法律的平等适用。通过检索和比较不同案件的审判结果,能及时发现并纠正司法实践中的不平等现象,避免对某一特定群体或个体予以不公平对待。第三,刑事类案件检索通过对大规模的数据进行分析和监督,以使司法人员能及时察觉可能存在的司法决策错误现象,避免审判人员在罪名确定、刑罚适用上出现偏差[2],这有助于司法机关和监管部门及时纠正偏差,提高司法决策公正性。

(二)维护法制统一

实现刑事法制的统一是维护司法公正和社会稳定的重要基础,不仅包含刑事实体的统一,还包含刑事程序的统一。统一的刑事实体规定主要用于规范各类刑事犯罪的构成要件、处罚标准和程序规定,确保刑事法律规定的一致性。统一的刑事程序规定主要确保在不同地区和法院实施相同的程序,避免程序上的差异导致不公正的结果。而在司法实践中,各地对相似案例的处理方式大不相同,导致刑事个案法律适用不统一。刑事类案检索制度可以在维护刑事个案法律适用的统一方面发挥重要作用。以最高人民法院颁布的指导性案例为例,最高人民法院筛选典型案例作为指导下级法院类案审判的参考,下级法院在类案中应予以遵循[3]。通过刑事案件的类案检索,能够为法官提供一幅“全景图”,使法官能了解到上级法院及其他同级法院所做出的生效判决,并以此作为办案的“参考系”。各地法官在基于案例检索报告的“规则框架”中办案,必然有利于实现刑法适用的统一。

二、刑事类案智能检索系统的应用现状

(一)类案检索平台的应用现状分析

目前,我国已建立了多个类案检索平台,如中国裁判文书网、北大法宝、无讼、智审等。这些平台提供了大量的刑事案例文书和法律参考资料,用户可以进行检索、浏览和下载。目前,中国裁判文书网已经收录了1亿多份判决文书,成为当前各级人民法院法官等司法人员最广泛使用的类案查询平台。但其在使用过程中出现的问题仍然较多:第一,站点的平台容量较小。裁判文书网站的每日的访问量非常庞大,在高峰期间,网站则出现服务响应缓慢、服务器瘫痪、无法登录等问题。第二,检索范围有限。一些案件社会关注度较高,但是却没有被上传到裁判文书网站上。另,一些已决案件没有及时上传至裁判文书网。第三,检索的智能化程度相对较低。高级检索选项在定位类似案件上不全面,通过案由和关键词检索得到的案例种类多,这需要法官投入大量时间进行筛选,以判断是否属于类案。如北大法宝、Alpha案例库、无讼和智审这样的非正式检索平台,主要为律师提供法律大数据查询、文档管理和客户拓展等服务,所有应用均需支付费用方可使用。该类平台的检索功能主要集中在法律法规和司法解释等法律条文上,在案例检索方面相对不足。由于案例来源的多样性,非官方类检索平台案例可能存在质量不高、结构不统一、信息缺失或冗余等问题,导致用户在检索和使用时受阻。

(二)类案智能检索系统在司法实践中的局限性

1.刑事数据整合缺乏有效性

智能系统所采取一重要技术即知识图谱技术,知识图谱是一种用图模型来描述知识和建构世界万物之间关联的数据结构,知识图谱的构建流程主要包括知识建模、知识储备、知识融合、知识统计及知识应用[4]。其应用于司法领域,通过海量数据建立司法模型,利用知识图谱实时关联数据,对案件分类具体处理,并运用刑事案件信息属性和法律规则构建点和面的类案数据模型。但由于相关机关配合力度不够,加之司法数据壁垒,收集刑事案件难以实现关联,导致案件之间难以实现互通等问题。此外,算法决策的基本原理在于“以过去的案例数据预测未来的走势”,在刑事案件中,智能检索系统通过对过去的大量案例进行系统训练,检索出准确、有效的类案。但对于新型案例,如刑事案件中常见的金融诈骗类案件、新型网络诈骗类案件,目前人工智能的学习模式上几乎没有成熟的算法模式,人工智能所采取的知识图谱技术只是半监督学习方式,其实际展开程度和产品成熟度仍处于初级阶段,无法得出实现案件类型化的规律,难以建构“判决逻辑”。

2.语义技术限制检索的精准性

智能检索系统依靠数据库中提前录入的司法规范与定义来完成实际案例的表达,其所依赖的计算机技术运用于法学方面存在一定的局限性。由于对类案检索和推送的核心需求了解不足,导致所选择的信息提取材料和模型设计很难满足法学领域的标准特性与需求[5]。法律条文本身就存在语言模糊性,诸如法律条文中的兜底条款“其他适用情形”,这需要法官根据案件事实进行自由裁量,判决过程加入了审判人员的价值判断,但机器根本无法识别类似的法律条文,可能会出现把这类情况的案件归入到其他情形,导致“乱码”现象。此外,智能语言处理系统本身存在滞后性,使语义识别技术无法精确掌握自然语言在案例中的实际意义,尤其是部分带有地方语言特征的案例,仅采用计算机语言检索司法规范和诉讼事实,势必造成较大的检索误差。

3.检索需求与刑事类案供应不匹配

法律体系中的案例检索需求与实际刑事类案供应之间存在某种不协调或不匹配。以裁判文书网为例,其收纳的内容主要集中在判决书、法律法规等。而诸如无罪判决书、敏感案件判决书、争议较大案件判决书一般均不公开。对于新型案件,司法机关常常会选择一些入罪案例作为追诉依据,在与律师沟通的过程中,不顾律师对案件的具体分析和说理,直接抛出其认为类似行为的入罪案例,而由于裁判文书的选择性不公开,导致律师可能无法找到有利于当事人的无罪判决书。据此也反映出司法实践中,检索需求和类案供应不匹配的问题。

三、完善刑事类案检索系统的建议

(一)建立完整的刑事案件分类数据库

目前,我国的案例数据库分为最高人民法院直接发布型——指导性案例集群、中央主导建设型——中国裁判文书网、地方主导建设型——各省市法院官网类案总结专题、民间主体主导建设型——法信、北大法宝等平台。该种模式以案例发布主体为纵向体系,以案例内容分布为横向体系。随着智能司法的发展及主体司法需求趋势,构建完整的案件数据库已是大势所趋。以刑事司法为例,建立刑事案件分类数据库对精准量刑、实现“类案同判”的司法效果尤为重要。

上述案例模式,在纵向构建的基础上,应当加强横向体系,各级平台应当将各自领域的横向内容进行分类。以刑事数据库为例,第一,主体需求分析。基于“类案类判”目的,类案数据库的建设应当以功能导向进行构建。分析法官裁判的真实需求,从功能架构、模块设计、案例参数层面等进行靶向研发。对于诉讼参与人来说,类案检索机制规定被告人、辩护人等诉讼参与人可以提交指导性案例或其他类案作为控辩理由,为类案检索报告的提交提供了基本遵循。第二,对检索网站入口进行分类。考虑到法院办公的保密性原则和依附于线上办案平台的便利性,省域类案数据库针对不同用户群体应当分别设置内外网服务器搭建平台,法院工作人员通过一体化内网入口进入类案检索数据库,当事人和代理人等其他用户则在专门建立的公共网站进行登录使用。第三,制定域内个性案例定期汇报制度。从用户集群的共性特征出发,省域类案数据库收录的案例或提供的裁判规则也应当重视地域特征和符合本土实际。个性化案例责任主体应为高级人民法院,各基层法院按照每月一次、每次至少五例的频率和数量,向中级人民法院报送本院审理的具有域内普遍指导意义且能够体现本土特色的典型案例,由中级人民法院进行筛选后报送高级人民法院。

(二)设置智能语义识别“标签”

智能语义识别主要体现在法律检索环节,利用智能语义识别从司法数据库中提取相关法律条文及事实信息作为案件审判参考依据。针对目前语义识别不精准问题,首先,要建立多种自然语言处理系统,根据裁判文书网及多地法院案例类型实证考察,总结常见的自然语言类型,其中不乏具有地域特色类型案件所涉及的语言,检索人员进行检索时可以根据案件实际情况进行选择。其次,要对以往检索的有效信息建立标签,在最大程度上增强检索准确性。最后,要明确检索人员的检索需求。通过智能系统深度优化检索,分析检索人员对法律条文、案件事实的需求,检索范围缩小,使检索结果更加精准。

就刑事案例检索而言,以中国裁判文书网为例,其检索要素如下:输入案件名称或关键词-案件号-文书类型-法院层级-审理程序-犯罪类型-案件地域。以上为刑事案件检索标签。但就实践情况来看,检索标签设置非常有限,常出现检索结果不精准等现象,如以危险驾驶罪和袭警罪数罪为例,在搜索框内如果仅输入“危险驾驶罪”或“袭警罪”,其检索结果仅显示“危险驾驶罪”或“袭警罪”的案件。如果同时输入“危险驾驶罪和袭警罪”,其检索结果呈现“无结果”或其他案件。表明案件检索平台设置的“标签”量不足,无法满足检索需求。因此需要设置多元化检索“标签”,以满足不同检索需求。具体设置如在“高级检索”栏目设置“数罪”和“一罪”模块,在“输入关键词”一栏设置支持不同类型的词语。

(三)填补刑事类案库中“特殊案件”空白

当前类案数据库中,以“中国裁判文书网”为例,刑事案件检索的类型多为有罪判决书,无罪判决书、起诉书、羁押必要性审查申请书及一些刑事特殊案件等数据无法检索。为弥补这类检索空白,应当从以下方面着手:第一,明确特殊案件的定义。明确特殊案件的标准和特征将有助于正确分类,主要包括任何不属于常规刑事案件分类的案件,可能涉及复杂情况的案件、特殊类型的犯罪、涉及高级技术或跨国辖区的案件等。第二,扩大法律文书的检索范围,除了判决书以外的法律文书,有不少无罪判决和不起诉文书没有全面公开,与案件相关的法律文书也应当扩大收纳范围。如应将全国检察机关制作的法律文书,比如抗诉书、不起诉决定书等,以及最高人民检察院颁布的指导性案例、典型案件等纳入检索范围之内。第三,审查已有案件记录。对已有的案件记录进行审查,以确定是否存在案件被错误标记为“特殊案件”或遗漏被分类为特殊案件的案例。第四,更新案件分类系统。更新分类系统,包括特殊案件的类别,通过添加新的分类代码、字段或标签,以便将特殊案件明确标识出来。

结束语

近年来,“类案类判”与大数据、人工智能的结合成为司法信息化探索的重点抓手。类案检索作为“类案类判”的基础模块,势必要依赖于类案智能平台,而现阶段的类案智能产品仍然没有实现真正意义上的人工智能检索。这需要深入探讨类案检索在司法判决中可能带来的法律风险及其预防措施,以确保不会对判决产生负面影响。司法裁判致力于追求公正与效率,同时满足“審判为核心”和“司法责任制”的司法制度改革需求,而完备的类案检索系统有助于为其实现司法现代化的目标,即维护法治的公平与正义,并提高司法的效率和效果。

参考文献

[1]姜正权.刑事案件中类案检索与司法大数据的应用[J].贵阳学院学报(社会科学版),2023,18(3):93-98.

[2]朱桐辉.案外因素与案内裁量:疑罪难从无之谜[J].当代法学,2011,25(5):26-34.

[3]万发文,蒋静芬.类案检索机制的构建技术及应用分析:基于法官需求角度的实证分析[J].山东法官培训学院学报,2019,35(4):144-154.

[4]朱冬亮,文奕,万子琛.基于知识图谱的推荐系统研究综述[J].数据分析与知识发现,2021,5(12):1-13.

[5]杨凯.智能推荐算法与刑事类案检索可解释性机制建构[J].法治论坛,2020(1):102-119.

作者简介:周凤萍(1998— ),女,汉族,四川巴中人,青海民族大学法学院,在读硕士。

研究方向:刑事诉讼法。

基金项目:本研究受青海民族大学研究生科研基金项目资助,项目名称“青海民族大学研究生创新项目”(项目编号:04M2023063)。