发布时间:2025-11-07 作者:黄鑫
载最高检《检察技术与信息化》2024年第2辑
2022 年 6 月,最高人民检察院召开全国检察机关数字检察工作会议,要求唤醒各类沉睡数据,用好各种数据资源进行关联分析和深度挖掘,为强化法律监督、深化能动履职、做实诉源治理提供前所未有的线索、依据,数字检察工作由此在全国检察机关铺开。在当今的数字时代,海量数据在产生的同时,也记录了各类违法犯罪活动、执法司法不公不严不廉和社会治理漏洞等问题线索。可以说数据资源就是数字检察工作的来源性要素,数据资源的丰富程度决定着法律监督线索数量的多少,数据资源质量的高低也深刻影响着法律监督质效的好坏。因此,数据归集成为开展大数据法律监督的关键一环。然而,各行政机关、各执法司法机关长久以来的“信息孤岛”问题,为检察机关的数据归集带来了严重的壁垒,这其中包括各机关长期独立发展各自数据系统带来的技术性壁垒,也包括其作为被监督机关畏惧监督带来的观念性壁垒。由此造成了检察机关在获取外部数据时所面临的数据难获取、数据时效差、数据不真实等困境,严重制约着检察机关的数字检察改革。而技术作为数字检察的核心要素之一,似乎尚未在数据归集环节发挥应有的赋能作用,因此本文将试图寻求破解外部数据获取难困境的技术进路。
区块链技术与信息共享密切相关,其本质是一种去中心化的,分布式记账系统,其构建了一个分布式的交互网络,在这个网络中,所有节点的交易信息都会按照智能合约的约定,以加密的方式广播至网络中的其他节点,而拥有记账权限的节点则会通过一定的共识机制对交易信息进行验证,并生成数据区块,完成交易确认,保障各方账本的一致性。因此,区块链技术具有交易信息不可篡改、参与各方集体维护、数据实时、安全可信等诸多优点。这为破解数字检察实践中的数据获取难的现实掣肘提供了新的可能。基于此,本文将探讨三个方面的问题:一是数字检察背景下检察机关获取和应用数据面临哪些困境,其产生的原因是什么?二是将区块链技术应用于外部数据获取有哪些技术优势,能否突破前述困境?三是如何将区块链技术应用于外部数据获取,以及能产生怎样的效果?
一、检察机关获取和应用数据的现实困境
当前,检察机关在获取数据方面面临着数据持有方共享动力不足、数据时效性差、数据缺乏可信度等困境,这些困境也进而在一定程度上导致了当前大数据法律监督缺乏持续性的问题。
1、数据持有方缺乏共享动力
在检察机关的几种数据来源中,除网络数据可自行主动获取外,司法数据、政务数据等其他数据大多需要向公安、法院、司法行政、各政府机关等数据持有方被动索取。而检察机关作为法律监督机关,其主要的监督对象也是上述几家数据持有方,从而造成了监督机关需要向被监督机关索取数据开展监督的被动局面。因此,实践中往往会遇到数据持有方以各种理由推诿拒绝检察机关的数据需求,或提供数据后随即便被检察机关监督,影响了自身法治政府考核,而不再愿意提供数据,法律监督成为“一锤子买卖”。被监督机关所持有的数据作为自身行政行为或司法行为的忠实记录,如将其开放共享给检察机关,无疑是将自身问题主动暴露给监督机关。在当前建设法治政府的大背景下,背负着考核压力、社会压力和舆论压力等多重压力的数据持有方,自然也就没有了足够的数据共享动力。
2、数据缺乏时效性
当前检察机关进行大数据法律监督的数据来源通常包括:检察机关内部数据、司法数据、政务数据、私主体数据。除检察机关内部数据可以较为便利的实时获取外,其他数据均需通过一定的机制或方式向数据持有方调取。就司法数据而言,浙江省委政法委等五部门联合出台的《浙江省政法机关执法司法信息共享工作办法(试行)》,虽明确了省内公、检、法、司的执法司法信息共享机制,但未对数据的时效性做出明确规定,在实践当中,检察机关获取数据仍存在时效性差的问题,制约了监督质效,减少了监督线索的产出。浙江省院建设的浙江检察数据应用平台,依托《浙江省政法机关执法司法信息共享工作办法(试行)》,集合了大量由公安、法院、司法行政部门共享的数据,但其中很多数据并未及时更新。就政务数据和企业数据而言,检察机关往往以点对点同数据持有方对接的方式获取,获取数据的范围、时效和数量取决于协商结果或数据持有方的意愿,数据的时效性亦无法获得保证。
3、数据共享主体间缺乏信任机制
从数据传递方式上来看,检察机关获取外部数据主要有直接调取和间接传递两种方式。直接调取,即检察机关直接拥有数据持有方数据系统的接口权限,通过接口直接调取系统内的数据。间接传递,则是检察机关列明所需的数据列表,由数据持有方根据列表将数据从内部系统导出为通用数据格式(如Excel文件),后再以线下(刻录光盘、U盘等)或线上(邮件、即时通讯软件等)的方式传递至检察机关。前者直接从数据持有方的系统内调取,未经过人工干预,亦未改变数据形态,数据可信度相对较高。而后者的数据系人工导出,脱离系统后转化为了可编辑的数据格式,在传递给检察机关之前或之中均有可能被人为篡改,数据可信度较差。而无论是前者还是后者,数据在转移过程中均无有效的信任机制,检察机关在取得数据后亦无法对数据的真实性进行验证。实际上,受制于多种因素,当前检察机关直接接入数据持有方数据系统的难度很大,因而多采用间接传递的方式获取数据。在实践当中,数据持有方为逃避监督而提前筛选或篡改数据的情况时有发生,缺乏增信机制的问题也是当前制约检察机关法律监督质效的重要因素之一。
4、大数据法律监督缺乏持续性
数据是对既往行为的忠实记载,当前依托于大数据的数字检察实践,亦是对既往违法行为的查找和纠正,而实时且持续的数据供给是产生持续性监督的前提之一。当前,检察机关的数据供给不仅尚缺乏时效性,距离实时供给仍存在较大差距,当存量数据已筛查监督完毕,而新的数据又供给不足时,便会导致监督停滞甚至搁浅,因而难以产生持续且穿透的监督图景。另一方面,数字检察已成为各地区各级检察机关绩效考核的重要内容一之,考核指标的压力传导激发了各级检察机关的数字检察实践动力,也为基层检察机关的数字检察探索提供了方向指引。但以考核为导向的推动模式也不可避免的对持续监督产生影响,各基层检察机关在完成相应考核指标后,可能会失去监督动力,上级机关调整考核方向也可能会影响现有监督专项的后续推进。
二、构建政法区块链的技术优势
区块链技术可追溯、可验证、难篡改等特点契合了检察机关获取数据的各项需求,同时其独特的去中心化结构也打破了数据供给和接收方的不对等地位,从宏观来看,它可以有效的提高数据共享的可信性、实时性和积极性。特别是在与法律监督关系密切的政法数据,检察机关获取有关数据目前已有充分的法律授权,也具有制度上的可行性。
1. 区块链可以提高数据可信性
区块链本质上是一种信任机制,其使用技术在网络空间构建了一个安全可信的环境,使得参与各方仅依赖于区块链本身就可完成互信共识。区块体中存储着原始数据的哈希值,是由原始数据经哈希函数计算而来,而哈希函数具有单向性和唯一性。所谓单向性,即无法通过哈希值逆向推算原始数据,可以保障各数据供给方的数据安全性;所谓唯一性,即原始数据发生的分毫变化,都会影响哈希值,这为检察机关提供了数据验真手段,通过查验数据哈希值与区块链记载的一致性,即可验证数据是否经过篡改。同时,区块链拥有优异的防篡改性能,其具有分布式的存储结构,在多个独立、对等节点间通过共识机制,保证各节点数据的完整性和一致性,篡改者需要付出极大的工作量证明成本才能完成对所有节点数据的同步修改,从防篡改的角度保障了检察机关获取数据的真实性。
2. 区块链可以提高数据共享的实时性
智能合约技术是区块链技术体系中的重要组成部分,其是一种数字化的协议,使用计算机编程语言来描述现实世界中合同条款的约束逻辑,并形成一段程序部署在区块链的合约层中,当达到协议的激活条件时,无需外部机构的授权,程序就会自动执行以完成协议的履行,且过程中无法进行人为干预或中止。当前,杭州互联网法院已上线了利用区块链智能合约打造的司法应用,构建了“自愿签署-自动履约-履行不能智能立案-智能审判-智能执行”的闭环司法体系。如能在检察机关和各数据供给方之间搭建“数据共享智能合约”,即可实现多部门协作、全节点见证、无人为干预的数据可信实时共享。
3. 区块链可以提高数据共享的积极性
区块链去中心化的结构在保障了节点之间完全对等的同时,也带来了由谁供给数据、由谁来记账的问题。因此,区块链设计了一套行之有效的激励机制,通过给予贡献者一定的“代币(Token)”奖励来激发各节点贡献数据的积极性。当前,数据持有方和检察机关之间的数据流动是一种负反馈循环,数据持有方在供给数据后不仅得不到正面激励,反而可能得到被检察机关监督的负向反馈,数据持有方的供给意愿在这种循环下会变得越来越低。如将区块链的激励机制引入上述循环中,对数据供给者根据供给数据的数量和质量给予不同程度的“代币”奖励,而“代币”可以作为各机关的考核凭据,作为执法司法信息共享工作的重要评价指标。如此,将负反馈循环扭转为正反馈循环,不断提高数据持有方的供给意愿。
4.政法区块链的构建符合法治原则
法律是区块链的必由之路,而非其毁灭的根源。政法区块链的构建必须符合法治原则,且根据现行法的规定,它也能够符合法治原则。与获取私主体数据不同,检察机关获取政法机关执法司法数据得到了法律充分授权。首先,《宪法》以根本大法的形式规定了法院、检察、公安办理刑事案件的配合制约原则,而刑事案件的数据共享正是数字时代有效配合、制约的重要基础。《人民检察院组织法》、三大诉讼法对检察机关的司法监督权进行了完整授权,将诉讼活动、刑罚执行、民事调解活动、警察执法活动等都纳入检察权的监督范畴。故对于法院、公安机关、司法行政机关执法司法产生的所有数据,检察机关依法都有权获取、利用。因此,构建用于数据共享的政法区块链具有牢实的法律依据。实践中,已有关于政法区块链的初步实践,如山西省探索搭建省级公检法司的联盟链,覆盖省公安厅、省人民检察院、省高级人民法院与省司法厅,旨在实现司法部门的全流程在线协作、在线高效换押与智能合约办案流程规范检查,解决共享难、信任难、协同难的问题。
三、区块链技术赋能检察机关数据获取
如何将区块链的上述优势尽数为检察机关数据获取所用呢?笔者认为可以由政法委主导构建法律监督联盟链,为检察机关和各数据持有机关搭建共享互通平台,并充分利用智能合约、隐私计算等技术在满足检察机关数据需求的同时,保障参与各方的合理关切。
1、构建法律监督联盟链
区块链根据开放程度可以分为公有链、私有链和联盟链。公有链没有任何访问限制,节点可以自由的加入或离开,去中心化程度过高,私有链则过于封闭,一般用于企业或组织内部。而联盟链的开放程度介于公有链和私有链之间,参与节点和管理节点均通过直接指定的方式确定,具有安全可控的特点,因此非常适合作为检察机关法律监督数据共享通道。当前的数字检察实践,多是依托违法犯罪场景而开展的,即检察机关通过分析特定个案的违法犯罪场景,查找提炼场景在数据层面可能表现出的特征或异常,梳理出数据需求,再从各个数据持有方归集数据,随后利用数据建模手段进行筛查、对比、碰撞,最终输出类案监督线索,但其中的数据归集过程尚未形成规范且固定的数据共享通道。通常,某一监督场景的参与各方和数据需求是特定的,因此笔者认为可以首先构建依托于场景的法律监督联盟链,由政法委作为联盟链的管理节点,承担数据区块的管理和确认,节点加入与退出的审核,检察机关和各数据持有机关或组织则作为联盟链的参与节点,由数据持有方执行数据上链,检察机关可实时同步地获取到监督所需数据,并可将监督结果通过上链的方式反馈给数据持有方。随着数字检察实践的不断深入,越来越多的监督场景以联盟链的形式被固化和确定,法律监督联盟链的参与方不断丰富,检察机关归集到的数据将逐渐形成规模效应。同时,已有的监督场景可以得到持续的数据供给,监督的持续性和穿透性也获得了相应保障。
2、智能合约打破数据共享壁垒
当前,检察机关在获取政法数据时,多采用三种方式:通过顶层设计制度性获取、通过点对点协议获取和通过行使调查核实权个别获取,而无论采用哪种方式,检察机关获取数据的边界、条件和范围均通过制度、协议和法律进行了有效的约束。通过将检察机关的具体数据需求、同数据持有方达成的数据共享协议以及法律规定等约束,以智能合约的形式固定在区块链中,当达到约定的条件,数据持有方的数据将自动的以约定的形式上链,这样既可以保障检察机关获取数据的实时性、真实性和可追溯性,又可以保障数据持有方的数据安全和共享合规,从而打破数据持有方和检察机关之间互不信任的壁垒。同时,可由政法委编制确定数据质量的评价标准和共享激励办法,并写入智能合约中,数据持有方的数据共享将实现自动评价、自动反馈、自动奖励,为法律监督联盟链的持续运行注入内生动力。
3、隐私计算打消数据共享顾虑
区块链作为一种分布式的数据库,其是通过在一定程度上牺牲参与各方的数据所有权而实现的数据共享。检察机关作为法律监督机关,如使用区块链的技术手段归集各方数据,势必会引起各数据所有方对丢失数据所有权的担忧。而隐私计算技术则通过“数据可用不可见、数据可控可计量、数据不动模型动”的方式,实现在数据持有方不暴露原始数据的情况下,完成数据的共享分析计算。隐私计算技术和区块链的结合,可以在打消数据所有方顾虑的同时,对数据的计算和共享过程进行跟踪、追溯和增信。隐私计算技术大体上可以分为联邦机器学习、可信执行环境和多方安全计算三类技术。其中,多方安全计算利用密码学原理,参与各方将原本明文的数据加密或转换后提供给其他参与方进行计算,从而实现多个参与方协同求解某个函数或问题的解的同时,各参与方除过程信息和结果信息外无法知晓任何其他信息,真正做到“数据可用不可见”。法律监督联盟链可采用多方安全计算模式,构建链上-链下双层数据存储架构,各数据持有方的原始数据存储在各自链下数据库中,当检察机关有监督需求时,可将监督模型的计算任务分解至各数据持有方,各方在区块链上进行协同计算,最终检察机关可以在不获取原始数据的情况下得到计算结果。