第14卷第6期 智能系统学报 Vol.14 No.6 2019年11月 CAAI Transactions on Intelligent Systems Nov.2019 D0:10.11992/tis.201905058 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.tp.20190909.1300.004.html 基于区块链的公共数据电子证据系统及关联性分析 李萌2,刘文奇2,米允龙3 (1.昆明理工大学理学院,云南昆明650500;2.昆明理工大学数据科学研究中心,云南昆明650500;3.中国科 学院大数据挖据与知识管理重点实验室,北京100190) 摘要:针对公共部门提供电子证据时,必须保证数据的真实性和证明力,同时要尽量保护当事人隐私和他人 利益,而从公共数据库中提取电子数据并形成有效电子证据,既是法律难题也是技术难题这一问题,本文在电 子证据可信性的影响因素分析基础上,提出了自动生成中国公共数据库电子证据系统的区块链模型的取证技 术体系,并从司法角度出发,提出了公共数据治理的电子证据生命周期、内容关联、载体关联和智能串并分析 方法。本文的研究在一定程度上保证了司法、公证和公共事务中电子证据的可信性,并实现了从公共数据库中 自动生成证据知识的原型系统。 关键词:公共数据库;电子证据:区块链;关联分析:智能串并 中图分类号:TP391文献标志码:A文章编号:1673-4785(2019)06-1127-11 中文引用格式:李萌,刘文奇,米允龙.基于区块链的公共数据电子证据系统及关联性分析J.智能系统学报,2019,14(6): 1127-1137. 英文引用格式:LI Meng,LIU Wenqi,,MI Yunlong.An electronic evidence system based on blockchain and correlation analysisJ. CAAI transactions on intelligent systems,2019,14(6):1127-1137. An electronic evidence system based on blockchain and correlation analysis LI Meng,LIU Wenqi2,MI Yunlong' (1.Faculty of Science,Kunming University of Science and Technology,Kunming 650500,China;2.Center of Data Science,Kun- ming University of Science and Technology,Kunming 650500,China;3.Key Laboratory of Big Data Mining and Knowledge Man- agement,Chinese Academy of Sciences,Beijing 100190,China) Abstract:When the public sector provides electronic evidence,the authenticity and proof of the data must be ensured, and meanwhile,the privacy of the concerned parties and the interests of others should be protected as much as possible. Therefore,forming effective electronic evidence by extracting electronic data from public databases is not only a legal problem but also a technical problem.Based on the analysis of the influencing factors of the credibility of the electronic evidence,the automatic blockchain model of an electronic data system based on the Chinese public database is pro- posed in this paper.In addition,the methods of life-cycle management,content association,carrier association,and intel- ligent string-concatenation for electronic evidence based on public data are put forward from the legal viewpoint.To a certain extent,this research guarantees the credibility of electronic evidence in judicial,notary,and public affairs,and implements a prototype system for automatically generating evidence knowledge from public databases. Keywords:public database;electronic evidence;blockchain:correlation analysis:intelligent serial and parallel 中国公共数据库系统发展到一定阶段,公共 主数据,并且依法有序地提供给公共部门、公众、 数据资源将成为国家战略资产。有效的数据治理 企业和社会组织综合运用的过程。 是数据资产形成和高效利用的必要条件山。公共 为公众提供优质的公共数据库数据服务是公 数据治理是指在公共部门、公民、企业和社会组 共数据当局的首要任务,提供高可信度的电子数 织所提供的零散数据基础上形成统一的、可信的 据是最重要的任务。其中有一大类电子数据将用 收稿日期:2019-05-28.网络出版日期:2019-09-10. 作相应的公共产品的证据要件,如居民户籍证 基金项目:国家自然科学基金项目(61573173) 通信作者:刘文奇.E-mail:liuweng22l5@sina.com 明、婚姻证明等,乃至司法和仲裁等维护社会公
DOI: 10.11992/tis.201905058 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.tp.20190909.1300.004.html 基于区块链的公共数据电子证据系统及关联性分析 李萌1,2,刘文奇1,2,米允龙3 (1. 昆明理工大学 理学院,云南 昆明 650500; 2. 昆明理工大学 数据科学研究中心,云南 昆明 650500; 3. 中国科 学院 大数据挖掘与知识管理重点实验室,北京 100190) 摘 要:针对公共部门提供电子证据时,必须保证数据的真实性和证明力,同时要尽量保护当事人隐私和他人 利益,而从公共数据库中提取电子数据并形成有效电子证据,既是法律难题也是技术难题这一问题,本文在电 子证据可信性的影响因素分析基础上,提出了自动生成中国公共数据库电子证据系统的区块链模型的取证技 术体系,并从司法角度出发,提出了公共数据治理的电子证据生命周期、内容关联、载体关联和智能串并分析 方法。本文的研究在一定程度上保证了司法、公证和公共事务中电子证据的可信性,并实现了从公共数据库中 自动生成证据知识的原型系统。 关键词:公共数据库;电子证据;区块链;关联分析;智能串并 中图分类号:TP391 文献标志码:A 文章编号:1673−4785(2019)06−1127−11 中文引用格式:李萌, 刘文奇, 米允龙. 基于区块链的公共数据电子证据系统及关联性分析 [J]. 智能系统学报, 2019, 14(6): 1127–1137. 英文引用格式:LI Meng, LIU Wenqi, MI Yunlong. An electronic evidence system based on blockchain and correlation analysis[J]. CAAI transactions on intelligent systems, 2019, 14(6): 1127–1137. An electronic evidence system based on blockchain and correlation analysis LI Meng1,2 ,LIU Wenqi1,2 ,MI Yunlong3 (1. Faculty of Science, Kunming University of Science and Technology, Kunming 650500, China; 2. Center of Data Science, Kunming University of Science and Technology, Kunming 650500, China; 3. Key Laboratory of Big Data Mining and Knowledge Management, Chinese Academy of Sciences, Beijing 100190, China) Abstract: When the public sector provides electronic evidence, the authenticity and proof of the data must be ensured, and meanwhile, the privacy of the concerned parties and the interests of others should be protected as much as possible. Therefore, forming effective electronic evidence by extracting electronic data from public databases is not only a legal problem but also a technical problem. Based on the analysis of the influencing factors of the credibility of the electronic evidence, the automatic blockchain model of an electronic data system based on the Chinese public database is proposed in this paper. In addition, the methods of life-cycle management, content association, carrier association, and intelligent string-concatenation for electronic evidence based on public data are put forward from the legal viewpoint. To a certain extent, this research guarantees the credibility of electronic evidence in judicial, notary, and public affairs, and implements a prototype system for automatically generating evidence knowledge from public databases. Keywords: public database; electronic evidence; blockchain; correlation analysis; intelligent serial and parallel 中国公共数据库系统发展到一定阶段,公共 数据资源将成为国家战略资产。有效的数据治理 是数据资产形成和高效利用的必要条件[1]。公共 数据治理是指在公共部门、公民、企业和社会组 织所提供的零散数据基础上形成统一的、可信的 主数据,并且依法有序地提供给公共部门、公众、 企业和社会组织综合运用的过程。 为公众提供优质的公共数据库数据服务是公 共数据当局的首要任务,提供高可信度的电子数 据是最重要的任务。其中有一大类电子数据将用 作相应的公共产品的证据要件,如居民户籍证 明、婚姻证明等,乃至司法和仲裁等维护社会公 收稿日期:2019−05−28. 网络出版日期:2019−09−10. 基金项目:国家自然科学基金项目 (61573173). 通信作者:刘文奇. E-mail:liuwenq2215@sina.com. 第 14 卷第 6 期 智 能 系 统 学 报 Vol.14 No.6 2019 年 11 月 CAAI Transactions on Intelligent Systems Nov. 2019
·1128· 智能系统学报 第14卷 平正义的一类公共产品中的电子证据。与一般的 力是电子证据的4个维度。根据刘品新)的研 商业数据治理相比,公共数据治理更多地涉及法 究,在司法实践中电子证据被质疑的几率是比较 律适定性问题。公共数据库数据的电子证据功能 高的。在司法实务中,电子证据的攻防成效令人 涉及很多方面,比如电子证据的生命周期管理以 堪忧,司法运用电子证据尚未形成成熟的机制。 及电子证据存储和归档格式、电子证据与案件事 鉴于电子证据易受质疑,中华人民共和国最高检 实的关联性等。这类具有电子证据性质的公共数 察院对电子数据和视听资料的审查、认定和是否 据产品的基本要求是真实可信性及其与现实案件 作为定案依据有明确的规定,严格要求对电子数 的高度关联性。因此,构造多层的、分布式且防 据和视听资料结合案件的其它证据审查其真实性 篡改算法和安全的电子证据取证系统是基于公共 和关联性。 数据库的电子证据的关键技术。以求解拜占庭将 由此可见,电子证据的关联性和真实性是电 军问题的算法为基础发展起来的区块链技术在去 子证据在法庭上是否被采信的关键性指标。作为 中心化安全技术领域已经取得一定成效,如比特 一种虚拟空间的证据,电子证据用于定案必须同 币区块链技术、能源互联网区块链技术等。此 时满足内容上以及载体上的关联性和真实性。互 外,在医疗保健中广泛地实施区块链以提高 联网、物联网与大数据的出现和发展在极大提高 数据隐私性、互操作性和可扩展性1。在司法和 公众和公共部门数据交互效率的同时,也为保障 公共安全信息技术领域,分布式的电子证据广泛 电子证据的真实性、关联性带来了新的挑战。由 存在,急需建立更加严密的电子证据信任技术 于公共部门以维护社会公平正义为目的,因此公 体系。 共数据库的电子证据从内容到载体都应该是电子 按物证说的观,点,相对于传统物证而言,电子 证据中最为可信的。 证据产生和存在的方式有很大的区别,主要体现 传统的公共数据库中数据的应用需求主要包 在电子证据的符号化、易篡改性、可删除性、可分 含公共产品供给和消费过程的记录。但是随着网 离性、易复制性、易破坏性,使得电子证据在收集 络和智能终端的日益普及,公共数据的边界日益 和使用过程中真实性会发生改变。狭义的电子证 扩大,大量的公共数据的电子化,纳入了海量的 据是指以存储于介质载体中的电磁记录或光电记 机器数据,这将带来公共数据库中的电子数据证 录并对司法案件审理、仲裁等事实起证明作用的 据功能复杂化。随着公共数据库数据边界的扩 电子数据(含视听资料)及其附属物。除了具有 张,公共数据库的电子证据功能将成为公共数据 证据的客观性和可知性之外,电子证据还具有非 库主要功能之一。如公共安全数据库中的涉案物 直观性和多态性、电子物理和诉讼证据的多重属 品记录、消防数据、环境监测、宾馆饭店住宿记 性。为了保持电子证据的客观真实性,在获取电 录、出租车定位记录以及医疗健康数据库中的电 子证据时,应采用取证专用的数据拷贝机和电子 子病历、防疫检疫记录等。 证据勘验取证技术,附加上时间戳数据,一次性 公共数据库的电子证据系统的应用与法律密 提取和固定介质载体中的全部电子数据。广义的 切相关,可信性是必然要求。在中国的法律框架 电子证据是指,用于公共管理、认证认可、司法、 之下,数据必须满足:1)及时性,数据必须是及时 仲裁、公证等事务的电子数据及其附属物。广义 收集的;2)过程性,过程的数据必须被记录;3)不 的电子证据与狭义的电子证据相比,应用范围更 可篡改性,所收集及存储的数据必须证明没有被 宽、取证过程相对简单。 篡改过。 电子证据与传统证据相比,最突出的特点是: 其中不可篡改性是电子证据的特性,也是电 1)它需要借助一定的介质存储,通常存储于电子 子证据系统设计的关键技术难点。不可篡改性有 设备的存储器中;2)电子证据不能直观查看,必 两个环节:)公共数据库内部的电子证据生成过 须借助适当的电子系统软硬件环境显示后才能查 程的不可篡改性,即电子证据的保障品质,或保 看;3)由于电子证据存在于虚拟空间,所以可以 质;2)电子证据的外部转移与再现过程的不可篡 迅速传播并且精确复制;4)电子证据中的数字证 改性,即电子证据的保障安全,或保全。 据很容易被修改或删除,并且不易找到更改“痕 在中国的法律中,电子数据、电子证据概念 迹”;5)有些电子证据有时限性,可能随时间而 经常混合使用。在司法、仲裁和行政案件处理实 消失。 务中,虽然可以作为证据使用(电子证据、电子书 电子数据的真实性、合法性、关联性和证明 证或视听电子材料),但是单一的电子证据并不能
平正义的一类公共产品中的电子证据。与一般的 商业数据治理相比,公共数据治理更多地涉及法 律适定性问题。公共数据库数据的电子证据功能 涉及很多方面,比如电子证据的生命周期管理以 及电子证据存储和归档格式、电子证据与案件事 实的关联性等。这类具有电子证据性质的公共数 据产品的基本要求是真实可信性及其与现实案件 的高度关联性。因此,构造多层的、分布式且防 篡改算法和安全的电子证据取证系统是基于公共 数据库的电子证据的关键技术。以求解拜占庭将 军问题的算法为基础发展起来的区块链技术在去 中心化安全技术领域已经取得一定成效,如比特 币区块链技术、能源互联网区块链技术等[2-3]。此 外,在医疗保健中广泛地实施区块链以提高 数据隐私性、互操作性和可扩展性[4-5]。在司法和 公共安全信息技术领域,分布式的电子证据广泛 存在,急需建立更加严密的电子证据信任技术 体系。 按物证说的观点,相对于传统物证而言,电子 证据产生和存在的方式有很大的区别,主要体现 在电子证据的符号化、易篡改性、可删除性、可分 离性、易复制性、易破坏性,使得电子证据在收集 和使用过程中真实性会发生改变。狭义的电子证 据是指以存储于介质载体中的电磁记录或光电记 录并对司法案件审理、仲裁等事实起证明作用的 电子数据 (含视听资料) 及其附属物。除了具有 证据的客观性和可知性之外,电子证据还具有非 直观性和多态性、电子物理和诉讼证据的多重属 性。为了保持电子证据的客观真实性,在获取电 子证据时,应采用取证专用的数据拷贝机和电子 证据勘验取证技术,附加上时间戳数据,一次性 提取和固定介质载体中的全部电子数据。广义的 电子证据是指,用于公共管理、认证认可、司法、 仲裁、公证等事务的电子数据及其附属物。广义 的电子证据与狭义的电子证据相比,应用范围更 宽、取证过程相对简单。 电子证据与传统证据相比,最突出的特点是: 1) 它需要借助一定的介质存储,通常存储于电子 设备的存储器中;2) 电子证据不能直观查看,必 须借助适当的电子系统软硬件环境显示后才能查 看;3) 由于电子证据存在于虚拟空间,所以可以 迅速传播并且精确复制;4) 电子证据中的数字证 据很容易被修改或删除,并且不易找到更改“痕 迹” ;5) 有些电子证据有时限性,可能随时间而 消失[6]。 电子数据的真实性、合法性、关联性和证明 力是电子证据的 4 个维度。根据刘品新[7] 的研 究,在司法实践中电子证据被质疑的几率是比较 高的。在司法实务中,电子证据的攻防成效令人 堪忧,司法运用电子证据尚未形成成熟的机制。 鉴于电子证据易受质疑,中华人民共和国最高检 察院对电子数据和视听资料的审查、认定和是否 作为定案依据有明确的规定,严格要求对电子数 据和视听资料结合案件的其它证据审查其真实性 和关联性。 由此可见,电子证据的关联性和真实性是电 子证据在法庭上是否被采信的关键性指标。作为 一种虚拟空间的证据,电子证据用于定案必须同 时满足内容上以及载体上的关联性和真实性。互 联网、物联网与大数据的出现和发展在极大提高 公众和公共部门数据交互效率的同时,也为保障 电子证据的真实性、关联性带来了新的挑战。由 于公共部门以维护社会公平正义为目的,因此公 共数据库的电子证据从内容到载体都应该是电子 证据中最为可信的。 传统的公共数据库中数据的应用需求主要包 含公共产品供给和消费过程的记录。但是随着网 络和智能终端的日益普及,公共数据的边界日益 扩大,大量的公共数据的电子化,纳入了海量的 机器数据,这将带来公共数据库中的电子数据证 据功能复杂化。随着公共数据库数据边界的扩 张,公共数据库的电子证据功能将成为公共数据 库主要功能之一。如公共安全数据库中的涉案物 品记录、消防数据、环境监测、宾馆饭店住宿记 录、出租车定位记录以及医疗健康数据库中的电 子病历、防疫检疫记录等。 公共数据库的电子证据系统的应用与法律密 切相关,可信性是必然要求。在中国的法律框架 之下,数据必须满足:1) 及时性,数据必须是及时 收集的;2) 过程性,过程的数据必须被记录;3) 不 可篡改性,所收集及存储的数据必须证明没有被 篡改过。 其中不可篡改性是电子证据的特性,也是电 子证据系统设计的关键技术难点。不可篡改性有 两个环节:1) 公共数据库内部的电子证据生成过 程的不可篡改性,即电子证据的保障品质,或保 质;2) 电子证据的外部转移与再现过程的不可篡 改性,即电子证据的保障安全,或保全。 在中国的法律中,电子数据、电子证据概念 经常混合使用。在司法、仲裁和行政案件处理实 务中,虽然可以作为证据使用 (电子证据、电子书 证或视听电子材料),但是单一的电子证据并不能 ·1128· 智 能 系 统 学 报 第 14 卷
第6期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1129· 够作为判定事实的根据,电子证据需要跟其他证 种全过程的科学技术,其检验结果可作为法庭证 据一起使用,并且可以相互印证,因此组成证据 据或案件侦查线索。 链条来证明案件事实。电子证据有效的前提是电 电子证据正面认定的审查需要以下环节: 子数据本身是可信的。区块链技术在解决共享经 1)生成环节,即电子证据中的数据是如何生 济中的信任问题方面颇具潜力,在某种程度上区 成的。这一环节审查电子证据数据是设备采集还 块链适合取代第三方的信任8。 是人工录人。如果是设备采集的则进一步确认是 公共数据库是公共产品,公共部门是其供给 由人工使用设备采集还是设备自动采集。如果是 者。公共部门有义务依法从其主导的公共数据库 人工使用设备采集,则需要确认采集者是否具备 中提供公民和法人所需要的一切电子证据(证 采集资格和设备是否正常。如果是机器自动采集 明)。当公民和组织必须需要公共数据库中的电 数据,则需认定设备是否正常。采集人员和设备 子数据维护自身权益的时候,公共部门必须向他 是否正常,则需要合法的第三方认定或检测机构 们提供具有完整法律效力的电子证据。这些电子 相关电子文书。 证据的运用可能不仅限于司法事务。在公共部门 2)获取的方式。审查内容包括:采集过程是 提供电子证据时,必须保证数据的真实性和证明 否合法,采集方法是否科学、可靠,采集过程是否 力,同时要尽量保护当事人隐私和他人利益。因 得到被采集方认可。 此,从公共数据库中提取电子数据并形成有效电 3)传输环节。审查电子证据的数据形成过 子证据既是法律难题也是技术难题。 程和传输过程中使用的计算机网络或专用设备 本文将构建自动生成中国公共数据库电子证 是否正常,传输过程中电子证据的数据是否可 据系统的区块链模型及其取证技术体系,在一 能被修改,传输过程中数据是否被非法复制、 定程度上保证了司法、公证和公共事务中电子证 截取。 据的可信性。最后提出了公共数据治理的电子证 4)存储环节。该环节审查电子证据数据是怎 据生命周期管理并对电子证据的关联性进行了 样存储的,是否科学,存储介质与存储过程是否 分析。 安全可靠,是否以加密形式存储,存储后是否有 访问权限上的漏洞,存储中是否有非法篡改和销 1电子证据可信性的影响因素分析 毁的风险。 电子证据的不可篡改性包括数据的保质和 2电子证据系统的区块链数据模型 保全,它与传统证据的有效性与证据保全相对 应,具体体现在电子证据的数据攫取、固定、保 关于电子证据系统的保质问题,我国迄今为 管、转移等各个环节。但与传统证据相比,电子 止没有法律规定,也没有完整的行政规范。为了 证据的产生和存在的形式完全不同。由于电 解决公共数据库中可能用于电子证据的数据的可 子数据科技含量高、易篡改、可分离等特点,使之 信性,必须建立公共数据库的全局信任机制。有 非常容易被修改、伪造和删除,加大了电子证据 效的解决办法是在公共数据库中建立区块链系统 的保质和保全难度,仅仅通过法律措施和公证机 的“智能合约”层,即建立一种无法被篡改和操控 关很难有效控制电子证据的法律效力。从普通 的“代码合同。智能合约并非法律所界定的合 证据学的原理来说,司法实践中对传统证据认定 同,而是执行在区块链上的代码,故也称作“链上 普遍采用正面认定法和侧面认定法,其中正面认 代码”。为了实现中国公共数据库中用于提供电 定法是主要方法。参照传统证据的认定,电子证 子证据的部分数据的法律效力,这种链上代码必 据的正面认定须保证电子数据的可靠性,在其运 须遵从不可篡改性和法律上的可验证性。电子证 行的各个环节都有辅助证据(如数据标签、时间 据系统在公共数据库数据生产过程中提取的数据 戳)加以证明,形成电子数据保管锁链。由于电 在数据博弈参与者之间形成区块链,其分布式账 子数据通常是潜在的且与大量的无关信息纠缠 本将保证数据的一致性、不可篡改性和合法性。 共存,有时甚至已经被删除,故需要通过专门的 在事务方式上,电子证据系统的区块链的每个节 技术手段发现和获得有价值的证据信息,这就是 点上都有自己的本地数据库。 电子证据检验技术。电子证据检验技术是对电 根据电子证据系统的上述要求,我们构建一 子设备中存在的电子数据(电子证据)进行识别、 种基于区块链的数据安全共享网络体系,如图1 发现、提取、保存、恢复、展示、分析和鉴定的一 所示
够作为判定事实的根据,电子证据需要跟其他证 据一起使用,并且可以相互印证,因此组成证据 链条来证明案件事实。电子证据有效的前提是电 子数据本身是可信的。区块链技术在解决共享经 济中的信任问题方面颇具潜力,在某种程度上区 块链适合取代第三方的信任[8-9]。 公共数据库是公共产品,公共部门是其供给 者。公共部门有义务依法从其主导的公共数据库 中提供公民和法人所需要的一切电子证据 (证 明)。当公民和组织必须需要公共数据库中的电 子数据维护自身权益的时候,公共部门必须向他 们提供具有完整法律效力的电子证据。这些电子 证据的运用可能不仅限于司法事务。在公共部门 提供电子证据时,必须保证数据的真实性和证明 力,同时要尽量保护当事人隐私和他人利益。因 此,从公共数据库中提取电子数据并形成有效电 子证据既是法律难题也是技术难题。 本文将构建自动生成中国公共数据库电子证 据系统的区块链模型及其取证技术体系,在一 定程度上保证了司法、公证和公共事务中电子证 据的可信性。最后提出了公共数据治理的电子证 据生命周期管理并对电子证据的关联性进行了 分析。 1 电子证据可信性的影响因素分析 电子证据的不可篡改性包括数据的保质和 保全,它与传统证据的有效性与证据保全相对 应,具体体现在电子证据的数据攫取、固定、保 管、转移等各个环节。但与传统证据相比,电子 证据的产生和存在的形式完全不同[10]。由于电 子数据科技含量高、易篡改、可分离等特点,使之 非常容易被修改、伪造和删除,加大了电子证据 的保质和保全难度,仅仅通过法律措施和公证机 关很难有效控制电子证据的法律效力。从普通 证据学的原理来说,司法实践中对传统证据认定 普遍采用正面认定法和侧面认定法,其中正面认 定法是主要方法。参照传统证据的认定,电子证 据的正面认定须保证电子数据的可靠性,在其运 行的各个环节都有辅助证据 (如数据标签、时间 戳) 加以证明,形成电子数据保管锁链。由于电 子数据通常是潜在的且与大量的无关信息纠缠 共存,有时甚至已经被删除,故需要通过专门的 技术手段发现和获得有价值的证据信息,这就是 电子证据检验技术。电子证据检验技术是对电 子设备中存在的电子数据 (电子证据) 进行识别、 发现、提取、保存、恢复、展示、分析和鉴定的一 种全过程的科学技术,其检验结果可作为法庭证 据或案件侦查线索。 电子证据正面认定的审查需要以下环节: 1) 生成环节,即电子证据中的数据是如何生 成的。这一环节审查电子证据数据是设备采集还 是人工录入。如果是设备采集的则进一步确认是 由人工使用设备采集还是设备自动采集。如果是 人工使用设备采集,则需要确认采集者是否具备 采集资格和设备是否正常。如果是机器自动采集 数据,则需认定设备是否正常。采集人员和设备 是否正常,则需要合法的第三方认定或检测机构 相关电子文书。 2) 获取的方式。审查内容包括:采集过程是 否合法,采集方法是否科学、可靠,采集过程是否 得到被采集方认可。 3) 传输环节。审查电子证据的数据形成过 程和传输过程中使用的计算机网络或专用设备 是否正常,传输过程中电子证据的数据是否可 能被修改,传输过程中数据是否被非法复制、 截取。 4) 存储环节。该环节审查电子证据数据是怎 样存储的,是否科学,存储介质与存储过程是否 安全可靠,是否以加密形式存储,存储后是否有 访问权限上的漏洞,存储中是否有非法篡改和销 毁的风险。 2 电子证据系统的区块链数据模型 关于电子证据系统的保质问题,我国迄今为 止没有法律规定,也没有完整的行政规范。为了 解决公共数据库中可能用于电子证据的数据的可 信性,必须建立公共数据库的全局信任机制。有 效的解决办法是在公共数据库中建立区块链系统 的“智能合约”层,即建立一种无法被篡改和操控 的“代码合同” [11]。智能合约并非法律所界定的合 同,而是执行在区块链上的代码,故也称作“链上 代码”。为了实现中国公共数据库中用于提供电 子证据的部分数据的法律效力,这种链上代码必 须遵从不可篡改性和法律上的可验证性。电子证 据系统在公共数据库数据生产过程中提取的数据 在数据博弈参与者之间形成区块链,其分布式账 本将保证数据的一致性、不可篡改性和合法性[12]。 在事务方式上,电子证据系统的区块链的每个节 点上都有自己的本地数据库。 根据电子证据系统的上述要求,我们构建一 种基于区块链的数据安全共享网络体系,如图 1 所示。 第 6 期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1129·
·1130· 智能系统学报 第14卷 。日标主机 (CA服务器 公共数据 区块进行共识:最后,一旦共识成功,对区块进行 区块链 链接,形成完整的区块链。通过共识算法来保证 用户账本之间的一致性,即分布式记账核心。将 具体的区块加入区块链过程如图36。 defmain(); P2P电子证据网路 book=TransactionBook(); P2P电子证据网路 #1.从学校将学生数据从数据库加载进区块链中 pint(~1.开始从学较停息将学生数据伽载进区块链内!")月 student=StudentO: 位 allReconds=student.getAll(); 数据识别服务 数据识别服务 for stuNo in allReconds; If stuNo 个 个 data=student.getAll.getOne(stuNo): 一公共数据区块班 公共数据区块链 b=Transaction(来有学度系统,data): 个 book.addBlock(b): 互联网 互联网 print(book ) print(学号:/的同学已径m我成功!“.format(stuNo0D: else: print("“此学生不存在!“方 图1电子证据区块链结构 图3数据加入区块链 Fig.1 Blockchain structure of the E-evidence system Fig.3 Data is added to the blockchain 1联盟区块链构建。 该体系依赖于现有的数据仓库架构,将 机构1:校级 已经收到信息! 电子数据作为一种资产进行统一标识,利用区块 加载区块信息,请稍后! 链技术将数据进行分布式存储,通过设计高效分发 校验成功! Hah:0000297e7Afd64a41632hs469a386070399acdf0657641b8413a2585605 协议,实现数据在参与者之间的自主对等的P2P电 StudentChains<l Blocks,Head:5a7al5c3bd194532bbc0ed66336el59b 学号:200818008629001的同学己经加载成功! 子证据网络(peer to peer i-evidence network,P2PIEN)。 己经收到信息! 加载区块信息,请稍后! 该电子证据网络依托于公共数据库网络的物理系 校验成功! 统和数据博弈覆盖网络,在逻辑上遵从电子证据 Hash:0000685fa261abcc29alc240b5a093d56f501a5402eab5dba9aaff71674daf17 StudentChains<2 Blocks,Head:25114c07712d45fbbe975c3c6e271c47> 系统的法律要求,并且将部分公共数据库系统事 学号:200818008629002的同学已经加载成功1 己经收到信息! 务流程去中心化。本质上讲,电子证据系统是 加载区块信息。请稍后! 校验成功 将法规所要求部分公共电子数据本地备份并形成 共识节点。P2PIEN的具体内容参见文献[16]。 图4校级联盟区块链 例1学历认证的电子证据系统原型的核心 Fig.4 School-level alliance blockchain 机构2:省级 区块链。学历认证的电子证据区块链系统原型主 己经收到信息! 加载区块信息,请稍后! 要由从教育公共数据库(目前包括校级、省级及 校验成功们 国家级数据库)中自动获取数据、形成区块并将数 Hash:0000e218a43057ea3ale3a4c5ccc08d3cf43a318f3c4b64el6658347d9560494 StudentChains<5 Blocks.Head:234c254fd67d4aef944c6aca05b49214> 学号:200818008629001的同学己经加载成功! 据加载进区块链中及进行学历认证过程3部分组成。 己经收到信息! 1)获取数据阶段:将学生信息按学号自动从 加载区块信息,请稍后! 校验成功! 数据库提取出来,提取出的同一学生的不同粒度 Hash:000016c2b0ca5472d5899c2717H7b0ba30e0b9220bbca416cl9887fed909 StudentChains<6 Blocks,Head:b8057635628d4f44b2fbaae44e2288d3> 的记录将会起到相互佐证作用。获取公共数据库 学号:200818008629002的同学己经加载成功1 己经收到信息! 记录部分源码如图2。 加载区块信息,请稍后! 校验成功! class Student: def init (self): 图5省级联盟区块链 self.helper=MysglHelper(); def getOne(self,stuNo:#外面传人参数 Fig.5 Provincal-level alliance blockchain 机构3:国家级 sql="selectfrom t_school where stuNo=%s"; 已经收到信息! params=(stuNo,); 加载区块信息,请稀后! return self.helper.getOne(sql,params); 校验成功! def getAll(self,#获取所有学生数据 Hash:000037a8a54cc82d46482a43e4e2dc8919888b2cl64c35870b833623d0d9 sql="select stuNo from t school". StudentChains<11 Blocks,Head: 学号:200818008629001的同学己经加载成功! return self.Helper.getAll(sql); 己经收到信息! def check Validate(self,stuName,stuNo) 加载区块信息,请稍后! sql="select *from t school where stuName=%s and stuNo=%s"; 校验成功! params=(stuName,stuNo); Hash:00009c3e2c01c378fm3e5a4567532c9d0a61bal2af49%520a46fac314316f return self._helper.getOne(sql,params), StudentChains<12 Blocks,Head:202783f9ebd748a7bb761al718362790> 学号:200818008629002的同学己经加载成功! 已经收到信息! 图2获取数据部分源码 加载区块信息。请稍后! Fig.2 Get the data part of the source code 校验成功! 2)数据加入区块链阶段:首先,将提取的每 图6国家级联盟区块链 条学生信息形成一个区块;其次,各用户对该 Fig.6 National-level alliance blockchain
目标主机 CA服务器 P2P电子证据网络 数据识别服务 数据识别服务 公共数据区块链 公共数据区块链 互联网 互联网 P2P电子证据网络 公共数据 区块链 图 1 电子证据区块链结构 Fig. 1 Blockchain structure of the E-evidence system 该体系依赖于现有的数据仓库架构[13-14] ,将 电子数据作为一种资产进行统一标识,利用区块 链技术将数据进行分布式存储,通过设计高效分发 协议,实现数据在参与者之间的自主对等的 P2P 电 子证据网络 (peer to peer i-evidence network,P2PIEN)。 该电子证据网络依托于公共数据库网络的物理系 统和数据博弈覆盖网络,在逻辑上遵从电子证据 系统的法律要求,并且将部分公共数据库系统事 务流程去中心化[15]。本质上讲,电子证据系统是 将法规所要求部分公共电子数据本地备份并形成 共识节点。P2PIEN 的具体内容参见文献 [16]。 例 1 学历认证的电子证据系统原型的核心 区块链。学历认证的电子证据区块链系统原型主 要由从教育公共数据库 (目前包括校级、省级及 国家级数据库) 中自动获取数据、形成区块并将数 据加载进区块链中及进行学历认证过程 3 部分组成。 1) 获取数据阶段:将学生信息按学号自动从 数据库提取出来,提取出的同一学生的不同粒度 的记录将会起到相互佐证作用。获取公共数据库 记录部分源码如图 2。 class Student: def _init_(self): self._helper=MysqlHelper(); def getOne(self,stuNo); #外面传入参数 sql= “select*from t_school where stuNo=%s”; params=(stuNo,); return self._helper.getOne(sql, params); def getAll(self); #获取所有学生数据 sql= “select stuNo from t_school”; return self. Helper.getAll(sql); def checkValidate(self, stuName,stuNo): sql=“select * from t_school where stuName=%s and stuNo=%s”; params=(stuName, stuNo); return self._helper.getOne(sql, params); 图 2 获取数据部分源码 Fig. 2 Get the data part of the source code 2) 数据加入区块链阶段:首先,将提取的每 一条学生信息形成一个区块;其次,各用户对该 区块进行共识;最后,一旦共识成功,对区块进行 链接,形成完整的区块链。通过共识算法来保证 用户账本之间的一致性,即分布式记账核心。将 具体的区块加入区块链过程如图 3~6。 def main(); book=TransactionBook(); #1.从学校将学生数据从数据库加载进区块链中 print ( ): student=Student(); allReconds=student.getAll(); for stuNo in allReconds; if stuNo: data=student.getAll.getOne(stuNo); b=Transaction( , data); book.addBlock(b); print(book); print( .format(stuNo[0])); else: print( ); “1.开始从学校信息将学生数据加载进区块链内!” “来自学校系统” “学号:{}的同学已经加载成功!” “此学生不存在!” 图 3 数据加入区块链 Fig. 3 Data is added to the blockchain 1.联盟区块链构建。 机构1:校级 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:0000297e77f1fd64a41632b5469ca386070399aacdaf0657641b8413a2585605 StudentChains<l Blocks, Head: 5a7a15c3bd194532bbc0cd66336el59b> 学号:200818008629001的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:0000685fa261abcc29alc240b5a093d56f501a5402eab5dba9aaff71674daf17 StudentChains<2 Blocks, Head:25114c07712d45fbbe975c3c6e271c47> 学号:200818008629002的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! 图 4 校级联盟区块链 Fig. 4 School-level alliance blockchain 机构2:省级 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:0000c218a43057ea3ale3a4c5ccc08d3cf43a318f3c4b64el6658347d9560494 StudentChains<5 Blocks, Head:234c254fd67d4aef944c6aea05b49214> 学号:200818008629001的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:000016e2b0ca5472d5899cl2717fl7b0ba30e0b9220bbca416cl9887fed909aa StudentChains<6 Blocks, Head: b8057635628d4f44b2fbaae44e2288d3> 学号:200818008629002的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! 图 5 省级联盟区块链 Fig. 5 Provincal-level alliance blockchain 机构3:国家级 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:000037a8a54ce82d4648fl2a43e4c2dc8919f888b2el64c35870b83362f3d0d9 StudentChains<11 Blocks, Head: 30522e7fc7294fd0b3ddl8df0cc9a315> 学号:200818008629001的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! Hash:00009c3e2c01c378ffl3e5a4567532c9d0a61bal2af49b520a46faac31431c6f StudentChains<12 Blocks, Head: 202783f9ebd748a7bb761a1718362790> 学号:200818008629002的同学己经加载成功! 己经收到信息! 加载区块信息,请稍后! 校验成功! 图 6 国家级联盟区块链 Fig. 6 National-level alliance blockchain ·1130· 智 能 系 统 学 报 第 14 卷
第6期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1131· 3)进行学历认证过程:一方面,尽管任何一 除已形成的区块的数据,将导致其他用户账本对 级的数据库中的数据可以被管理员进行修改/删 应的区块信息不一致,这是不允许发生的。图7~ 除,但是修改后的数据记录只能以新的区块形式 8显示的是区块链中的数据与某账本改变区块数 加入对应的链条中去;另一方面,当试图修改/删 据失败验证。 2.机构读取区块链中的信总。 时间:2006-11-0907:14:47:来自学校系统:学生信息: (1, 200818008629001, 李小路',0,datet1me.date(2008,9,11) 时间:2006-11-0907:14:48:来自学校系统:学生信总: (2, 2006-11-0907:14:49:来自学校系统:学生信息: ,200818008629002',,张周,1,datet1me.date(2008,9,11), 时间: (3, 1200818008629003', 萧然 ,0,datet1me.date(2008,9,11), 时间:2006-11-0907:14:51:来自学校系统:学生信总: 200818008629030',,白易 ,1,datet1me,date(2008,9,11), 时间:2006-11-0907:14:51:来自省级系统:学生信息: 1 1200818008629001', ,李小路,datetime.date(2008,9,11), 时间:2006-11-0907:14:51:来自省级系统:学生信总: (2, '200818008629002',,张周',datetime.date(2008,9,11),'101 时间 2006-11-0907:14:53:来自省级系统:学生信息: 3, "200818008629003',,萧然,datetime.date(2008,9, 11),10 时间:2006-11-0907:14:53:来自省级系统:学生信总: (4, 200818008629030',,白易',datetime.date(2008,9,11), 1101 时间 2006-11-0907:14:54:来自省级系统:学生信总: 5, 200917008627020',,张丽:,datet1me.date(2009,9,11),·10 时间:2006-11-0907:14:54:未自省级系统:学生信息 006-11-0907:14:55:来自国家级信总系统:学生信息 '201717008627020',·王成',datet1me.date(2017,9,11), ,101 时间: (1, ·200818008629001', 李小路, 云南省,·10674, 毕业 时间:2006-11-0907:14:55:来自国家级信总系统:学生信总: (2 200818008629002', 张周·,云南省,10674·,毕业) 时间: 2006-11-0907:14:56:来自国家级信息系统:学生信息: (3, 200818008629003·,萧然,云南省, 10674', ,毕业) 时间:2006-11-0907:14:56:来自国家级信总系统:学生信总: (9 200818008629030', 白易· 云南省·,·106741,退学) 时间:2006-11-0907:14:57:来自国家级信息系统:学生信息: (5, *200917008627020', 张丽,云南省,·10673', ,毕业*) 时间:2006-11-0907:14:57:来自国家级信总系统:学生信息: (6,201717008627020',王成·,云南省",·10673',·在校) 图7读取区块链中的信息 Fig.7 Read the information in the blockchain 3.机构欲修改区块链中信息。 原信息为:'200818008629030',,白易,1,datetime.date(2008,9,11),,计算机应用扶术:,昆明理工大学,退学 欲修故信息为:('200818008629030',·白易·,1,datet1me.date(2008,9,11),计算机应用技术,·昆明理工大学,毕业) 正在校验! 修改信急失败! 图8修改信息失败 Fig.8 Modifying information failed 3电子证据取证系统 3)工作主机:将安装系统客户端软件,供用 户登录系统,也是U盘取证工具端与CA服务器之 3.1电子证据取证系统的构成 间交互的桥梁,为二者提供通信和数据传输服务。 电子证据包括取证任务生成、物理介质、取 4)U盘取证工具端:工具端是安装WinPE操 证认证、电子数据和电子证据提交。电子证据本 作系统的导引U盘,内置的WiPE操作系统镜像 质上仍然是计算机产生的数据,在传输和存储过 集成了为提取目标主机的计算机取证信息的数据 程中表现为0和1构成的字符串。在电子证据取 采集软件,同时以外部数据形式放置取证任务证 证和保全过程中,需要设置CA服务器。通过运 书。通过U盘取证终端提取到的电子证据经过 用信息安全技术生成对电子证据本身具有证明作 签名和加密处理,以U盘为载体将数据转移至目 用的辅助证据,形成电子证据的链锁。电子证据 标主机。 采集和保管系统由一个C/S架构的软件系统和相 WinPE系统是一个组件精简版的操作系统内 应的硬件部署,外加便携式U盘取证工具组成。 核镜像,其工作原理是将镜像加载至内存后以解 硬件部署包括CA服务器、数据库服务器、工作主 压的方式将操作系统安装在内存中,而不用启动 机、U盘取证终端。 主机自身的操作系统。目标主机的硬盘对于WiPE 1)CA服务器:提供对系统用户(如法院、检 来说就是一块完整的外部硬盘。因此,WinPE系 察院等)的注册和认证,项目和任务的认证和授 统启动过程中并不使用主机的任何硬盘数据。从 权,任务证书的生成、签发,电子证据加密密钥和 而保持了目标主机硬盘的完整性,避免了一些高 签名密钥的生成和发放等服务。 科技犯罪行为利用程序设置非本人进入的使用销 2)数据库服务器:提供对系统用户数据库、 毁程序毁灭关键证据。同时,目标主机中的病 项目任务数据库和电子证据数据库的服务支持。 毒、木马无法影响到取证工具端中的WinPE系统 其中电子证据数据库是公共数据库中区块链的本 和文件,从而在一定程度上保证了整个电子证据 地数据服务器,负责相应各级数据提供者的数据 取证系统的安全性。公共数据库电子证据取证流 变更和本地备份,将受到智能合约的控制。 程如图9
3) 进行学历认证过程:一方面,尽管任何一 级的数据库中的数据可以被管理员进行修改/删 除,但是修改后的数据记录只能以新的区块形式 加入对应的链条中去;另一方面,当试图修改/删 除已形成的区块的数据,将导致其他用户账本对 应的区块信息不一致,这是不允许发生的。图 7~ 8 显示的是区块链中的数据与某账本改变区块数 据失败验证。 图 7 读取区块链中的信息 Fig. 7 Read the information in the blockchain 图 8 修改信息失败 Fig. 8 Modifying information failed 3 电子证据取证系统 3.1 电子证据取证系统的构成 电子证据包括取证任务生成、物理介质、取 证认证、电子数据和电子证据提交。电子证据本 质上仍然是计算机产生的数据,在传输和存储过 程中表现为 0 和 1 构成的字符串。在电子证据取 证和保全过程中,需要设置 CA 服务器。通过运 用信息安全技术生成对电子证据本身具有证明作 用的辅助证据,形成电子证据的链锁。电子证据 采集和保管系统由一个 C/S 架构的软件系统和相 应的硬件部署,外加便携式 U 盘取证工具组成。 硬件部署包括 CA 服务器、数据库服务器、工作主 机、U 盘取证终端。 1) CA 服务器:提供对系统用户 (如法院、检 察院等) 的注册和认证,项目和任务的认证和授 权,任务证书的生成、签发,电子证据加密密钥和 签名密钥的生成和发放等服务。 2) 数据库服务器:提供对系统用户数据库、 项目任务数据库和电子证据数据库的服务支持。 其中电子证据数据库是公共数据库中区块链的本 地数据服务器,负责相应各级数据提供者的数据 变更和本地备份,将受到智能合约的控制。 3) 工作主机:将安装系统客户端软件,供用 户登录系统,也是 U 盘取证工具端与 CA 服务器之 间交互的桥梁,为二者提供通信和数据传输服务。 4) U 盘取证工具端:工具端是安装 WinPE 操 作系统的导引 U 盘,内置的 WinPE 操作系统镜像 集成了为提取目标主机的计算机取证信息的数据 采集软件,同时以外部数据形式放置取证任务证 书。通过 U 盘取证终端提取到的电子证据经过 签名和加密处理,以 U 盘为载体将数据转移至目 标主机。 WinPE 系统是一个组件精简版的操作系统内 核镜像,其工作原理是将镜像加载至内存后以解 压的方式将操作系统安装在内存中,而不用启动 主机自身的操作系统。目标主机的硬盘对于 WinPE 来说就是一块完整的外部硬盘。因此,WinPE 系 统启动过程中并不使用主机的任何硬盘数据。从 而保持了目标主机硬盘的完整性,避免了一些高 科技犯罪行为利用程序设置非本人进入的使用销 毁程序毁灭关键证据。同时,目标主机中的病 毒、木马无法影响到取证工具端中的 WinPE 系统 和文件,从而在一定程度上保证了整个电子证据 取证系统的安全性。公共数据库电子证据取证流 程如图 9。 第 6 期 李萌,等:基于区块链的公共数据电子证据系统及关联性分析 ·1131·