区块链在电子档案管理中的关键技术问题研究*

来源:优秀文章 发布时间:2022-12-05 点击:

顾伟

(安徽大学档案馆 合肥 230039)

区块链技术由于具有的去中心化、可追溯和不可篡改的特点受到了许多行业的关注。本质上,区块链并非一种全新的技术,而是分布式数据存储、点对点传输、共识机制、加密算法等各种计算机技术的结合,这种结合能够充分发挥这些技术各自的优点,实现去中心化的应用模式,为社会、经济、生活和政府管理带来了巨大的变革[1]。

在电子档案管理领域,区块链技术与之也有多方面的契合:区块链所特有的不可篡改、不可抵赖、多方参与等特性,与电子数据存证的需求有着天然契合[2];
区块链中的区块自产生之时起就将受到监管,之后在链上的任何的改变都可以做到全程可追溯,这符合电子档案全程管理和的思想和存证的需要[3];
哈希函数和非对称加密方法有利于保证电子档案利用信息安全[4];
区块链技术的不可篡改性和不可删除性有助于解决电子档案真实性和长期保存的问题[5][6]。

以“档案+区块链”为关键词在中国知网中进行检索,并将文献来源限定为北大核心期刊范围,可以检索出80篇相关文献。研读这些文献可以发现,这些文献均发表在2017年之后,研究内容主要聚焦于三个方面:一是区块链技术在电子文件或电子档案长期保存[7]、可信保护[8]、信息资源共享[9]和存储方式[10]等关键档案业务问题;
二是典型档案区块链项目建设经验与启示[11][12];
三是特定档案门类的区块链技术实践研究[13][14][15],中石化已开展了基于区块链技术的电子文件归档管理的应用试点,中科院合肥物质科学院档案馆已采用联盟区块链技术管理大科学工程档案,沈阳市档案馆利用区块链技术实现跨馆出证服务。

这些研究内容虽不尽相同,但都是结合档案业务对区块链技术进行应用研究,而较少地关注区块链技术在档案领域的应用“适配”。事实上,区块链作为一种技术手段,档案领域不一定必须采用该技术来改变现有的电子档案管理方式,但若将区块链技术作为一种技术手段应用于电子档案管理中,档案区块链就必须具备高性能、高可用性和高安全性的特点,否则便无法在档案领域得到广泛应用,也就无法取得较好的社会价值和经济效益。

从技术角度来说,实现区块链技术在档案全行业的广泛应用,除需在业务层面促进电子档案管理与区块链技术的加速融合外,还应对涉及到的区块链关键技术问题进行研究,只有这样才能有效推进区块链技术在档案领域的落地,促进档案的科技进步,从而为电子档案在全社会范围内的可信、可用提供一条切实可行的技术路径。

目前,区块链分为公有链、联盟链和私有链三种,三者之间的主要区别在于去中心化程度、节点数量、数据透明程度以及数据处理效率等方面。

公有链是面向全体公众的,它是一种完全去中心化的区块链,主要应用于需要获得所有公众信任的场景。任何机构和个人都可以作为一个节点参与其中,节点的规模和数量没有任何限制,链上所有节点完全平等,数据对所有节点完全开放和透明。

相比而言,联盟链虽不完全是一个去中心化的系统,但联盟链中存在着不同“立场”的节点,节点与节点之间是通过共识机制实现区块的不可篡改,所以,它可以等同于一个去中心化的系统。通常联盟链的节点规模和数量是有限的,在特定网络环境下可以实现链上所有节点的相互信任,因此,联盟链对数据的处理效率相对较高。应该指出的是,联盟链的效率虽比公有链高、比传统中心化系统低,但它具有传统中心化系统无法具备的公信力。

私有链和联盟链的相似程度较高,在技术实现上也较为相近,它们之间的主要区别在于所有节点是否受“同一个组织”控制。在一定意义上,我们可以将私有链看成联盟链的“缩小版”。

上述三种区块链中,公有链是最能体现区块链技术的根本思想,但若将公有链应用于档案领域,则会存在两方面问题:一是技术层面问题。公有链的根本目标是取得互不相识甚至是相互冲突各方的共同信任,即共识问题。这需要所采用的共识机制能够处理对抗单点故障、分叉和恶意节点等特殊情况,因此,它的共识效率必然会较低。而在实际使用中,档案区块链系统的节点数量不需要无限扩展,也很少会存在恶意节点过多的情况,所以,这可能会造成基于公有链的档案区块链系统过于复杂和冗余,降低了系统性能。二是应用层面问题。公有链上的数据是没有隐私保护的,链上所有数据都可以被其他任何节点查看,这与档案管理的要求不相符。档案信息资源公开是有范围和条件的,有些是完全公开的,有些是部分公开的,不同权限用户应该看到不同的档案信息。

事实上,档案区块链系统上的节点和参与者都是经过审核和验证的,所采用的网络一般都是专用网络,不同区块链之间的数据交换也是有要求的,同一条区块链的档案数据共享和利用也是要进行分级管理的,这些应用需求这与联盟区块链的设计思想和构架是相符的,因此,在档案领域中,区块链技术应优先选择联盟区块链技术。

一个典型的档案联盟区块链系统流程如图1所示。在各业务系统中产生的电子文件通过采集归档模块发送给联盟链的节点,HTTP服务器上的联盟区块链节点在收到新增电子文件的事务请求后,会校验签名内容和证书信息。该事务通过校验后会被推送给共识模块,共识模块一方面通过网络广播通知其他节点,进行节点间的共识,另一方面,也会将该事务交由执行模块和虚拟机模块执行。执行模块完成事务的验签,确认该事务的来源、完整和安全性,虚拟机模块负责将该事务以智能合约的形式在虚拟机中具体执行,最终形成账本。

图1 典型的档案联盟区块链系统流程图

联盟区块链作为一种技术实现方式,将其应用于电子档案管理过程中时,需要根据电子档案管理的业务需求和应用特点对联盟区块链的上链效率、隐私保护、跨链信任和扩容等关键技术问题进行研究,使之能够契合电子档案管理的实际需要,更好地实现联盟区块链技术为电子档案管理服务的目的。

2.1 上链效率问题

效率和共识一对矛盾。在一个去中心化的系统中,区块链节点要对每个上链的档案数据区块信息作校验,若考虑所有可能的情况,使各个节点都达成共识,其效率必然会降低。相反,在一个中心化的系统中,上链档案数据不存在需要达成共识的问题,其效率必然较高。最初的比特币区块链采用的是依赖节点算力的工作量证明共识机制(POW)来保证分布式记账的一致性,它的交易频率仅为每秒6笔[16],不仅效率过低,而且耗费的资源过多,如将其直接应用于电子档案管理中也会存在数据处理过慢的问题。因此,有学者提出了不过度依赖算力又能达到全网一致的算法,如权益证明共识机制(POS)、授权股份证明机制(DPOS)、拜占庭容错算法(BFT)、实用拜占庭容错算法(PBFT)等。在这里,我们建议采用PBFT算法及其变体。PBFT算法能够将算法复杂度从指数级降到多项式级,它的吞吐量可以达到每秒千次以上,能够非常好的应用于业务量不大但需要处理大量事件的档案领域。档案联盟区块链对节点是有管控的,在恶意节点较少甚至是没有的情况下,PBFT算法可以支持较高的吞吐量和极短的终局时间,其正确性和活动性是可以被证明的,这不仅能够符合档案业务需要,而且能够有效提高档案区块链的共识效率。

2.2 档案信息隐私保护问题

区块链系统的重要特点之一就是数据的共享与透明。区块链上的存储和传输的都是公开可见的,仅通过“伪匿名”的方式对交易双方进行一定的隐私保护。站在去中心化角度看,这是区块链技术的优势,但站在安全隐私的角度看,这是区块链技术的劣势。对于涉密和不应公开的电子档案而言,区块链上档案数据的完全公开不符合档案业务要求和管理要求[17]。因此,寻找一种能够有效满足档案信息隐私保护要求和操作权限控制的联盟区块链,是区块链技术在档案领域应用落地过程中需要重点解决的问题。

解决区块链上隐私保护的技术手段有同态加密、环签名技术、零知识证明等方法,本文建议零知识证明方法作为解决链上数据隐私保护的技术手段,这是因为零知识证明技术可以实现证明者向验证者证明并能使其相信自己知道或拥有某一消息,但在证明过程中并不向验证者泄漏任何有关被证明消息的信息。实践证明:如果能够将零知识证明应用于联盟区块链中,将能较好的解决区块链的隐私保护问题。

2.3 电子档案跨链信任问题

电子档案的跨链问题从档案管理角度来说是解决跨机构电子档案的信任问题,从技术角度来说解决的是电子档案在不同的链之间的数据交换问题。跨链技术就像是一个中间交易所,能够让所有数据在交易所里进行跨链交易[18]。跨链技术对区块链,尤其是联盟区块链,之所以重要是因为如果不能很好地实现电子档案数据的跨链,那么,每条链上的电子档案就像一个个信息孤岛,相互之间无法互通,区块链技术就无法在档案领域落地。这里的“跨链”包括两方面内容:一是不同区块链之间的数据互通问题;
二是链上链下数据协同问题。

解决不同区块链之间的数据互通有多种方式:公证人模式、哈希锁定、分布式私钥控制等。这三种跨链技术的实现机制是不一样的,同时,在实现难度方面,哈希锁定的方式较为容易,其余两种相对较难;
在效率方面,公证人模式速度较慢,其余两种相对较快。随着档案工作的升级转型,电子档案的数量必然不断增长,电子档案在不同区块链上跨链传递必然变得越加频繁。因此,在技术选型上,我们不仅要考虑目前技术本身的成熟度,而且还要考虑技术的长期发展的改进空间。

链上链下数据协同问题也是区块链必须解决的问题之一。所谓“链上”是指区块链,“链下”是指前端各个业务系统。链上的电子档案真实性可以由区块链技术本身保证,但是,链下业务系统大都是非区块链系统,虽然有些链下业务系统已经实现了电子文件的单套制保存,但其可信性和合法性仍未被全社会广泛接受,现阶段若将将所有业务系统都用区块链系统进行替换也是不切实际的。因此,解决链下电子文件和链上电子档案之间相互信任是区块链技术应用不可回避的问题。

区块链系统的突出作用是可以证明电子档案的真实性,它的计算和存储能力相对较弱。链下业务系统的电子文件数量是非常庞大的,如果将这些数量庞大的电子文件都上链保存,虽然可以一定程度的解决电子文件真实性问题,但这会大大增加链上区块链系统的数据处理和存储压力。换句话说,链上区块链系统需要通过链下业务系统扩展其计算能力和存储能力,链下系统也需要与区块链系统对接以解决电子档案防篡改问题。从这个角度来说,链上与链下之间是一种互补协同的关系,我们需要在互补的前提下处理好链上链下之间的协同信任、协同计算和协同存储问题。

2.4 区块链的扩容问题

区块链扩容,扩大的不仅是每个区块的容量,更是要提高区块链系统的性能。分布式系统一直存在着CAP理论,即分布式系统只能同时满足一致性、可用性和分区容错性三种特性中的任意两个特性。区块链系统本质上作为一种分布式系统,也必然存在着类似的三元悖论[19],即区块链系统的性能、安全与去中心化不能同时得到满足,现有的区块链系统都是以牺牲性能为代价,实现系统的去中心化和安全性要求。档案联盟区块链系统性能的提升,需要综合考虑系统去中心化的程度和安全性的需要,单纯采用增加区块链的节点或扩大区块的容量的方法,不但不能起到扩容的作用,反而会降低系统的共识效率,导致系统性能的下降。

究其本质,区块链扩容问题是由于分布式架构自身特点而导致的区块链系统共识效率较低问题,为解决电子档案高频管理与利用问题,本文建议采用多层扩容的方法,即链上链下同时扩容的方法。从可行性来说,链上扩容符合当前技术的应用实际,可以在短期内取得较快突破,推进区块链技术的实际应用,但是它的扩容能力有限;
链下扩容需要改进底层协议,短期内不易取得突破,但是这是未来区块链技术的改进方向,可以从根本上提高并解决联盟区块链系统的吞吐量和解决交易延迟问题。

目前,联盟区块链主要有Hyperleger Fabric、FISCO BCOS、EEA Quorum和R3 Corda四种有代表性的联盟链,它们在共识协议、扩展性、节点管理、智能合约和隐私保护等方面不尽相同,相互之间的区别如表1所示。在这里,我们建议选择将Hyperleger Fabric链作为档案联盟区块链。

表1 不同联盟区块链的区别

Hyperledger Fabric联盟链是由 Linux基金会主导的、模块化的、支持可插拔组件的基础联盟链,是大型企业构建区块链底层的较好选择。Fabric联盟链在初期版本中采用PBFT算法达成共识以提高上链效率,之后为进一步提高效率,放弃了 PBFT算法而采用效率更高的Kafka和Raft进行排序。在扩展性方面,Fabric联盟链虽然相对其他联盟链存在一定的限制,但它可以支持较多的客户端。在节点管理方面,Fabric联盟链采用背书策略进行管理,并有专门的 CA 模块提供用户信息注册、数字证书发行、延期和吊销等服务,这非常符合电子档案管理的管理需要。Fabric联盟链的智能合约也称之为“链码”,它能提供系统链码和普通链码,并且允许跨通道调用链码。在隐私保护方面,Fabric联盟链最初只允许同一通道内的节点才可以共享同一套账本信息,之后进行了改进,增加了私有数据模式,允许指定节点间共享信息,这相比其他联盟链来说更加灵活实用;
在数据加密方面,由于Fabric联盟链引入了私有数据模式,使它由最初的只支持账本数据的加密方式变为能够支持向 Kafka 提供交易哈希而不向 Kafka 提供交易信息的加密方式,以此防止排序节点数据信息的泄露。

区块链技术作为一种新技术,其在档案领域实际应用的时间较短,且以实验性验证为主,对档案领域关键技术问题的研究上还存在着诸多有待改进的地方。我们只有将技术与业务不断进行融合,才能实现区块链技术在档案行业的有效应用。

猜你喜欢 共识区块节点 基于RSSI测距的最大似然估计的节点定位算法导航定位学报(2022年4期)2022-08-15分区域的树型多链的无线传感器网络路由算法现代电子技术(2022年4期)2022-02-21凝聚共识:新时代人民政协的初心与使命内蒙古统战理论研究(2021年1期)2021-06-09一种基于能量和区域密度的LEACH算法的改进智能计算机与应用(2021年4期)2021-06-05《红楼梦》的数字化述评——兼及区块链的启示红楼梦学刊(2020年3期)2020-02-06商量出共识人大建设(2019年12期)2019-11-18基于点权的混合K-shell关键节点识别方法华东师范大学学报(自然科学版)(2019年3期)2019-06-24一场区块链引发的全民狂欢金桥(2018年7期)2018-09-25区块链助力企业创新当代贵州(2018年21期)2018-08-29区块链投机者南都周刊(2018年6期)2018-06-23推荐访问:区块 档案管理 关键技术
上一篇:市政给排水管道安装施工技术的问题探析
下一篇:浮光掠影,凝住生命千样好

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有