区块链数据存储模式剖析

作者: 赵简子的三分地 | 来源:发表于2019-03-05 17:38 被阅读0次

区块链数据存储模式剖析
区块链中的区块是由什么组成的？
区块链是什么？
区块链理解
区块链是什么？
区块链
北京区块链技术开发|区块链软件交易所系统开发公司
区块链专业术语盘点
什么是区块链？能干什么？
区块链的概念以及在中国目前情况

在区块链落地场景中，区块链的作用，有时候被定义为用于信息存证的，具有不可篡改特性的“公示板”，例如在很多溯源、票据流转场景中，“公示板”的表现的比较明显。但是究其本质：区块链是作为一个提供数据可信流动的通道被使用的。区块链上数据的处理就变成了场景的关键环节，链上数据存储则是链上数据处理的重头大戏。数据处理吞吐量和存储空间有限一直是区块链在应用落地上的大阻碍。

本文针对区块链数据存储问题做一次剖析（隔离见证-外挂DB-分布式存储），并提出一些可行的区块链数据存储模式。针对区块链的吞吐量问题将在下一篇文章中进行讨论。

区块链上每个区块只能限制在一定的体积下（原始比特币的区块大小约为1M），不能无限扩充；区块链出块间隔必须达到一定的间隔（例如比特币为约10分钟，本体为约6秒）。这是由于区块链自身节点分布性的特色导致的（区块体积太大，会导致区块传播的带宽压力和传播延时增大。由于区块传播延时的存在，出块间隔太小会导致链上分叉太过频繁）。

针对“怎样在区块体积有限的前提下，能够承载更多的数据量?”业内进行了诸多的探索。笔者将他们大概归为三种类型：（1）调整块内数据结构，来扩容。例如隔离见证。（2）链上保存索引，外挂数据库存储具体内容。（3）链上存储索引，具体内容存储到分布式存储系统中。

1. 隔离见证

隔离见证将原来区块中“必要”的交易信息（输入、输出）和“非必要”信息（脚本签名）分开，并把脚本签名信息从区块基本结构里拿出来，放在一个新的数据结构当中。这样可以把块内可容纳的数据记录增大约60%。（备注：隔离见证并不只用于扩容）。

隔离见证中的见证数据还是存储在链上。每个全节点依然会同步所有的数据。

2. 外挂DB

在使用区块链存证时，如果要存证的数据体积较小（一般建议小于1Kb），可以直接被记录到链上区块中。但是对于要存证的数据体量很大时，如果将数据全部存储到链上就很容易造成链的过载，这种情况下，建议将数据结构化之后计算数据整体的哈希，将数据哈希和数据的相关属性（例如哈希算法、时间戳、数据所有者签名、数据路径等）上传到链上并获得返回的数据ID，而将数据本身存储到区块链的外挂数据库中。