0、前言
随着类似Filecoin这样的去中心化存储项目的上线测试又引起行业的一阵热潮,除了挖矿、炒币外作为区块链相关的技术型公司更需要冷静看待其相关技术方案在实践中落地的可行性及能否真正赋能实体经济。本文就去中心化存储相关的技术及后续的演进方向做个分析。
1、中心化存储及其优劣
在分析去中心化存储前首先要先了解传统的中心化存储及其优劣, 窄一点来说中心化存储就是把文件存储到一个的计算机磁盘及通过某种文件系统来管理、并通过操作系统统一的文件IO API供外部应用使用;泛一点来说就是随着互联网发展起来的云存储系统,企业或个人把自己的文件存储到云服务商提供的中心化管理的计算机集群上,云存储系统使得存储文件在任何一个有互联网的地方都可以访问成为了可能。
随着互联网的发展,云存储已经是很多企业解决方案或个人应用需求中不可或缺的一部分,同时这个庞大的市场需求及应用实践也暴露出了中心化存储系统的各种各样的问题:
其一是高额的存储成本,传统的中心化存储系统基本都采用了软、硬备份策略来保证文件的可靠性,其直接带来的就是高额的存储成本,随着5G技术赋能实体经济并带来的海量业务数据得存储成本是不得不权衡的重要因素。
其二是数据安全性问题,云存储目前已经成了各种黑客、数据分析类公司重点关照的对象,这样企业或个人存储的各种私密文件都将面临巨大的安全风险。
其三是服务变化及终止的风险,在面向T0C的公有云市场服务商的政策调整、服务终止等对用户来说都潜在风险以及如何把数据备份回来都是要面临的问题。
2、什么是去中心化存储?
去中心化存储是把文件存储到类似P2P网络中的多个存储节点,其一方面通过文件加密、切片存储等方式来保证文件的安全性、另一方面节点掉线后通过自愈及纠删码等技术来保障文件的可恢复。新技术的出现也有其两面性:解决已存问题、面临新的问题或挑战。去中心化存储相对传统中心化存储来说一方面可以大大减低成本、也可以解决文件安全的问题,但另一方面其同样也面临不小的挑战。
3、 去中心化存储的主要挑战
1) 如何解决存储节点数量及稳定性的问题?
去中心化存储系统必然需要足够且相对稳定的存储节点,节点少了影响存储效率、节点不稳定影响文件可靠性。目前行业内普遍采用的是区块链+通证的方式来激励空闲存储资源(或矿机)的加入(矿机通过提供存储空间及带宽来获取收益),比如IPFS+Filecoin、Storj以及Sia等著名项目;同时这些去中心化存储项目的设计基本上都是TOC的领域,这样就需要有足够完美的经济模型来支撑整个激励系统的运行,做到真正惩罚不诚实节点、淘汰不稳定的存储节点、激励诚实稳定的存储节点。但既然是通证就高概率的会面临虚拟币的问题,目前这在国内来说还是一条红线,也就是说在TOC领域基于通证激励的模式还是面临很大的障碍。
2) 如何解决存储节点作弊的问题?
采用区块链+通证的方式就必然要考虑如何防止存储节点作弊的问题。目前来说不管是国外还是国内的项目基本上都是采用了类似可恢复性证明(PoRet)、存储证明(PoS)以及明星项目Filecoin采用的时空证明(PoSt)等算法来保障文件存储的真实性、可靠性。但这些算法在实际应用中都要面临效率等问题,效率上不去其必然影响整个公链的效率,比如Filecoin的时空证明算法性能问题已经成为影响其商业化重要因素,导致整个项目多次延期以及对矿机的要求从PC发展到了需要GPU等硬件来支持等。
3) 如何提升文件存储、下载的性能问题?
就目前的公用IPFS及类似Storj、Sia等系统国内网络接入还是面临比较大的壁垒,另一方面这些系统的设计在面向VIP用户时其QOS(比如如何就近存储、就近下载以及带宽保障等)考虑的还是比较少、甚至没有。
4) 如何解决文件大量重复的问题?
去中心化系统文件去重是降低成本的一个重要方式,就目前的IPFS系统来说其为了文件去重牺牲了文件安全性(不做加密);其它的基于市场化的存储系统由于采用了基于合约及存储证明的经济模型,其一方面无法做到文件真正去重,做了去重反而不一定能达到降低存储成本的目的(成本决定了其存储的可靠性,备份越多,可靠性越高,成本越高)。
4、多中心化存储系统
目前公链+通证的去中心化存储系统在技术上虽然有了很大进展,但这种靠挖矿获取激励的模式在国内会面临很大的困难:一方面公链在国内来说本身就难以推广、另一方面就ToB业务来说很难说服企业自己的业务数据存储到这样一个公链存储系统,反之基于类似联盟链的存储系统可能会更容易取得突破。
中心化存储存在高成本、安全性、服务变动大的问题,去中心化存储存在节点维持、作弊及性能等问题,若要定性谁优孰劣都是相对片面,而集二者之长避其所短才是后续发展的大趋势。综合对主流去中心化存储的调研及结合未来可落地的考虑,基于"整体多中心化、局部去中心化"框架的分布式存储系统或许是将来可落地、可商业化实施的主流方案,该方案不仅具备了去中心化思想,同时又保留了传统中心化存储的核心优势。
什么是整体多中心化?
整体多中心化就是采用类似分域的概念把整个存储系统分为多个域、每个域有若干个超级节点来负责管理和连接存储节点,对应实践来说每个存储用户可就近域存储从而优化或解决完全去中心模式的性能问题;另一方这样的管理模式也可使得整个系统的横向扩展、扩容基本上是没有太多额外的升级成本。
什么是局部去中心化?
局部去中心化就是类似在每一个域内所有存储节点是通过超级节点管理来获取文件分片存储派单,对一个文件来说其存储就是去中心化的。另一方面各个域之间的超级节点也是一个去中心化的互联P2P系统,这些超级节点实现了域之间文件存储信息的共享及可能类似于CDN那样的就近分发功能,这样在域之间可以做到负载分担、同时文件基于域的就近存取。
这种"整体多中心化、局部去中心化"的模式同时具备了中心化和去中心化的优势,同时也很大程度上优化或解决了两者单独存在的问题。另外基于这种模式可以充分利用传统IDC企业已有的存储设备组成一个庞大的存储联盟,这样不仅大大降低存储成本同时使的存储节点数量及存储空间提升到一个海量级别。
网友评论