曾经有一支欧美乐队叫Enigma。Enigma的中文翻译叫“迷”。迷的迷之音乐曾经风靡全球。
区块链现在也风靡全球,迷倒大佬、韭菜无数。有意思的是,区块链技术一直标榜标榜隐私性是其一大特色,认为链上的转账地址无法和具体的人或者企业对应。然而实施情况是,区块链技术的隐私性是很差的。主要从两方面来看:
- 放在链上的所有数据都是可以公开被查询到的。
- 当对大量转账的地址做跟踪分析后,还是能大概猜出所有者,尤其是对于基金会、私募方以及交易所等。而且,基于现在交易所大多上了KYC,而大多数交易所并没有完善保护KYC数据的机制,一旦KYC数据发生泄漏,和交易地址匹配起来,就能够大致判断地址拥有者的信息了。
隐私性的不足,其实也制约了区块链,尤其是公链在商业方面的发展。没有一个商业机构愿意自己的数据财富被公开在网上的。
于是乎,Enigma
横空出世了
简单的说,Enigma是一套协议。利用这套协议,可以做到:
- 隐私信息在线下用分布式的技术加密存储起来,只有数据的拥有者才能用自己的私钥恢复出完整的数据集;
- 通过一套叫做“私密协议”的数据交互机制,使得消费(使用、计算)这些隐私信息成为可能。需要使用隐私信息的数据消费方,在不获得信息本身的情况下,可以了解到信息的状态,从而判断是否符合自己的业务。比如,在不获取一个人的收入、日常消费的订单信息的情况下,一个银行可以使用“私密协议”对个人的信息进行分析,从而了解贷款给此人是否有风险。
技术实现:
- 存储:
- Enigma基于Kademlia DHT算法,将一份完整的未加密信息打散,加密后存储到各个节点上。
- 每个节点能看到的只有加密后的信息。
- 数据的拥有者用自己的私钥,可以将存储在不同节点上的加密数据还原拼装后行成原始数据。
- 需要上链的隐私信息,其实上链的不是信息本身,而是指向隐私信息的一个引用。
- 计算:
- Enigma使用多方计算方式(MPC,multi-party computation),集成了零知识证明的算法,将数据的查询工作通过分布式的方式进行计算。
- Enigma对MPC算法做了调整和优化,使得原来记算量非常大的MPC算法优化到了复杂度为的状况.
- Enigma继续对MPC做了优化,使得整个体系支持分层的MPC,这样,当数据量很大,涉及到的节点非常多的时候,可以对整个数据的计算进行分级,从而减小整体的数据计算时间。
- 从安全性和性能考虑,每次计算,Enigma并不会要求每个拥有数据碎片的节点进行数据的计算,而是会随机挑选一批节点。这样,增加了计算的随机性,使得攻击者无法知道那些节点会参与运算从而进行有针对性的共计。
Enigma的通证
Enigma的通证叫ENG,其用途是:
- 数据的存储和计算需要支付ENG;
- 成为节点需要质押ENG,以防作恶;
- 参与计算和存储的节点可以获得奖励ENG;
目前Enigma的测试网络已经上线。且上线了基于数据的交易算法平台Catalyst。包括币安、BitFinex在内的几大交易所都集成了Catalyst的算法。Catalyst是基于Enigma,在交易数据集上让用户设置、回溯和测试不同的交易策略。
通过这套协议,有很多围绕着数据的商业逻辑可以建立起来了。我们举些例子:
- 数据交易市场
在不被知道具体数据的情况下,消费者可以向商家售卖自己的信息。比如,一家医药企业可以针对某个病例的病人的基因序列信息做计算,当并不获得每个用户的基因信息。 - 数据保护
企业的数据库,可以在Enigma的介入下,让员工可以在数据上进行分析,但不能得到每条单独的数据信息。从而最大程度保护了数据。 - IoT
在对数据源没有拥有权,不能获得每条单独数据的情况下,存储、管理和使用IoT设备产生的海量数据。 - 个人数据的隐私保护
在不泄露自身数据的情况下,设置第三方对自己数据的不同的使用授权。第三方无权获得自身数据,而只能针对自身的数据进行“计算”。 - 数字货币的金融体系
用户在不透露自身具体经济状况的前提下,就可以参与各种数字货币的金融活动,如贷款、存款、投资等。 - 隐私的 通证发行和监管
目前的代币发行,基于公开信息,大家是可以了解基金会、早期投资者的地址信息和代币流动信息的。就会有黑客尝试攻破这些地址。Enigma提供了一个“魔法”,使得从区块链上无法辨别哪个地址持有多少通证,但同时又遵循通证的智能协议所规定的发行量、是否解锁等限制,甚至可以和STO要求的监管条件想对应。
有趣的是,虽然Enigma主要是针对数据的加密来处理的,但实际上因为链下节点的参与,也能够起到链上扩容的作用。
重要的事情在最后提一下:
网友评论