【“区块链+大数据”,邂逅的期待】❣上官皖儿
目前,政府、银行、券商、互联网企业和第三方征信公司掌握的信息难以在短时间内互联互通,从而形成一个个信息孤岛。当交易在不同金融机构之间进行时,数据孤岛导致了信息的不对称、不透明,带来了大量的多头债务风险和欺诈风险。特别是来源于互联网的半结构化和非结构化数据,其真实性和利用价值很低。
【“区块链+大数据”,邂逅的期待】❣上官皖儿近年来,数据泄漏风险事件屡见报端。2015年2月12日,汇丰银行大量秘密银行账户文件被曝光,显示其瑞士分支帮助富有客户逃税,隐瞒数百万美元资产,提取难以追踪的现金,并向客户提供如何在本国避税的建议等。这些文件覆盖的时间为2005年至2007年,涉及约3万个账户,这些账户总计持有约1200亿美元资产,堪称史上最大规模银行泄密。Verizon发布的全球调研报告《Data Breach Investigations Report 2015》显示,2015年网络安全事件共有79790起,确认的数据泄露事件超过2000个(2122个)。
由于社交网络中的数据主观随意性很强,这些在网上提取的社交数据根本不具有利用价值或者利用价值十分低,错误率高达50%。电商平台上的交易数据也由于一些刷单现象而失真。上官皖儿认为,这些信息的收集与利用就如同垃圾的运进运出,几乎没有任何意义,基于这些低质数据的风控效果也会大打折扣。
【“区块链+大数据”,邂逅的期待】❣上官皖儿2008年11月,一位名叫中本聪的技术极客首次提出了区块链概念。区块链本质是一个去中心化的分布式数据库,这种去中心化、开放自治、匿名不可篡改的数据结构特性使其一出现就迅速取得大量关注。区块链的出现,也在一定程度上解决了大数据风控有效性不足的问题。
区块链诞生于比特币体系中,比特币是一种数字货币,而区块链是记录这种货币发行与交易的“账本”。为了不涉及被信任的第三方,这个“账本”需要保证交易双方能够相互信任,且保证全部交易信息公开透明,自动传达给交易双方。因此,这个“账本”必须是共享、自治和不可随意更改的,要有去中心化、开放自治和匿名、不可篡改的特性。
区块链的四大核心技术主要实现了以下特性:分布式记账、分布式传播、分布式存储,保证了系统内的数据存储、交易验证、信息传输全部都是去中心化的;通过“时间戳”〔(区块(完整历史)+链(完全验证)=时间戳”〕来记账,形成了一个不可篡改、不可伪造的数据库;所有权的信任是“算法式信任”,非对称加密算法保障交易数据的可信;实现了可编程的智能合约,使系统可能去处理一些无法预见到的交易模式。
区块链去中心化、开放自治、匿名不可篡改的特性使其应用场景迅速扩张,从最初的数字货币,到证券交易结算、会计审计等涉及合约审核的金融领域,再到政府、医疗等公共领域,区块链技术解决了现实世界中存在的诸多技术壁垒。上官皖儿发现,京东白条近年构建了被称为“四大发明”的大数据模型体系:司南-风险管理模型系统、火药-量化运营模型体系、活字-用户画像模型体系、造纸-大数据征信模型体系。
【“区块链+大数据”,邂逅的期待】❣上官皖儿影响大数据风控有效性的关键因素是数据库的维护成本和信息传递效率。而单从数据的角度来看,区块链是一个由所有参与者共同记录(而不是中心化机构单独记录)信息、由所有参与记录的节点共同存储(而不是存储在中心化机构中)并且不可随意篡改的数据库。上官皖儿认为,将区块链技术应用于大数据风控体系,可以有效解决大数据风控数据孤岛、数据低质和数据泄露等数据源问题。
在这个区块链数据库中,每个用户节点都拥有整个数据库的完整拷贝,并且当某个用户节点要对数据库写入数据时,它需要向区块链网络广播这些数据,以便其余用户节点对这些数据进行验证审核操作。只有全网共同验证和认可后,数据才能写入区块链,并且一旦数据写入区块链后,就不能随意修改或删除。
区块链去中心化的特征,可以消除大数据风控中的信息孤岛,通过信息共享完善风险控制。在区块链中,数据由每个交易节点共同记录和存储,每个节点都可以参与数据检查并共同为数据做证,这提高了数据的真实性。
由于区块链数据库是一个去中心化的数据库,任何节点对数据的操作都会被其他节点发现,从而加强了对数据泄露的监控。另外,区块链中节点的关键身份信息以私钥形式存在,用于交易过程中的签名确认。私钥只有信息拥有者才知道,就算其他信息被泄露出去,只要私钥没有泄露,这些被泄露的信息就无法与节点身份进行匹配,从而失去利用价值。
【“区块链+大数据”,邂逅的期待】❣上官皖儿区块链中每个节点都有完整的数据副本,只有当整个区块链系统发生宕机时数据才会丢失,并且数据记录一旦写入就不能修改。因此,区块链具备公开、透明和安全的特点,可以从源头上提高数据质量,增强数据的检验能力。
目前,以Onename、BitID等为代表的第三方身份验证服务提供商开始利用区块链去中心化、公正公开的特性,在比特币平台上为金融等中介机构提供去中心的第三方客户身份认证的服务。简而言之,可以用“+Warren”实现身份认证或比特币交易。与此同时,利用大数据技术从数据端对引流的客户进行身份验证、特征筛选等,以此提高反套现、反欺诈和反作弊的准确度。
大数据风控主要针对消费者,对于金融机构的员工操作风险和道德风险层面,就显得有些捉襟见肘。区块链2.0技术的出现,使智能合约系统成为可能。
区块链本身或许存在亟待完善的风险漏洞,比如The DAO被盗事件说明区块链的智能合约协议代码存在漏洞。与此同时,国内外区块链行业专家也正在尝试全新的解决方案。上官皖儿认为,区块链技术作为一种特定的数据库技术,将与大数据、风控技术实现优势互补,进而构建全新的数据组织方式。
【“区块链+大数据”,邂逅的期待】❣上官皖儿
网友评论