世界上最长寿的人能活多久?吉尼斯世界记录是121岁。
这一概率可能是亿万分之一,但在中国,有一个年轻的团队——HGBC基因链,计划让1亿人活到121岁,并能真正掌握自己的基因密码。听起来有点天方夜谭,然而在基因测序技术快速发展的当下,人体生命的奥秘正加速打开已是不争的事实。
近几年,基因测序成本的急剧下降,已经带动了消费级基因检测市场的火爆,但要真正破译人类长寿的基因密码,仍面临着一系列的难题亟待攻破。短期内,最为迫切的问题在于基因数据归属权不明、基因检测应用服务单一和生命科学研究基因数据难获取等,已经严重阻碍了行业健康发展。
HGBC基因链准备如何解决这一系列难题呢?本期互链脉搏采访了其联合创始人林晶。
(HGBC基因链联合创始人林晶)基因组数据上链 让用户掌控自己的基因数据
HGBC基因链筹备于2017年,2018年年初正式对外。创始团队成员由遗传学、生物学、计算机、生物信息以及区块链背景的资深人士组成,HGBC基因链创始人郝向稳更是拥有15年基因行业工作经验,曾在华大基因、怡美通德、Illumina等业内机构任职。
目前,HGBC基因链已经积累了包括采样、测序、数据处理与分析、基因突变解读、检测报告呈现全流程的经验和技术,并能提供包括肿瘤在内的170多项疾病风险评估,4000+项遗传病筛查,12大类120多种药物解读,80多种个体特质检测。
在基因检测行业,基因数据虽然来自于每个用户,但个人却很难从企业手中获取到自己的数据,绝大多数基因检测公司都会在用户协议中标明“用户数据产生的商业价值及科研成果与用户无关“。这意味着,用户基因数据的名义所有权与实质支配权是相分离的,用户无法享受到自己数据所带来的收益。
“HGBC基因链所做的事情就是帮用户将自己的基因组数据上链确权与流转,让每个人切实掌控自己的基因数据。“林晶表示,HGBC基因链使用非对称加密技术对用户的基因数据进行加密,并将加密后的数据使用迅雷的玩客云存储服务进行分布式存储,只有用户使用自己的私钥才能解密还原数据,实现了用户对自己数据的所有权和控制权的掌控。
那么,用户在掌握自己的基因数据后,如何实现其价值呢?林晶认为主要体现在两方面:
其一,由HGBC和第三方基于用户的基因和其它健康数据提供各种应用服务,比如遗传病筛查与咨询、疾病风险评估、健康管理、运动健身、营养饮食等多方面;其二,同一些生物制药、疾病科研组织等项目方进行链接。用户参与研究项目,将自己的数据授权给研究者,获得Token收益,同时,研究产出的成果,用户也可以优先享受。
在这个过程中,HGBC Token的生态闭环建设起着至关重要的作用。
根据其白皮书介绍,HGBC的Token总量为30亿,其中40%(12亿)用于数据挖矿,共分10年逐步释放完毕,每年衰减30%。而其基因组测序则分成了不同的阶段,包括百人基因组计划、千人基因组计划、万人基因组计划以及百万人基因组计划。
“用户购买测序服务后能获得Token奖励,‘千人计划’用户获得3万 Token,‘万人计划’获得6千 Token。并且,用户还可获得150的算力,使用这些算力可以在达尔文星球APP中进行数据挖矿。“林晶表示,用户获得Token后,可兑换基因应用服务,比如运动健身相关服务、疾病风险服务、遗传筛查服务等。
除此以外,用户通过参加科学研究项目也可以获得Token,服务方本身和科研项目方是可以互换身份的,服务方也可能是项目方,使用Token可获取用户的基因数据。
在林晶看来,基于Token激励,HGBC基因链能够打通用户、服务方与项目方的生态闭环。
(HGBC生态布局)“比如在应用服务端,不同的基因检测公司应用服务侧重点不同,有娱乐、疾病健康、生活服务等不同方向,用户很难在一家公司享受到全面的检测服务;而项目方方面,目前研究机构普遍面临的问题是样本数据获取难度大,可供研究的样本量少,数据维度单一,表型数据不规范不完善,并且用户不能够直接从数据中受益,进而导致用户的参与度低,项目研发阻力大,效率低。”林晶指出,只有建立以用户为中心的生态平台,才能真正解决基因检测应用服务单一和生命科学研究基因数据难获取的难题。
选择合适的底层公链至关重要
值得注意的是,HGBC的生态平台设想看似完美,但其在搭建过程中,并非一帆风顺,其中选择合适的公链和用户隐私保护是其面临的两大挑战。
“一个人的全基因组数据有近200G,这么庞大的数据如何存储和上链,这是最开始我们遇到最大的困难。”林晶表示,区块链的存储成本是非常高的,比如以太坊,只能以Key-Value的形式存储很少量的数据,这么大的数据量以太坊、EOS等主链都是无法直接上链存储的。
林晶坦言,经过比较长时间的调研,我们综合对比了当前主流的所有基础公链,最终选择了迅雷链。“迅雷链和基于玩客云的迅雷文件系统相结合,能够很好的解决大数据量上链存储的问题,我们将基因数据存储到迅雷链的文件系统,数据的流转信息在迅雷链上记录,存储和业务能够很好的在链上进行。”
除此以外,个人基因数据上链后的隐私保护也是HGBC选择迅雷链的重要因素。
“迅雷链的TRC2-1标准是目前行业中第一个带有授权的唯一性资产标准,这在极大程度上解决了用户基因数据上链后的隐私性与安全性问题。”林晶指出,在迅雷链上,用户的基因数据会存储于云存储服务中,获得唯一的下载地址和数据指纹,数据指纹和用户区块链地址将写入到区块链中(加密后的下载地址),而用户的基因数据在HGBC生态平台中会成为数字资产,只有被用户授权之后,其基因数据才能够被使用。
除迅雷链的数据加密保护和授权机制外,HGBC生态链还增加了伪匿名隐私保护和单向匿名机制。“用户在HGBC生态中的所有行为都以昵称为用户标识进行操作,进而将用户的真实身份与生态中的链上身份进行了有效隔离,而HGBC生态中,测序商、项目方、服务提供方的身份是经过基金会认证审核通过的,对用户是完全透明的,并且所有交易信息都会被永久的存储在区块链中。“林晶表示。
作者| 互链脉搏专栏作家 · 梁山花荣
公号:HiveEcon,更多精彩文章在www.blockob.com
网友评论