最近听 《科技参考》卓老板聊基因检测的事,感觉很有意思,摘录如下:
有同学问:前阵子体检,送了一个南方基因检测。报告出来后,看着挺“吓人”的,各种癌症的风险。特别想听听卓老板的看法,这种报告的参考价值有多大?
这个问题我要仔细说说。
先简单回答:这类商业基因检测,绝大部分情况下和街边摆摊算卦给出的未来10年运势的预测差不多。所以就算看着吓人,也完全不用担心。
下面具体说说。
今天做基因检测的公司很多,比如23魔方、Wegene、各色DNA,还有这位同学测的那种。
它们收集到人的唾液后,从中提取DNA,但并不会测全部30亿的碱基对的数据。因为那样做太慢、太贵,一个人支付五六百块钱是远远不够的。而且很多时候都是促销打折,只花299元、399元就能买到,就更不可能做全基因组序列的测序了。
那这种会测多少对的碱基呢?有的测二三十万对,有的测七八十万对。咱们折个中,按六十万对算,所以相当于测序了全基因组的1/5000。
什么碱基对才能放入这1/10000呢?只有SNP基因才可以。
SNP叫作单核苷酸多态性。DNA中,SNP位点一共5300多万个。SNP位点的意思是,1个核苷酸的不同就会导致DNA多样性的变化。比如,两段基因——AAGCCTA和AAGCTTA,只有倒数第三个核苷酸从C变成T了,其他都一样。于是就产生出一个DNA多样性。
注意,我这里说的是DNA的多样性,并不是生物性状的多样性。也就是说,尽管这一点变了,但很可能生物体并没有产生任何可观测到的性状差异。
5300多万个在DNA上可能的差异点,究竟哪些点是只需要变一个,就能明显观察到生物性状差异的呢?其实非常非常少。
但也不是没有,比如说,镰刀性贫血症就是其中之一。它是由第11号染色体HBB基因的第17个碱基,由腺嘌呤(A)突变成胸腺嘧啶(T)导致的。观察到的差异是,在身体缺氧时红血球会变成镰刀型。
5300多万个SNP位点,能只测一个就发现问题的实在没有多少。几乎全部的SNP位点,都是统计学意义上多个组合在一起才和某个性状有相关关系。比如,二百多个SNP位点形成一个大集合,与肝癌的发病率有一些统计相关;还有另外100多个SNP位点形成的集合,和直肠癌的发病率有一些统计相关。
在花钱做基因测序的时候,具体一个性状,比如身高、身材胖瘦或者某一种癌症,和多少个SNP位点有统计学上的相关性呢?各种研究都是不一样的。那就要看那个基因测试的公司采信了哪些研究。
哪怕是采信了某一个研究,比如说,和肝癌有关的SNP位点有200个,测试报告也不会把这200个位点都测出来然后给你下判断。而是只会取可能其中前四五个,或者前十四五个,不然需要测的内容太多了,成本上也不划算。也因为很多论文得到的相关性结论,其实也没有那么高度相关,所以只取相关性最强的几个就可以了。
那个SNP位点,也许在某一个研究中确实比平均值会高80%的患癌率,就算这是板上钉钉的事,肝癌发生率可能也只是从十万分之24提升到十万分之43而已。更何况,它根本就不是板上钉钉的事。在有些研究中,可能压根就不认为这些位点和肝癌发病率有关。
其实,当你看过上百人的检测报告里和健康风险相关的那部分后,就会发现,每个人测完了大致都是这样的。
比如,100多种疾病风险提示里,有一半以上都检测到了变异的位点,患病风险高于平均值的可能100项里有20多项。这些病听着都挺邪乎的,比如克罗恩病、口腔癌、癫痫、肾病、黄斑变性、脑动脉瘤、高血压、溃疡性结肠炎、主动脉夹层动脉瘤、散发性心房颤动、静脉血管栓塞、红斑狼疮等等,比普通人患病的风险倍数从几倍到十几倍不等。
谁拿到这么一份健康报告的警示,都会有点上头的,就这种程度了,还不赶紧抢救等什么呢?这就是对基因研究滥用的结果。
但我们注意,基因检测的报告内容其实不止这些,除了健康风险外,还有祖源分析和生理心理特质分析。
其实,健康风险这部分内容已经是基因检测报告里可靠度最高的了,祖源分析和生理心理特质分析的可靠度还远远比不上健康风险的分析。
原因是这样:
6万多年前,人类走出非洲后散布到各地。越往东走越分散,越分散,基因的分叉越多,考古证据的分布也越大。今天研究人类祖先走出非洲的科学家主力,还是欧洲和美国的科学家。他们也是首先对欧洲和非洲的早期历史研究得比较透彻,然后一路向东,研究到中亚,就已经是一笔乱账了。等到了最东的位置,所谓的北方汉族、南方汉族、东部汉族、岭南汉族、西北汉族、苗族、壮族、土家族等等的民族血统的划分,其实就有非常大的想象空间了。
比如,测试的直接结果是rs17822931这个位点,这个结果是TT,这个假不了。但TT,真的就对应你脑子中“东亚人”这个词吗?你知道十多年前定义这个词的复旦大学的金立教授在分析东亚祖源的过程中是怎么定义“东亚人”的吗?于是推而广之,刚刚那些人种和民族描述通通都蒙上了一层雾,对普通人来说。
比祖源分析更不靠谱的就是性格和生理特点的分析。
报告里说得准的那些,比如血型、乳糖耐不耐受、酒量大小、有没有狐臭、耳垢是干的还是湿的,这些不用测你也早就知道了;而其他的项目,比如什么抗压性、记忆力、敏感度、好奇心,大致和算命的可靠度是差不多的。
所以综合下来600块钱,如果做一次针对性的体检,中老年人哪怕只查查无痛的胃肠镜、拍拍胸部和腹部的B超,其实都比做基因检测划算、可靠得多。
当然,如果结论就到这里,其实基因检测公司还有的说。那就是,别看我们现在不准,但是结果保留在我们这里呢,今后有可能更准的。因为生物技术在进步,那些说不清的项目今后可靠度会大幅提升的。
其实也不是这样的。刚刚我说了,5300万个SNP位点,基因检测公司只测了其中百分之一,或者还不到。因为测试的数据量实在太少了,所以即便今后生物技术提高,解读能力也提升了,也需要测另外99%的SNP位点里的数据,结合在一起,才可能给出更可靠的答案。但你当初就没测过那些,所以即便生物技术之后大幅提高了,也享受不到这部分福利,你还得重新再测。
那你说,我多花点钱测一个全基因组的不就可以了吗?这样今后技术提高了,因为我数据是完整的,所以解读也能跟着进步。
这种现在也有,坑钱就坑得更多了,好像是两三千块钱就能做一次。但你只要仔细看看就会发现,那个测试后面可能用小字标注了“1 depth”。这是测序中的一个重要参数,可以简单理解成测的次数。一般来说,人类全基因组测序要求最低是30次,最好能达到60次,到了这个深度后,测序结果才是可靠的。如果只测1次,那相当于一次完全不合格的测试。但你要是真测30次,还要盈利的话,收费可能就要2万人民币起。
所以,当前任何商业检测的基因测序都没有什么意义,有的时候图个乐都不一定能图的到。因为基因数据的泄露可能还会坑到你。
怎么说?这些公司今天还在,但20年后大概率是不在了,那你的基因数据去哪了呢?你说可能是丢了,或者被人盗走、盗卖了,又能怎么样呢?
我给你举个例子:你的测试结果里,疾病的某些风险假如和今后基因技术进展后正好对应上了某种基因病,然后这份数据又因为公司倒闭、不知怎么被滥用或盗用,最后流传到了保险公司那里,那么,你的名字可能就会被特地标红,于是你可能怎么也买不了寿险。
网友评论