5月15日的一则新闻集中了众多引人关注的各种元素——明星、乳房、绝症以及科技前沿带来的医疗新选择。
安吉丽娜·茱莉(Angelina Jolie)发表公开信,将自己预防性地切除了双侧乳腺的经历公诸于世,因为她体内深埋着一种“有缺陷的” BRCA1抑癌基因。根据这个基因突变,专家评估她在一生中罹患乳腺癌和卵巢癌的风险大概是87%和50%。而正是卵巢癌让茱莉的母亲在56岁时离世,比美国人均预期寿命足足少了20年。
茱莉选择公开隐私的原因是“希望其他女性能从我的经历中受益”,她说,“现在,你可以通过一个血检来获知自己是否是乳腺癌和卵巢癌的易感人群,进而采取行动。……对于看到这篇文章的女性,我希望它有助于你明白自己拥有各种选择。”
茱莉的选择是理智的,无奈,在人类基因组草图解密十周年之际,显而易见的现实是,并非每个人都负担得起这种选择。不考虑高昂的手术费,单单在美国抽血检测BRCA1/2基因突变,就需要向手握专利的万基遗传公司(Myriad Genetics,又译麦利亚德基因)支付3000美元。三千诚可贵,欧洲价更高。而国内目前同类检测的价位在数千人民币,另外,医疗保险不替这种检查买单。
茱莉的公开信发表后,万基遗传公司的股票涨到了年度高点,这门年坐收四亿美元的生意有再上层楼。
“人类基因组属于全人类,而非属于某些国家。”——詹姆斯·沃森 1962年诺贝尔医学和生理学奖获得者
计算生物学家史蒂芬·萨尔兹堡(Steven Salzberg)四月份在福布斯网站撰文《万基遗传CEO说,你的基因他做主》,文中表示,在4000美元几乎可以把一个人的全部两万多个基因测一遍序的年代,同样价格只测两个基因完全是“不合理的高价”以及“展示贪婪”。
居高不下的价格源自垄断。早在1998年,万基遗传一拿到BRCA1/2的专利,就迫不及待地给其他正在研究这两个基因的营利和非营利机构发去了禁止通知函——“未经许可,勿视勿研”。“独霸”这两个基因的另一个好处是,万基遗传建立起了一个庞大的不对外公开的数据库。基因专利2015年到期,此后,数据库或许会成为万基遗传的另一棵摇钱树。
然而这样真的公平吗?我们不花钱,居然无权解读攸关自身性命的遗传信息?发现罗塞塔石碑的法军上尉,可以禁止商博良解读古埃及文字吗?第一个发现海王星的人,可以禁止他人仰望那颗星星划过的天空吗?
2009年,美国公民自由联盟(ACLU), 美国公共专利基金会(PUBPAT)、一些研究者协会以及数位乳癌患者共同将万基遗传推上了被告席,理由是基因及变异是自然存在,本就不该被授予专利。2010年,纽约南区地方法院废除了BRCA1/2基因这两项专利,随后美国联邦上诉法庭又推翻了纽约南区地方法院的判决,接着美国最高法院发回重审,上诉法庭坚持原判……最新进展是,案子终于又一次到了最高法院,在多轮聆讯后,最高法院6月给出了投票结果—— 9-0,一面倒地取消了BRCA1/2 的专利权——“Myriad并未创造或改变BRCA1/2基因所编码的任何信息。那些基因的顺序和位置早已存在,远在Myriad发现之前”。(不过cDNA作为人类的非自然产物仍然可以申请专利。)立刻就有个Gene By Gene公司推出$995的BRCA1/2 测序服务,价格降到了三成。
这个案子只是基因专利的冰山一角,疯狂的“基因圈地时代”给你体内的大约两千多条基因打上了四万多个专属烙印。后遗症是,如果你想测一次自己是否携带任何已知的遗传病突变,光付给各位专利持有者的“过路费”可能得花上四千六百万美元,简直是明火执仗。
事实上,如果不是人类基因组计划的参与者们在1996年通过并坚持的“全球共有,国际合作,即时公布,免费共享”的百慕大原则,进行遗传学研究需要缴纳的买路钱会是更为高昂的天文数字。
与被垄断的乳腺癌相比,另一种遗传病则成了“开源”的例子。
囊性纤维化是种常染色体隐性疾病,患者大多因肺功能恶化而早夭。高加索人中,缺陷基因的携带率达到了4%,这意味着两个缺陷基因携带者相遇的几率是1.6‰,而患儿出生的几率则是0.4‰。
上世纪八十年代,利用各种遗传学手段,相关基因被定位到了7号染色体上。多伦多病童医院(HSC)的研究者发现了首个致病突变,源自一个蛋白质缺失了第508位的苯丙氨酸。1989年,密西根大学的一个研究小组耗资5000万美元,首次克隆出了编码该蛋白的囊性纤维跨膜通道调节因子基因(CFTR)。
这些发现在医疗上的应用价值不言而喻,两个研究组一起讨论了专利申请问题,考虑到排他性专利可能妨碍到其他研究者对潜在致病突变的研究,他们最终决定不但把基因数据向全世界的研究者共享,而且选择申请一种非排他性的专利。
如今,从哈佛大学到梅奥诊所,许多机构都能为客户检测是否携带最常见的几十种CFTR基因突变,橱柜遗传公司(Ambry Genetics)甚至提供只确认508苯丙氨酸是否缺失的服务,费用低于一百美元,不到万基遗传BRCA突变检测费用的三十分之一。
密西根研究小组的成员之一,绰号“基因猎手”的弗朗西斯·科林斯在回忆这段历史时,很遗憾当时“未能说服同事放弃更多的专利权”。
这项研究发表四年后,科林斯受命接替双螺旋的发现者沃森,开始主持预算逾30亿美元的人类基因组计划。
“不要制定微小的计划,它们缺失那种让人热血沸腾的魔力,因而可能不会实现。制定宏伟的计划;心存高远,脚踏实地,满怀希望。”——丹尼尔·伯纳姆 城市规划建筑师
这个野心勃勃的项目始于美国能源部1985年的圣克鲁滋会议。1990年10月1日,美国能源部与国家科学研究委员会共同宣布,人类基因组计划正式启动。2003年,科林斯作为项目首席科学家宣布人类基因组序列图绘完。来自美国、中国、英国、德国、法国和日本的16家机构共同攻下了这个“生物的圣杯”,而人类基因组计划也与阿波罗登月计划、曼哈顿原子弹计划一起,并称为自然科学史上的三大计划。
基因组计划实施前,因其“劳民伤财”受到了不少质疑。毕竟光一个囊性纤维化基因就花了五千万美元,而当时的猜测是人类拥有三十万个基因。再者,既然基因组中绝大部分是不翻译成蛋白质的“垃圾DNA”,为信息付费也就罢了,花大钱去翻垃圾,这不是傻了吗?
整个项目最终陆续投入30亿美元,真正用于人类基因组测序的大概占3亿,如果按照人染色体单倍体的30亿碱基对来平均,一个碱基对的最终成本是10美分。其他资金则用在了模式生物如酵母,线虫,果蝇和小鼠的测序,推动测序技术和算法的发展,还有一大块用于探索基因组研究所带来的伦理、法律和社会影响 (ELSI),比如,与生俱来的、会把人几乎毫无疑义地引向某种疾病的基因缺陷,是否符合医疗保险不予赔付的“预先存在的条件”;又比如,该如何防患于未然,解决隐私与歧视问题。
项目最终成果斐然,颠覆研究界“三观”的发现不在少数,例如人类基因仅有两万多个——真不算多,连单细胞酵母都有将近六千个基因,水稻的基因数则是我们的两倍。一条基因可以编码不止一种蛋白质。“DNA-RNA-蛋白质”的中心法则不再是唯一的道路,部分RNA自己就是最终的功能分子。而垃圾DNA也变废为宝,展现出了重要的调控功能。另外,我们和动物的DNA序列常常只相差微不足道的几个百分点。而从前许多被归为一类的疾病——如癌症、糖尿病、精神疾病、心血管病等,其实可以按照基因变化而分出显著的差异。新的全基因组关联研究(GWAS)已经用来搜寻这类疾病的相关因素和突变。对症下药正在被“对基因下药”取代。疾病干预更加有的放矢。类似囊性纤维化这种单基因遗传病的发现与诊断也有了长足的发展。在发现超过3000种孟德尔单基因遗传病的基因后,产前筛查有了长足了发展。
药物开发也从项目中受益匪浅,针对特定药物靶点的药物近几年开始进入市场,治疗白血病的格列卫,抗乳腺癌的赫赛汀,治疗直肠癌的阿瓦斯汀,抑制表皮生长因子受体蛋白(EGFR)的易瑞沙。基因组数据还可以辅助用药决策。都说“是药三分毒”,用药剂量往往需要非常小心,目前多用年龄和体重来粗略估计,有些药物因为有效剂量和安全阈值太过接近而不能进入市场。未来,从基因数据就可以判断这人对药物的敏感程度,“让一小部分人先用起来”。
在人类基因组项目这棵大树上结出的新学科之果不计其数,纯基因组学就有三大分支——搞测序的结构基因组学,搞演化的比较基因组学,以及研究功用的功能基因组学。测序数据大量产生,推动了生物信息学和计算生物学。动植物和微生物的测序数据,更是令农科、畜牧科、兽医学、与环境科学一日千里。从最早测序完成的果蝇、小鼠和黑猩猩,不久后几乎所有主要的陪伴人类的禽兽都被测了一番,包括牛,猪,狗,马,猫,鸡,然后各国开始测各种奇怪的萌物,例如羊驼、大熊猫,袋鼠、乃至十三纹松鼠如今都是都有序可查,全基因组更是进入组装阶段。博物学家也没闲着,他们早就开始根据演化上的亲缘开始给许多物种重新“分家”。
而测序技术进步更是显著。奥巴马的科技顾问,生物学家埃里克·兰德(EricLander)在《自然》撰文写道: “在过去的10年中, 对每一个碱基的DNA测序成本急剧下降了10万倍。 步伐远超半导体产业中技术进步的摩尔定律。 最新一代的测序仪每周可读2500亿个碱基,而1990年只能读25,000个碱基, 2000年也只能读大约5百万个碱基”。也就是说,以1990年的测序速度,读一遍人类基因组需要2300年,以2000年的速度读一遍要12周,至于现在的速度,是两个小时。
鉴于测序技术的进展,如今的人畜传染病爆发后,大部分时间是在分离病原体,一旦分离出来,后面的测序一天之内就可以出结果,最近爆发的新型禽流感就是一例。测序后,通过病毒的遗传特征,可以预测哪些治疗手段可能有用,哪些可能已经产生抗性,更可以立刻开始针对性地生产疫苗。
由于应用的前景太过广阔,人类基因组项目实施过程中,“看不见的市场之手”始终在周围徘徊。其中最引人注目的一场“基因争夺战”,则最终奠定了今日的大局。
1998年,一直在坚持精确度更高但也更缓慢的“链中止法”的人类基因组计划感到了莫大的压力,生物鬼才文特尔(Craig Venter)宣布自己的塞莱拉基因组公司将以“鸟枪法”参与人类基因组的测序之战,以一己之力挑战几个大国。
单就技术而言,文特尔的鸟枪法可谓完胜,如今,几乎所有测序用的都是这种方法。后来,文特尔甚至一口气打算申请6500个人类基因的专利——接近全部人类基因的三分之一,倘若这批专利获准,近十年间的基因组研究,想必是“车到山前必有收费站”的景象。
连当时的美国总统克林顿都参与了调停,再加上基因组数据公开的确是人心所向,文特尔最终放弃了那些基因专利要求——虽然不幸饮恨败北,但也只能说是非战之罪,这位奇才在几年后携“人造生命”又出了一把风头,随后就投身于基因组应用的另一个方向——生物能源。别忘了,人类基因组计划最早的发起方可是美国能源部。现在,文特尔正在大洋上游弋,努力收集各种藻类,希望能改造出可生产“完美石油”的微藻品系。
“囊性纤维化病为科学所作的贡献要远远超过科学对囊性纤维化病做出的贡献。”——杰克·赖尔登 生物学家 找到囊性纤维化致病突变的研究组成员
基因组时代已经来临吗?或许,但就像生物界喜欢自嘲的“21世纪确实是生命科学的世纪——只不过是下半叶”。英文中所用的“era”,在地质学上指的可是动辄数千万年以上的时光。我们赶上了伟大时代的开端,但是翘首期盼“医学大革命”的人别忘了,从基础研究到应用变革之间,还隔着巨大的鸿沟。
2000年,科林斯在《自然》上表示“根据基因设计的糖尿病、高血压、精神病药物将被引入市场”,十几年后,这句话仍然可以一字不易地引用。另一个例子是,三十年前我们在展望“基因疗法”,二十年前我们在展望“基因疗法”,十年前我们在展望“基因疗法”,如今许多东西改变了,但不变的一点是,我们依然在展望“基因疗法”。
研究界有个经典笑话——理论是你无所不知但无一行得通; 实践是全都行得通但没人知道为什么; 我们实验室是理论和实践的完美结合:无一行得通,且没人知道为什么。基因疗法的处境比“理论和实践的完美结合”要强一点儿,经常行不通,有时我们知道为什么。
基因治疗的基本流程,是将正常基因插进人体细胞的染色体内,繁殖培养到一定数量,再“种回”患者体内。不过,人体细胞并不乐意接纳外来基因,研究者不得不用上人类的天敌“逆转录病毒”,而这又引入了额外的风险,有时候改造后应该无害的病毒又突变成有害了,或者基因插入的位置不对,体细胞变成癌了。即使成功地培养出了正常细胞,要过患者自身免疫系统那关也还是困难重重。囊性纤维病最初的基因疗法就因为肺脏的免疫防线太过强大,而导致外源基因攻城失败。1999年,患有遗传学肝病的18岁少年杰西·基辛格(Jesse Gelsinger)死于基因病毒载体引起的强烈免疫反应,这个悲剧更是直接让美国的基因疗法研究一蹶不振,很长时间没有恢复元气。
基因治疗里的潜在风险,许多在干细胞治疗中也同样存在。不管是强烈免疫反应还是细胞癌化,一旦发生,患者就可能要付出巨大的代价,因此衡量风险与收益后,目前基因治疗或干细胞治疗的临床实验主要是针对严重威胁健康的疾病,而且二者都还仍然面临着技术、商业、伦理和监管上的种种困难。而如今许多打着“基因”或“干细胞”旗号的美容或保健服务,其实只是借用这些前沿名号招摇撞骗而已。
目前基因治疗领域最好的进展之一是在肾上腺白质营养不良症(ALD),利用一种改造后的HIV病毒导入外源基因后,这种致命的神经退行性疾病已经可以遏制病情恶化。此外,对于利伯氏先天性黑内障,基因疗法已经可以帮助生成视网膜蛋白从而改善了患者视力。苏格兰正在进行皮肤癌的基因治疗实验。而那些需要骨髓移植的疾病如白血病和地中海贫血无疑也富有希望,一旦可以利用自身“修复好的细胞”来起作用,供体缺乏和免疫排斥问题都会好办得多。
天书解密十年后,淹没在海量数据中的研究者们发现当初的估计确实太过乐观,用伦敦大学史蒂夫·琼斯(Steve Johns)教授的话说:只了解蛋白质的编码基因是“从生命字典里只学到了名词“,而“动词、副词、 形容词、代词及其他词要复杂得多。更糟糕的是,基因组语言含混、口吃、压延发音,还时不时说些全然的无稽之谈。”
为了研究这些“名词、动词、副词、 形容词、代词及其他词”,更有针对性的基因组项目一个个浮出水面。先说说专门寻找基因组功能因子的DNA因子百科全书计划(ENCODE),目前发现了两万多条蛋白质基因,1.9万个“假基因”,近两万的功能性RNA,以及4百万个基因“开关”。此外,癌症基因组图谱收集了两万名肿瘤患者的血液和肿瘤组织基因组。国际人类单体型图计划只花了三年多就建起了一份人类常见遗传多态性位点目录,法医与亲子鉴定都是基于这些位点。表观基因组学路线图计划研究那些“后天对我们基因的影响”,例如DNA甲基化机制,染色体修饰机制等。千人基因组计划顾名思义,就是要收集许多人的测序结果,以此分析人群里常见的变异位点。人体微生物计划则关注那些住在我们身上的小生命,它们的状态与我们的健康同样息息相关。还有很多极具经济价值的微生物,有的能让木头变成葡萄糖,有的能控制土壤与水污染,有的能生产高附加值的生物制剂……美国为之启动了微生物基因组计划,我国四年前也推出了“万种微生物基因组计划”。
随着投入越来越多,质疑声也开始逐渐浮出。对人类基因组计划最严苛的批评之一,来自瑞士苏黎世联邦理工学院的研究团队,他们称人类基因组可能是个“社会泡沫”。 不过,金融泡沫破灭的时候留下的都是坏账,人类基因组即使“破灭”,已经可以确定会留下许多成就:让基因信息即时、全面地向全世界共享;首次建立严格的标准生物数据库;奠定了研究复杂生物体的方法;促进了高通量检测仪器发展;推动了数学、物理、计算机科学与生物的学科交叉;颠覆了我们对生物演化的认知;以及革命性地改变了医学诊断、亚型分类乃至医疗干预的方式。而今年,美国总统奥巴马更在国情咨文中引用巴特尔(Battelle)研究中心的《人类基因组计划的经济影响》报告里的数据称,在人类基因组计划中每投入1美元,就会给美国经济带来140美元的回报。
在同一份报告里这样写,投入110亿美元的超导超级对撞机估计大概能用30年,投资15亿美元的哈勃太空望远镜预期能用15-20年,而人类基因组序列则不会磨损或过时。相反,人类基因组更像是化学元素周期表,永不损耗,永不过时,将一直是推进科学认知的基础。
“和巴赫的音乐,莎士比亚的十四行诗和阿波罗登月计划一样,人类基因组计划是那些能使我感受到身为人类而自豪的人类精神的众多伟大成就之一。”——理查德.道金斯
茱莉切除双侧乳腺后,下一步会是切除卵巢,是否基因信息已经可以指导重大的医学决策?这种成功可以复制和推广吗?
这种决策归根结底是成本与收益的衡量。首先,必须是像BRCA1这样单个突变就可以明确大幅提升一个人患癌几率的突变,其次,就茱莉来说,她已经生育了后代,放弃乳腺和卵巢的代价相对变低了。茱莉固然“没白切”,但有意效仿者务必要根据自己的详情来决定。特别是许多检查和治疗会带来实质伤害——手术风险自不必提,要不要增X光筛查的次数,也值得仔细权衡。
虽然“23与我”(23andMe)等商业公司已经卖了好几年“仅供娱乐”的个人遗传标记报告。短期内,基因组的绝大部分数据还难以变成“生活建议”,所谓的 “基因咨询”行业其实鱼龙混杂,许多报告书往往最后给出的建议要么是老调重弹的普适派健康建议,要么模棱两可到令读者猜疑不安,要么是拿到时已经是“过时的信息”——比如告诉一位已经聪明绝顶者你有脱发风险。 说到底,突变“知其然”容易,“知其所以然”就难了。如今测序人人都做得到,分析序列的算法才是难点。目前的“新算法”远非完美,有时还比不过“老技巧”——虽然已知遗传因素对身高影响占到80%以上,2008年的一项大型研究筛查了三万多人的四十多个已知的身高遗传位点,却发现全部位点加起来对身高也只有5%的影响,要根据这些位点来预测个体的身高,还不如根据父母的身高来预测。另一个仍然有着巨大的优势的老方法是调查家族病史。2010年,一个跟踪了19313名心脏病十二年的大型研究最终结论是,比起靠已知的101个变异来预测疾病风险,研究调查家族病史这个老办法更好。
另外,目前广泛应用来解读天书的全基因组关联研究法虽然硕果累累,但还不足以成为解谜的“万能钥匙”。研究人员认可全基因组关联研究法是因为一个预设的假说,许多常见的疾病是缘于某种常见的突变,因此,用预先放在芯片上的常见突变“探针”,在患有这些疾病的人群的基因组里进行比对,频繁出现的就可能和那个疾病有关。然而,有关不一定代表“它就是真凶”。曾有个FTO基因变体被认为与II型糖尿病密切相关,亚洲人里这个变体的比例是14%,欧美人里的比例则高达53%,然而引入体重指数BMI分析后却发现,FTO基因变体真正增加的是——人的胃口,胃口太好则肥胖风险升高,肥胖了于是II型糖尿病风险增加,也就是说,对于拥有FTO变体的人,只要能“管住嘴,迈开腿”,保持体型,那么“糖尿病风险”是不会增加的。
再者,全基因组关联研究法的缺陷还包括,只能发现基因是否变异,无法发现基因的拷贝数有无变异。而这种基因拷贝数差异,可能是许多精神遗传疾病如自闭症的原因。另外,它只能探测最常见的突变,杜克大学的一个研究就发现,许多看上去一样的病,其实背后是各种不同的罕见突变分别引起,这种情况下,唯有一一测序,才能把罕见和常见突变一网打尽。
离基因组计划所期盼的梦想照进现实,还有漫长的距离。许多人把基因组图谱比作地图,似乎有地图在手,我们就可以随时抵达我们想去的地方。然而,我却觉得不如将我们的基因组比作一个养成游戏,每个人手上都有一套,但是拷贝游戏时由于硬件本身的限制,游戏总会有那么一点小变化,我们身体里的每个细胞,拿到游戏后玩的方式都不一样。如今,我们已经可以利用工具把游戏化为基本组成——二进制的一长串0与1。但是我们真正想拿到的,其实是为每个人量身打造的“游戏攻略”。
问题是,我们对于这套游戏编程的方法还在猜测阶段,而每一个改动,都可能影响游戏后面的流程。有时候我们拿掉一小段代码,游戏就不能启动。有时我们想把正确的代码放回去,却发现游戏变成了电脑病毒……基因之间的互相调控,基因一加一大于二的“上位性效应”,后天的各种表观修饰,以及一个基因在不同发育阶段,不同环境压力里的“时好时坏”……我们知道得越来越多,也一天天发现,最终的攻略必然会比我们曾预想的复杂得多。又因为每一套“游戏”都弥足珍贵,每一个修改也就更加重逾千斤。如果我们早早找到了引发“肌萎缩侧索硬化症”的所有遗传因素,产前筛查会不会让史上最杰出的大脑之一,斯蒂芬·霍金因此失去了出生的机会?一个生命所能放出的光芒,可以被潜在的疾病直接限定吗?
罗伊·阿玛拉( Roy Amara)曾提出一个科技发展的阿玛拉定律,“我们常会过高估计新技术可能造成的短期影响,也常会忽视新技术可能带来的长期效益。”互联网就是一个非常典型的例子,从1965年开始出现雏形,然后是30年的缓慢积累,个人电脑普及后,才迎来20年的井喷。而人类基因组研究如今不过才走了20年,现在就对它“失望”可能为时尚早。信号通路固然错综复杂,但许多前所未有的如一些针对RNA的新药已经进入了临床试验阶段。而复杂性对于我们这群天然拥有好奇心的裸猿来说,或许只是迈入新纪元前的又一个小小挑战而已。
对于个人来说,现在开始了解自己的风险因素,和医生讨论适合自己的健康管理办法或许是个保守但不坏的选择。尽管还没给自己测序,但家族病史已经让我成了乳腺癌和直肠癌的高风险人群,于是我不抽烟,节制饮酒,努力运动,虽然天生无肉不欢,但食谱里绿意盎然,生育孩子或者冷冻卵子的选择也得排上日程,免得需要“挥泪斩卵巢”时代价过高。
人类基因组是个基础平台。有一天,这个平台提供的信息会帮助实现真正的“个体化医疗”,帮助决定一个人是否易感某些疾病,如何预防,怎样治疗,安全又有效的用药剂量是多少。许多人都在期待“订做完美宝宝”、“攻略在手,长生我有”的一日。诚然,有些信息,可以带给你更多的选项。有些选项,可以让你获得更有质量的生命。但说到底,即使是基因一模一样的同卵双胞胎,不同的后天环境与抉择,也会拥有完全不同的生命。人人都是向死而生。比起基因天注定,或许更重要的是,你从此刻起,选择成为怎样的人。
网友评论