去医院看病,做个血液检测,真是再平常不过的事情。但对求医问药的谱系儿童家长们。这个检测单的长度,常常会令他们的钱包显得微不足道。
然鹅做完这些动辄几千元,轻松过万元,项目琳琅满目的检测,处方却好像是一台复印机开出来的。椰菜君深切建议,不若跟潮流搞个大数据云计算人工智能,当着家长的面,把检测结果输进去,满屏幕各种字符跳动一番,最好配个走马灯炫灯,然后才打印处方出来,那就浑身上下都散发着高科技气息了。但若是真心为家长着想,倒是把处方随检测单一起打印出来最妙。不仅免了家长拿着检测单跑上跑下的麻烦,也省了医生费口费舌解释的时间。流水线效能必定大增。
讲正事之前,先看一项虚拟研究。
一位科学家想分析裤子尺码和糖尿病患病几率的关系。他的算盘是,如果裤子尺码和糖尿病相关,那就可以调整裤子尺码,不打针不吃药,逆转糖尿病,他日或可斩获诺贝尔医学奖。
于是他根据医院就诊记录,募集了30位糖尿病患者作为研究组;为保证实验严谨,他又找了30位健康人士,作为参照组。
测量了两组参与者的裤子尺码后,他兴奋地发现:研究组中,有22位的 裤子尺码是大号和大号以上,有5位是中号,有3位是小号;而参照组中呢,有3位是大号和大号以上,有17位是中号,有10位是小号。
显然,糖尿病患者的平均裤子尺码大于健康人士的平均裤子尺码,并且P值小于0.05,证明两组之间的差距有显著的统计意义,非是偶然现象。
因而他得出结论:若就诊者穿的裤子是大码和大码以上,则可诊断为糖尿病;并据此提出治疗糖尿病新方案:勒紧裤腰带,一直到能穿中码最好是小码裤子为止。
显然,这个结论是荒谬的。
糖尿病患者中确实有很多是胖子,但胖子都是是糖尿病患者?更不要说,得糖尿病的人,精瘦的也不在少数。这个虚拟研究的本质,和著名的“砍掉螃蟹的腿,证明了螃蟹的听觉器官在腿上”研究一样,要检验的假设、实验设计、得出的结论,三者之间驴头不对马嘴,并从相关性检验跳跃到因果性结论,犯了科学研究的第二大忌讳。
其实要检验这个结论并不难。只需随机召集一群人,让这位科学家按他的新法子来找出糖尿病患者,然后再按正规糖尿病诊断方法,比如空腹血糖指数来检验,一对比就知道了。
至于勒紧裤腰带能不能治疗糖尿病,谁试谁知道。
正事是这样的:
我国一个医生团队,对自闭症的甲基化循环理论颇感兴趣,因此他们做了这么一个设想:如果检测自闭症患者群体和普通人群的血清,看看甲基化循环的那些东西,比如5-甲基四氢叶酸啦,腺苷蛋氨酸啦,等等,水平是不是有什么不同;要是有不同的话,是不是可以拿来区分,或者说,诊断自闭症。
所以他们找了89位谱系患者,89位普通儿童,抽血检测了足足13项指标:叶酸、维生素B12、四氢叶酸、5-甲基四氢叶酸、甲硫氨酸、S-腺苷蛋氨酸SAM、S-腺苷同型半胱氨酸SAH、SAM/SAH、同型半胱氨酸、甲硫氨酸合成酶、叶酸受体α、转钴胺素 II、胱硫醚-β合酶CBS。个个都是名头当当响的甲基化循环骨干分子。
两组相比较,结果是这么样:
所以看起来,除了四氢叶酸、叶酸受体和CBS三项,其它九项检测指标,两组之间确实存在着不同,不是谱系高,就是普通人群高。
然则这些检测指标可以把谱系孩子和普通孩子区分开吗?换句话说,能不能用来诊断谱系。
所以他们做了进一步的分析。为了便于理解,这里就不提太多的背景知识,总之,他们把每项检测指标设置了一个浮动范围,就像你查血小板数目,有个正常范围一样,过了这范围的要么是谱系,要么是普通儿童。这样,每项指标就做成下面这个图里面的一条曲线。
怎么看这个图呢?
这么说吧,如果一项检测指标曲线正好是对角红线,那要靠这项指标来判断是不是谱系的话,几率是50%。也就是说,全看您的心情,您尽管瞎猜,猜对了算我输!
当然,如果这根曲线离红线越远,猜对的机率就越高。要是这曲线变成了上半截三角形的两条直边,那可就牛逼大了!那是100%的准确,并且100%的不会出错,既不漏网一个,也不枉杀一条。
遗憾的是,这么些条曲线,不论是灵敏度(就是不漏网),还是特异度(就是不枉杀),都是没法说,甚至可以说是惨不忍睹。
那么那条黑线是啥哩?看着不是很好吗?
确实是很好。那是把这几条曲线给叠加起来的结果,得到的灵敏度是86.5% (89个谱系,能挑出75个);特异度是85.4%(89个普通儿童,有14个被判为谱系)。
看起来还不错是吧?
要知道谱系发病率最大也就是1%左右啊。根据89/89这样小规模数据得出的灵敏度和特异度,才百分之八十多?那要推广到人群,也就是随便拉一些人来做检测,这个黑线的准确度会低到不堪入目!
我们来做个简单的计算:
在89位谱系中,黑线查对了75位;
在89位普通中,黑线误查了14位;
因此,总共75+14=89位被判定为谱系的儿童中,其实有75位是真的谱系,也就是说,准确度是75/(75+14) = 84.2%。
根据统计学要求,如果某疾病发病率是5%,那么做检测研究的时候,纳入的对照人群应该至少是几百人甚至几千人;对发病率低到1%的自闭症,这个人数要求就更高了。
假定纳入了800个普通人,并且合理假设黑线的误查比例不变,那么就有800x(14/89) = 126位普通人被误判为谱系。那么总体准确度就是75/(75+126) = 37%。
如果按自闭症发病率为1%来估算,黑线的准确度将是75/(75+99x14) = 5%。
呜呼。。。
这还是集多项检测指标之力的结果!
所以,查查甲基化循环,然后复印机开个处方,也没什么不妥嘛!反正你都送上门来了!
主要参考资料:
Fisher discriminant analysis for classification of autism spectrum disorders based on folate-related metabolism markers.J Nutr Biochem. 2019 Feb;64:25-31.
网友评论