美文网首页TCGA数据分析
【文献解读】公共数据挖掘加免疫组化找biomarker

【文献解读】公共数据挖掘加免疫组化找biomarker

作者: 医科研 | 来源:发表于2019-01-20 18:33 被阅读170次

没有什么是做点实验解决不了的,如果有,那就来一打免疫组化!!!

小编同学分享一篇今年11月前不久发表的公共数据数据挖掘的文献,IF=3.9哦,全文大部分属于数据挖掘的内容,仅有唯一的实验部分就是免疫组化啦。看文献就是看图说话呀,这一次我们除了摘要当然是:

摘要

image.png

瞅一眼摘要部分,我们大概就能知道文章做了啥,作者用了GEO,TCGA, 找到一些差异基因,,然后做了46对癌和癌旁的免疫组化,最后得出结论就是咱找到了几个预后的marker呀,下面就是看图说话啦。


image.png

首先就是做了一个GSEA分析,看看功能通路上的差异,这个操作也不难呀,有个软件可以做,不需要编程哟(就是感觉大家会喜欢)。

差异基因分析

image.png

然后就是那些年流行的热图和火山图啦,表明下差异基因的分析,但是注意本文作者是整合了多个GEO的芯片数据,用sva做了去除batch effect相对用一个数据集要复杂一些,也是有R包可以做的。
通路富集分析


image.png

然后是一张比较酷的图,现在已经很常见啦,看起来很复杂,实际上也不算难(当然肯定是有R基础的),这部分需要用到一个R包处理,做下可视化,目的就是展示下富集的通路呀,然后hub基因是如何找到的呀,操作不难(cytoscape功能还是很强大的)。

差异基因展示


这个图不是看,是在展示5个上调和5个下调基因的表达情况,明明是筛选出的差异基因,当然差异表达啦,意义不大,但是看着咱做了好多内容呀。


image.png

这是一个真的分析,就是看看这10个差异基因分别去做ROC曲线,5个上调做,5个下调做,再10个一起做,看下发现咱AUC不错呀。

TCGA验证


好,这张图比较有趣,注意奥这是在用TCGA数据库验证这10个基因的表达情况,并且做了生存分析,但是小编同学保证这部分不需要R语言哟(知道这个工具的请举手呀),全程在线完成,是不是发现哎呀好多结果呢,其实不多目的就是验证下,说明前面做的没啥问题,可问题是前面是ROC曲线哎,按理说,诊断效果自然也是要用TCGA数据做ROC曲线验证嘛,作者为啥不用嘞?(你猜,猜到了告诉我)

免疫组化验证


这就是全文唯一的实验验证部分啦,做了46对免疫组化,挑选3个基因做验证的,其实结果确实也不算太好,毕竟数据量还是相对太小。
综合全文来看,其实工作量不算大,值得一提的就是整合了多个芯片数据组成(merged microarray data),加强数据量,而不是常见的分别去做再取交集。但不足之处在于TCGA的应用并不充分,仅仅是用了在线工具做简单的验证,最终的biomarker也就停留在差异和生存率这一步了,并且没有得到大规模数据集的验证。

看完这些是不是也有一种想动手的冲动(我可明明做得比它还好呢,为啥我还没发sci呢?)


总结陈词

小编同学就是这样优雅的用10分钟看完这篇文献,并讲给大家听的。


相关文章

网友评论

    本文标题:【文献解读】公共数据挖掘加免疫组化找biomarker

    本文链接:https://www.haomeiwen.com/subject/kcffjqtx.html