无意中发现一篇生信文章,分数不高,思路值得借鉴。
大佬说:复现是学习R语言最好的办法。
其实这句话,在生信文章套路中同样适用的,即:
复现是学习生信套路最快的捷径!

结果
1.差异基因筛选

作者从pubmed2ensembl(http://pubmed2ensembl.ls.manchester.ac.uk)挖掘与Atherosclerosis相关的基因,同时用GSE28829进行差异分析,求出二者的交集部分。
2.富集分析
对筛选出的基因常规用DAVID进行GO和KEGG富集分析

3.蛋白互作网络构建
常规PPI网络构建,并利用MCODE筛选出23个核心基因

4.药物基因互作分析
根据DGIdb: http://www.dgidb.org,筛选上述23个基因潜在的药物,共发现存在8个药物基因对。同时对8个基因进行GO富集分析,发现其功能主要集中在炎症反应、细胞信号转导等方面。



总结
本文从动脉粥样硬化疾病入手,筛选差异基因,进行富集分析,潜在药物分析,故事相对完整,其实还可以加上Cibersort免疫细胞浸润分析;胜在非肿瘤角度。
推荐数据库:
pubmed2ensembl : http://pubmed2ensembl.ls.manchester.ac.uk
DGIdb: http://www.dgidb.org
参考链接:
Drug discovery in cardiovascular disease identified by text mining and data analysis
网友评论