关注公众号,桓峰基因
桓峰基因 生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你 71篇原创内容 --> 公众号最近分享了很多转录组的高级别分析,有同学问我这些分析怎么才能运用到文章中,文章的都应该分析哪些,才能够发篇 SCI 文章呢?
这期我们就选择一篇最近发表的文章,利用桓峰基因的公众号里面的教程来搞一篇paper吧!21年3月发表在BMC Canner杂志(IF:4.43)。作者构建了膀胱癌RNA结合蛋白相关预后模型。该方向使用于癌症相关疾病的hub基因鉴定及预后模型构建。
摘 要
背景:RNA结合蛋白(RBPs)在转录后调控中发挥着关键和多方面的作用。虽然RBPs异常参与肿瘤的发生和发展,但对RBPs的作用知之甚少 膀胱癌(BLCA)预后。 本研究旨在建立一个基于预后相关的预后模型RBPs预测BLCA患者的生存。
方法:从美国癌症基因组图谱(TCGA)数据库中下载BLCA RNA序列数据分享RBPs在肿瘤组织和正常组织之间有差异表达。 然后,进行功能富集分析这些差异表达的RBPs。 独立预后相关RBPs由用单变量和多变量Cox回归分析建立风险评分模型。 随后生存分析,绘制K-M曲线, 并绘制ROC曲线,以评估该预后模型的性能。最后,建立一个nomogram,然后验证其预后价值和RBPs中的Hub的表达情况。
结果:本文在差异分析中获得385个差异表达的RBPs相关基因,其中,218个上调,167个下调。筛选出 8个独立的预后相关的RBPs (EFTUD2, GEMIN7, OAS1,APOBEC3H、TRIM71、DARS2、YTHDC1、RBMS3)构建预后预测模型。 深度分析显示,与患者相比,高危亚组患者的总生存期(OS)较低在低风险亚组,根据预后模型。TCGA训练和测试数据集的ROC曲线分别为0.795和0.669, 分别显示了中等预测判别的预后模型。 建立列线图,显示该模型对BLCA的预后有良好的预测价值。
结论:我们开发并验证了BLCA预后模型的性能,这可能会促进用于BLCA患者预后评估的新生物标记物的开发。
生信分析流程
我们从文章中提取生信分析流程,看下文章中使用的数据集和生信分析方法,如下:
相关数据准备
数据集选择:TCGA-BLCA数据集包含19 个正常样本和 414 个 BLCA 样本。
https://portal.gdc.cancer.gov/
基因集选择:RNA结合蛋白基因
Human Protein Atlas (HPA) online database
http://www.proteinatlas.org/
生信分析方法
我们从文章的分析流程中提取所有的分析内容,整理出来就10个分析条目,构成了整个文章,纯生信文章,发了4+,点击分析条码就会跳转到对应公众号的教程,跟着教程做,您也能发4+,如下:
5.PPI筛选关键模块基因;
6.单因素Cox回归分析;
7.多因素Cox回归分析;
8.构建线性预后回归模型;
9.K-M生存分析;
10.ROC曲线和Calibration曲线;
11.列线表(nomogram);
12.Cox回归分析。
文章的研究结果
1.筛选差异表达的RBP
DEseq 筛选正常样本和BLCA样本间差异表达基因,85个差异表达的RBPs相关基因,其中,218个上调,167个下调,并绘制火山图和热图
分别对上调和下调的RBP基因进行 GO 和 KEGG 通路富集分析。
GO富集分析表明:上调RBPs的生物学过程主要富集在ncRNA加工、细胞质核糖核蛋白、核糖核酸酶活性(图3a),而下调RBPs主要富集在RNA剪接、细胞质核糖核蛋白、翻译因子活性等(图3b)。
KEGG通路富集分析表明:上调的RBPs显著富集氨酰-tRNA生物合成和半胱氨酸和蛋氨酸代谢(图3c),而下调的RBPs富集赖氨酸降解和2-氧代羧酸代谢(图3d)。
7.K-M生存分析
10.Cox回归分析
11.HPA 数据库的免疫组织化学结果
从流程中整理出来的生信分析方法明显在桓峰基因公众号中都有分享过,有需要做相关或类似文章的老师和同学们可以直接加我微信,保证最好的服务!
本文使用 文章同步助手 同步
网友评论