临床指标对疾病诊断和预后的影响并不是独立的,多个不同的指标结合后的模型预测能力往往更强。那么如何从许多差异表达的基因以及其他临床指标中筛选出与疾病诊断预后相关的因素,并构建多个因素结合的预测模型呢?今天,我们就来看看用R包进行Cox风险回归分析。
视频教程:
我们录制了操作视频,手把手呈现分析细节,并对可能遇到的问题做了详解。
TCGA临床资料gene数据COX分析
bilibili超清视频链接:https://www.bilibili.com/video/BV1sg4y1v7XL/
图文教程
以下是图文版的简化教程。
1 准备输入数据
示例数据中至少需要包含以下信息:样品编号、生存状态、生存时间和不同基因的表达量值或临床指标。示例数据文件为示例数据.txt,通过Excel打开,查看示例数据的格式。
用于Cox风险回归分析的示例数据
2 安装survival包
本次使用的R包为survival包,可以用于Cox风险回归和生存曲线等相关分析。相关代码在微信公众号阅读原文下载。
3 使用survival包进行Cox单因素分析
Cox单因素分析,是将各个因素分别与生存状态和生存时间进行相关性分析,可以用于在较多的因素时筛选出预后相关的因素。
结果文件为univariateCox.result.txt,其中包含各个因素的风险值、z值、95%置信区间以及p值等信息。
单因素Cox风险回归分析结果
4 使用survival包进行Cox多因素分析
Cox多因素分析,可以得到各个因素之间对预后影响的相互作用。例如,某个基因在不同年龄下对预后的影响可能不同,该基因在老人中对预后的影响大,而在年轻人中对预后的影响小,此时通过Cox多因素分析就能够得到年龄和该基因共同作用下对预后的影响。所以,Cox多因素分析得到的预测模型将更加准确。
结果文件为multivariateCox.result.txt,格式与单因素分析结果文件相似。
多因素Cox风险回归分析结果同时,通过多因素Cox分析构建的模型计算各个样品的风险得分,并根据风险得分分成高低风险组。
结果文件为riskscore.txt,其包含了各个样品模型中因素的值、风险模型计算的得分以及风险高低两组。
风险模型得分及分组结果
网友评论