美文网首页TCGA收入即学习TCGA
TCGA+biomarker——生存曲线

TCGA+biomarker——生存曲线

作者: Clariom | 来源:发表于2020-07-18 09:53 被阅读0次

生存曲线简介

1958年,Edward L. Kaplan 和Paul Meier也首次在临床研究中提出了生存曲线的概念,又被称作Kaplan-Meier曲线,通过将终点事件和出现这一终点所经历的时间结合起来进行统计分析,从而对各组患者的生存状况进行描述和比较。

生存曲线图解

image

解释:这项研究旨在比较乳腺癌患者中AC→T治疗方案与TAC治疗方案的临床疗效,主要终点为患者的总生存率(OS)或无病生存率(DFS)。研究共纳入3298例乳腺癌患者,患者被随机分为AC→T或TAC组,用生存曲线对两组患者的生存状况进行了描述,生存曲线的横坐标代表随访时间,纵坐标一般代表的是生存率。从图上来看,两组患者的生存率分别为88.9%和88.188.9%,差异不大,且P值0.37,不具备统计学意义。说明AC→T方案与TAC方案疗效相当。

如何绘制生存曲线?

以下代码源自生信技能树公共号中“学徒带你7步3251行代码+300行注释完成TCGA数据库挖掘实战全文复现”这篇教程,提供有生存曲线的详细绘制步骤,成图很漂亮!在此基础代码上,可以灵活运用。

rm(list = ls())
options(stringsAsFactors = F)

#载入数据
KM.input<-read.csv(file = "KM.input.csv",header = T)
head(KM.input)
# X event time_year RiskScore risk_group
# 1 TCGA-A1-A0SE-01A-11R-A085-13     0 3.6191781 0.3686996        low
# 2 TCGA-A1-A0SH-01A-11R-A085-13     0 3.9369863 1.8872376       high
# 3 TCGA-A1-A0SJ-01A-11R-A085-13     0 1.1397260 0.9330429        low
# 4 TCGA-A1-A0SK-01A-12R-A085-13     1 2.6493151 0.5337272        low
# 5 TCGA-A1-A0SM-01A-11R-A085-13     0 0.6630137 3.0229704       high
# 6 TCGA-A1-A0SO-01A-22R-A085-13     0 2.3342466 0.8083318        low
# 数据包括岩本名称、生存时间、风险模型计算的每位患者风险值、根据风险值中位数分组信息

#进行KM生存分析
# install.packages("survival") #用于生存分析
# install.packages("survminer") #用于画图
library(survival)
library(survminer)

#1.计算生存曲线:survfit()
str(KM.input)
fit<-survfit(Surv(time_year,event) ~ risk_group, data=KM.input)
###  ~risk_group 表示通过高低风险组来计算患者的生存率 如果是按照性别那就 ~sex(sex是你的变量名)
summary(fit) #展示更详细的结


#2.进行可视化  
#使用的是ggsurvplot()这个函数 [in Survminer R package]
KMsurvival_plot<-ggsurvplot(fit,pval = TRUE, #show p-value of log-rank test,显示log-rank分析得到的P值
                            conf.int = FALSE, #添加置信区间
                            conf.int.style = "step",  ###  customize style of confidence intervals,改变置信区间的样子
                            risk.table = "abs_pct",  ###  absolute number and percentage at risk,这里以n(%)的形式展示risk table
                            risk.table.y.text.col = T,###  colour risk table text annotations.
                            risk.table.y.text = FALSE,###  show bars instead of names in text annotations in legend of risk table.不显示注释名字
                            xlab = "Time in years", ###  customize X axis label.自定义x的标签为time in years
                            surv.median.line = "hv", #添加中位生存时间的线
                            ncensor.plot = FALSE, #我这里不显示删失的图,TRUE就显示
                            legend.labs =
                              c("high risk", "low risk"),    ###  对legend的标签重新命名
                            palette = c("#E7B800", "#2E9FDF"), ###  自定义颜色
                            ggtheme = theme_light() #绘图主题
                          )

KMsurvival_plot


#3.生存曲线的总结,Kaplan-Meier life table: summary of survival curves
#这个更为详细
KMres.sum  <- surv_summary(fit)
head(KMres.sum)


#4.查看统计学结果  Log-Rank test comparing survival curves: survdiff()
#The log-rank test is the most widely used method of comparing two or more survival curves.
#前面我们在画图中也可以直接看到P值
surv_diff <- survdiff(Surv(time_year, event) ~ risk_group, data = KM.input)
surv_diff #p-values<0.05 说明高低风险组的生存概率有显著差异
image.png

往期回顾
TCGA+biomarker——常见结果展示
TCGA+biomarker——Sample基线表
TCGA+biomarker——单因素Cox回归
TCGA+biomarker——多因素Cox回归
TCGA+biomarker——Cox回归森林图
TCGA+biomarker——Calibration curve
TCGA+biomarker——C-index

更多内容可关注公共号“YJY技能修炼”~~~

相关文章

  • TCGA+biomarker——生存曲线

    生存曲线简介 1958年,Edward L. Kaplan 和Paul Meier也首次在临床研究中提出了生存曲线...

  • TCGA+biomarker——ROC曲线

    通常情况下,通过以下几种指标来对模型进行评价。1)区分度:采用指标C-index和ROC曲线来评价区分度,一般文章...

  • 生存分析

    Surv:用于创建生存数据对象survfit:创建KM生存曲线或是Cox调整生存曲线survdiff:用于不同组的...

  • Graphpad绘制生存曲线

    Graphpad绘制生存曲线 在有关差异表达基因和生物标志物模型分析中,经常会见到生存曲线分析。如下图所示,生存曲...

  • TCGA | 生存曲线

    本教程目录: 首先使用cgdsr获取表达数据集临床信息 临床资料解读 简单的KM生存分析 有分类的KM生存分析 根...

  • 生存分析R语言绘图——ggsuvplot介绍及实例

    生存曲线绘制函数参数解释 ggsurvplot(fit, #生存分析结果data = NULL, # a ...

  • TCGA+biomarker——决策曲线分析法(DCA)

    DCA曲线简介 DCA是一种评估临床预测模型、诊断试验和分子标记物的简单方法。传统的诊断试验指标如:敏感性,特异性...

  • R数据分析:生存分析的做法与解释续

    今天更新续文,上篇文章写了生存曲线的画法,但是留了一个问题没有解决,就是Kaplan-Meier生存曲线实际上仅仅...

  • 生存分析

    ①每个基因生存分析图脚本 ②根据构建的基因模型划分高低风险组的生存曲线

  • 生存曲线(Survival curve)

    To be or not to be is only a part of the question, the qu...

网友评论

    本文标题:TCGA+biomarker——生存曲线

    本文链接:https://www.haomeiwen.com/subject/queqcktx.html