To be or not to be is only a part of the question, the question also includes how long to be.
生存分析(survival analysis), 不想用难懂的术语去解释,很讨厌课本上的复杂句式,好像不搞那么复杂就很low?明明本身是很简单的概念。
我们来对比一下:
A: 生存分析是将事件的结果和出现这一结果所经历的时间结合起来分析的一种统计学方法。(官方)
B: 生存分析就是将观测和生存时间结合起来分析的统计学方法。目的在于显示某因素与生存时间的关系。(自己的)
读完A后的感觉就是我还要再去读两遍,然后问生存分析到底是干嘛的?
生存时间的类型:完全数据(从起点到死亡),截尾数据(从起点到某一时间点)
生存资料的特点:含有截尾数据,截尾数据的真实生存时间未知,但确定的是大于生存时间。一般不呈正态分布。
条件生存概率:如年条件生存概率,月条件生存概率。
生存率:如5年生存率,指经过5年后,仍存活的概率。
生存曲线(Survival curve):以随访时间为横轴,生存率为纵轴,将各点连成曲线。
应用于基因表达高低,可分为两组,高表达,与低表达。
分析资料:
1)估计:Kaplan-Meier法(K-M法),由Kaplan和Meier于1958年提出,适用于小样本和大样本。
2)比较:log-rank检验,非参数检验,用于比较两组或多组生存曲线。检验统计量为卡方。实为单因素分析, 要求各曲线不能交叉,如交叉提示存在混杂因素。
3)影响因素分析:Cox比例风险回归模型(最重要的模型之一),多因素分析方法,1972年提出,不考虑生存 时间分布,利用截尾数据。
4)预测:Cox回归模型预测生存率
网友评论