1. 相对危险度(RR)——队列研究中分析暴露因素与发病的关联程度
- 相对危险度(relative risk,RR),也叫危险比(risk ratio)或率比(rate ratio),是指2个人群发病率的比值,通常为暴露人群的发病率和非暴露人群(或指定的参照人群)的发病率之比。
- RR=暴露组的发病或死亡率/非暴露组的发病或死亡率
2. 比值比(OR)——病例对照研究中暴露因素与疾病的关联强度
- 比值比(odds ratio, OR):也称优势比、比数比,用于反映病例与对照在暴露上的差异,从而建立疾病与暴露因素之间的联系。
- OR=(病例组暴露人数/非暴露人数)/(对照组暴露人数/非暴露人数)
- 从公式即可看出,OR或RR值越大,表明暴露的效应越大,暴露与结局关联的强度也就越大。两者均为比值,因此以1为界限,若RR或OR:
=1,说明暴露因素与疾病之间无关联;
>1,说明暴露因素是疾病的危险因素(正相关),认为暴露与疾病呈"正"关联,即暴露因素是疾病的危险因素;
<1,说明暴露因素是疾病的保护因素(负相关),认为暴露与疾病呈"负"关联,即暴露因素是保护因素。
既然两者都是衡量暴露与疾病的相关性,RR已经足够,为何还需要OR?这是因为RR的计算需要使用发病率,因此队列研究、随机对照试验等前瞻性研究均可使用RR;但若是开展回顾性研究(如病例-对照研究),只能根据研究对象状态分组,无法直接计算暴露人群和非暴露人群的发病率,这种情况则需要使用OR。
3. HR(hazard ratio,HR)风险比 --- HR还考虑了时间因素,即包含了时间效应的RR就是HR
- HR=暴露组的风险函数h1(t)/非暴露组的风险函数h2(t),t指在相同的时间点上。而风险函数指危险率函数、条件死亡率、瞬时死亡率。Cox比例风险模型可以得到HR。资料的类型通常是临床治疗性研究,也可以是流行病学的队列观察性研究。
- HR与RR:
- 两者均用于前瞻性研究,多数认为HR与RR意思一样,但从计算公式可看出,HR还考虑了时间因素,换言之,包含了时间效应的RR就是HR;
- 从终点时间的角度来看,也可以这样理解,RR考虑了终点事件的差异,而HR不仅考虑了终点事件的有无,还考虑了到达终点所用的时间及截尾数据。
- HR主要通过COX回归分析得出,其计算较为复杂,需要用软件计算,在此不详细说明。HR可用于临床治疗性研究,也可用于队列研究。
名称 | 主要应用于 | |
---|---|---|
RR (Relarive risk)- 相对危险度 | 前瞻性研究 可计算发病率 | RR=1,说明暴露因素与疾病之间无关联。 RR>1,说明暴露因素是疾病的危险因素(正相关) RR<1,说明暴露因素是疾病的保护因素(负相关) |
OR ( Odds ratio)- 比值比 | 病例对照研究 | OR的值logistic 回归可以计算OR值 OR>1 暴露与疾病的危险度增加 正相关; OR<1 暴露与疾病的危险度减少 负相关; OR=1 暴露与疾病的危险度无关 无相关 P value <0.05 提示暴露可能与疾病有联系 计算OR 95%可信限-包含1则无意义 |
HR(Hazardratio)- 风险比 | 生存分析 | COX回归模型(以生存结局和生存时间为因变量) |
OR值/置信区间/P值
- OR值是点估计,95%置信区间是区间估计,OR值=1代表暴露因素与疾病无关联,OR值>1代表暴露因素为危险因素,OR值<1代表暴露因素为保护因素。就是置信区间的宽窄反映了对参数估计的精确度,置信区间越窄,说明估计越精确;置信区间越宽,说明估计越不精确,但更为可靠。比如,我估计一个人的身高在10cm~300cm之间,这一说法非常可靠,但是精确度很差,没什么实际价值.置信区间在做出统计学结论时与P值有异曲同工之妙。例如,对于“参数=0”这样一个无效假设,如果P值小于0.05,那么计算的该参数估计值的95%置信区间一定不包含0;反之,如果P值大于0.05,那么计算的该参数估计值的95%置信区间一定包含0。
- 尽管置信区间和P值都可以做出同样的统计学结论,但置信区间提供的信息更多。P值只是告诉我们一种概率,即当无效假设成立时,出现当前结果(或者更极端结果)的概率。但我们并不知道计算的结果与无效假设差别有多大,当样本例数很大时,即使轻微的偏离也会出现一个很小的P值。如无效假设为两组收缩压的差值为0,如果每组例数为10000人,那么即使两组收缩压的差值为0.1,也会出现P小于0.05的结论。但0.1这种差值是否有实际意义呢?仅从P值是看不出来的。
- 而置信区间还可以提示与无效假设的参数偏离有多远,如无效假设为两组收缩压的差值为0,最后计算95%置信区间为(0.1,0.15),这至少提示两点:第一,两组差异有统计学意义,因为置信区间没有包含0;第二,两组总体的差值并不大,因为我们有95%的信心认为两组差值在0.1-0.15之间。这说明尽管结果有统计学意义,但从专业角度来看,收缩压差别太少,没有太大的实际价值。这一信息是P值所无法提供的。 一般来说,样本量越大,计算的置信区间越窄,精度越高,此时P值也会越小。因为样本量越大,抽样误差越小,当样本量跟总体一样多时(相当于普查),就没有抽样误差了,计算的置信区间就越窄成了只有一个值。而此时也没有P值了,因为根本不用核计推断,计算的指标已经是参数了,也就没有“样本统计量推断总体参数”这一说法了。
- 最后在这里说明一下容易产生的误区:95%置信区间表示真实值有95%的概率落到当前置信区间之内。这个说法是不准确的,真实值要么在区间内,要么不在区间之内。95%的置信区间表示,多次抽样所得到的多个置信区间里,包含真实值的区间占比。如下图所示,竖的虚线代表真实值,横的实线代表一个一个的置信区间,这25个置信区间中,只有1个(红色的线)不包含真实值,95%以上区间包含了真实值。
img
网友评论