自变量与协变量差异

自变量是指研究者主动操纵，而引起因变量发生变化的因素或条件，因此自变量被看作是因变量的原因。
协变量：在实验的设计中,协变量是一个独立变量(解释变量),不为实验者所操纵,但仍影响响应。同时，它指与因变量有线性相关并在探讨自变量与因变量关系时通过统计技术加以控制的变量。
总结：
不同点：自变量可人为改变，协变量不受实验者操控。
共同点：均对结果变量产生影响
例子：研究饮食与身高的关系时，数据采集当年的身高即为协变量，不受研究者控制，但对结果变量（数年后的身高）有影响。

协变量和控制变量

协变量应该属于控制变量的一种。有些控制变量可以通过实验操作加以控制,也称为无关变量;而另一些控制变量由于受实验设计等因素的限制,只能借助统计技术来加以控制,即成了统计分析中的协变量,抑或是混杂因素。

协变量的校正

方法：事先控制法，在实验设计阶段通过合理设计减小协变量的影响。
具体如下：

完全随机分组。RCT实验讲究随机化，在样本量足够大的时候，姑且可以认为各组间的各种因素达到平衡。
按照协变量取值，实现分层随机化。适用于样本量不大的情况，且分层因素不宜太多，一般考虑最重要的 1～3 个因素，每个因素 2～3 个水平。
匹配随机化，简单来说，按照各种混杂因素配对子，使得对子之间的各种因素基本一致。

事后控制法，在实验分析阶段采取适当统计学方法减小协变量引起的终点指标的影响。

校正方法按照主要结果指标类别以及协变量数量而定

协变量1-2个

结果指标为连续型变量时，主要采用差值法、协方差法。

差值法，主要考虑实验开始阶段的基线指标因素。在评价主要终点指标时，如果其基线取值是连续性变量，往往要考虑基线值的大小对预后的影响。常用的方法是计算观察指标相对于基线的变化值，即治疗后观测值与基线值的差值，包括绝对差值或相对差值。绝对差值即干预后-干预前，相对差值即(干预后-干预前)/干预前。
协方差法，协方差分析是方差分析基础上加入协变量进行回归分析。回归分析可以处理混杂偏倚，而协方差恰好是混杂因素，而方差分析可以研究组间差异，结合起来可以用来控制偏倚、探讨处理因素效应。

结果指标为分类变量时，用分层分析法

分层分析法，分层分析是控制协变量的基本方法之一，此时协变量是分类变量，如果协变量是连续性变量，则需要分类化。当主要结果变量是分类指标时，对协变量的校正可采用 Cochran-Mantel-Haenszel（CMH）检验进行分层分析；当结果变量为生存时间时，可用分层 log-rank 检验、分层 Cox 模型等。
例 2 研究产妇状况与电针引产手术效果的关系，将 771 例产妇按初产和往产进行分组，观察电针引产手术的效果，结果如下表。