Box-Cox变换后的数据,可以使回归模型满足线性、误差独立性、误差方差齐性和误差正态性,同时又不丢失信息。
对存在非线性关系的数据,可以使用复杂模型拟合非线性函数来处理非线性问题,但这样的运算更复杂。先采用相对简单的数据转换来尝试将数据关系变为近似线性关系的情况,是更明智的。
一般的数据转换方法:
- 对数转换:
- 平方根转换:
- 立方根转换:
- 平方根后取倒数:
- 倒数转换:
上述各方法,对的转换幅度依次增大。
Box-Cox转换形式为:
可变参数决定具体的变换形式,时,变换为对数变化。对于任意取值的,可改为,保证对数的运算。
在应用中,需要估计的参数是。为使转换后的数据服从线性,即希望,则对固定,和的似然为
最大化似然,求得参数的最优值。
Box-Cox转换通过变换参数来改变变换的具体形式。整个过程完全基于数据本身,从而比直接选定对数、平方根等方法要客观准确。
网友评论