最小二乘法

LinearRegression使用系数w 拟合模型，最小化实际观测值和预测值的残差平方和。

然而，最小二乘法的系数估计依赖于模型中变量的独立性，当模型中的解释变量存在相关关系，会导致多重共线性，例如，数据收集没有经过实验设计。

岭回归

岭回归通过对系数大小增加惩罚解决了最小二乘法的一些问题。岭回归使用L2正则

alpha大于等于0是一个复杂系数，控制着收缩量，alpha值越大，收缩量越大，系数越稳健。
RidgeCV通过alpha系数的交叉验证来建立岭回归。

Lasso

Lasso是一个估计稀疏系数的线性模型，它倾向于选择较少的参数值的解决方案，有效地减少结果所依赖的变量数。Lasso使用L1正则

参数alpha控制着估计系数的稀疏程度。设置alpha参数有两种主要方法：交叉验证、基于模型选择的信息准则；

交叉验证：LassoCV和LassoLarsCV。LassoLarsCV建立在Least Angle Regression算法基础上。对于有多重共线性的高维数据集，LassoCV通常是较好的。然而，LassoLarsCV在探索alpha参数方面更有优势，如果样本数小于观测值数，它通常比LassoCV更快。
基于模型选择的信息准则。LassoLarsIC提出使用Akaike信息准则（AIC）和Bayes信息准则（BIC）。这些信息准则需要对结果自由度有适当的估计、来自大样本、假设模型是正确的等等。

弹性网络（Elastic-net）

弹性网络是一种使用L1和L2正则化方法的线性回归模型。它能够学习只有很少非零权重的稀疏模型（比如Lasso），也保留了Ridge的正则化功能。我们使用 l1_ratio 参数去控制L1和L2。
当有很多特征高度相关时弹性网络很有用，Lasso可能是随机的选择了一个，而弹性网络可能选择了两个。

ElasticNetCV能使用交叉验证来确定参数alpha和 l1_ratio。

最小角回归（Least Angle Regression）

LARS是一种用于高维数据的回归算法。
LARS的优点：

当维度比样本数多的时候，能高效计算；
计算和向前选择方法一样快，复杂度和最小二乘法一样；
生成完整的线性解路径，在交叉验证或模型调整时很有用；
如果两个变量对因变量有几乎相等的关系，那么他们的系数也应该按大致相同的速率增加。LARS的表现和直觉期望的一样，也更稳定；
很容易修改，产生其他的解决方案，例如Lasso。
LARS的不足：
由于LARS是基于残差的迭代修正，对噪音非常敏感。

LARS Lasso

LARS Lasso是Lasso模型的LARS算法实现，不同于坐标下降法，它将返回准确值。
The algorithm is similar to forward stepwise regression, but instead of including variables at each step, the estimated parameters are increased in a direction equiangular to each one’s correlations with the residual.