sklearn函数库中在基于决策树(主要是CART)的一些算法(decision tree regression, randomforest, extra randomized tree, gradient boosting regression tree等)中做回归时,在构建二叉CART的过程中要进行特征的选择和最佳决策值的选择,回归主要使用的损失函数标准是['mse', 'friedman_mse','mae']。这里对mse和'friedman_mse'做一个区分。
1.mse-mean squared error impurity criterion(均方误差不纯度准则)
MSE = var_left + var_right
这里指的是左子树的方差与右子树的方差之和
2. friedman_mse-mean squared error impurity criterion with improvement score by Friedman(Friedman改进的均方误差不纯度准则)
diff = mean_left - mean_right
improvement = n_left * n_right * diff^2 / (n_left + n_right)
这里mean_left/right 指的分别是左右子树的平均误差,n_left/right分别是左右子树的样本数目。
网友评论