信息增益gain
此时的gain(outlook) = 0.940 - 0.694 = 0.246, 作为进步的幅度,越大越好(通过该分支的数据集越纯)
同样计算出gain(temperature) = 0.029, gain(humidity) = 0.152, gain(windy) = 0.048
其中gain(outlook)最大,即outlook在第一步使信息熵下降得最快,所以根节点取outlook.
决策树构造实例小结
使得信息增益值最大的特征作为根节点,之后第二个、第三个节点的决定与之相同
网友评论