Tree是一个比较简单的算法,可以根据分类的纯度将数据划分为多个节点;orange的树可以处理离散数据集和连续数据集。
输入是数据集和预处理方法,输出是决策树算法和训练的模型。
image.png
打开Tree的窗口,里面有几个重要的指标:
Induce binary tree 创建一个二叉树;
Min. number of instances in leaves 每个节点最小实例限制;
Do not split subsets smaller than 子集实例小于x的时候不再进行拆分;
Limit the maximal tree depth to 树的最大深度不深于x
对于分类:
Stop when majority reaches [%] 当纯度大于x时不再进行拆分;
通过Tree模型插件后数据就分好类了,然后我们再使用Tree viewer可视化插件看下分类情况;
可以看到Tree viewer很形象的展示了决策树,也表示出了每个特征分类值;
同样也可以在后面增加一个Data Table看选中的数据。
对于模型如何使用,后面介绍。
网友评论