美文网首页
决策树实例

决策树实例

作者: overad | 来源:发表于2020-01-09 14:38 被阅读0次
from sklearn import tree
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split

import pandas as pd

import graphviz

wine = load_wine()

X_train,X_test,Y_train,Y_test = train_test_split(wine.data,wine.target,train_size=0.7,random_state=44)

#这里可以使用信息熵或者gini系数
clf = tree.DecisionTreeClassifier(criterion='entropy')
clf.fit(X_train,Y_train)
score = clf.score(X_test,Y_test)

print("DecisionTreeClassifier Score:",score)
#output:DecisionTreeClassifier Score: 0.9629629629629629

feature_names = ['酒精','苹果酸','灰','灰的碱性','镁','总酚','类黄酮','非黄烷类酚类', '花青素','颜色强度','色调','od280/od315稀释葡萄酒','脯氨酸']

dot_data = tree.export_graphviz(
    clf,
    #out_file='d:/dt_wine.dot',
    feature_names = feature_names,
    class_names = ['琴酒','雪莉','贝尔摩德']
    ,filled=True
    ,rounded=True
)
#这个会显示中文乱码,需要替换字体
#graph = graphviz.Source(dot_data)

#加了replace后就不会再显示中文乱码
graph = graphviz.Source(dot_data.replace("helvetica","FangSong"))

graph.view()

2.1.1 criterion
为了要将表格转化为一棵树,决策树需要找出最佳节点和最佳的分枝方法,对分类树来说,衡量这个“最佳”的指标
叫做“不纯度”。通常来说,不纯度越低,决策树对训练集的拟合越好。现在使用的决策树算法在分枝方法上的核心
大多是围绕在对某个不纯度相关指标的最优化上。
不纯度基于节点来计算,树中的每个节点都会有一个不纯度,并且子节点的不纯度一定是低于父节点的,也就是
说,在同一棵决策树上,叶子节点的不纯度一定是最低的。
Criterion这个参数正是用来决定不纯度的计算方法的。sklearn提供了两种选择:
1)输入”entropy“,使用信息熵(Entropy)
2)输入”gini“,使用基尼系数(Gini Impurity)

相关文章

  • 机器学习 - 决策树算法[一]

    1 决策树模型与学习 1.1 决策树模型 决策树定义: 分类决策树模型是一种描述对实例进行分类的树形结构。决策树由...

  • 决策树学习

    决策树学习的适用问题 通常决策树学习最适合具有以下特征的问题: 实例是由“属性-值”对(pair)表示的。实例是用...

  • 统计学习方法——修炼学习笔记5:决策树

    一、决策树 分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点(node)和有向边(directed ...

  • 李航统计学习方法(五)---决策树

    决策树模型与学习 决策树模型 分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两...

  • 机器学习决策树—Apple的学习笔记

    决策树学习的目标:根据给定的训练数据集构建一个决策树模型,使它能够对实例进行正确的分类。 决策树学习的本质:从训练...

  • 决策树

    模型 决策树的学习目标是根据给定的训练数据集,建立一个决策树,能够对实例进行正确分类。决策树算法通常是递归选择最优...

  • 通俗地说决策树算法(三)sklearn决策树实战

    前情提要 通俗地说决策树算法(一)基础概念介绍 通俗地说决策树算法(二)实例解析 上面两篇介绍了那么多决策树的知识...

  • 决策树

    决策树 决策树是一种基本的分类方法,当然也可以用于回归。决策树模型呈树形结构。在分类问题中,表示基于特征对实例进行...

  • 决策树实例

    2.1.1 criterion为了要将表格转化为一棵树,决策树需要找出最佳节点和最佳的分枝方法,对分类树来说,衡量...

  • 决策树基本概念及算法优缺点

    1. 什么是决策树 分类决策树模型是一种描述对实例进行分类的树形结构. 决策树由结点和有向边组成. 结点有两种类型...

网友评论

      本文标题:决策树实例

      本文链接:https://www.haomeiwen.com/subject/dmpyactx.html