美文网首页
决策树_测试和存储

决策树_测试和存储

作者: Yonginggg | 来源:发表于2019-08-03 10:41 被阅读0次

测试算法:使用决策树执行分类

依靠训练数据构造了决策树之后,我们可以将它用于实际数据的分类。在执行数据分类时,需要决策树以及用于构造树的标签向量。然后,程序比较测试数据与决策树上的数值,递归执行该过程直到进入叶子节点;最后将测试数据定义为叶子节点所属的类型

使用决策树的分类函数 (在tree.py的基础上添加)

在存储带有特征的数据会面临一个问题:程序无 法 确 定特征 在 数 据集中 的 位 置,例 如 前 面例子 的 第 一个用 于 划 分数据 集 的 特征是no surfacing属性,但是在实际数据集中该属性存储在哪个位置?是第一个属性还是第二个属性?

特征标签列表将帮助程序处理这个问题。使用index方法查找当前列表中第一个匹配firstStr变量的元素 。然后代码递归遍历整棵树,比较testVec变量中的值与树节点的值,如果到达叶子节点,则返回当前节点的分类标签

# 决策树分类函数  
def classify(inputTree,featLabels,testVec):  
    # 得到树中的第一个特征  
    firstStr = inputTree.keys()[0]  
    # 得到第一个对应的值  
    secondDict = inputTree[firstStr]  
    # 得到树中第一个特征对应的索引  
    featIndex = featLabels.index(firstStr)  
    # 遍历树  
    for key in secondDict.keys():  
        # 如果在secondDict[key]中找到testVec[featIndex]  
        if testVec[featIndex] == key:  
            # 判断secondDict[key]是否为字典  
            if type(secondDict[key]).__name__ == 'dict':  
                # 若为字典,递归的寻找testVec  
                classLabel = classify(secondDict[key], featLabels, testVec)  
            else:  
                # 若secondDict[key]为标签值,则将secondDict[key]赋给classLabel  
                classLabel = secondDict[key]  
    # 返回类标签  
    return classLabel  

相关文章

  • 决策树_测试和存储

    测试算法:使用决策树执行分类 依靠训练数据构造了决策树之后,我们可以将它用于实际数据的分类。在执行数据分类时,需要...

  • 2. 决策树

    这一章分为三部分: 决策树的构造方法 测试和存储分类器 使用matplotlib画出决策树结构 1. 决策树的构造...

  • 机器学习——条件决策树

    使用威斯康星州乳腺癌数据,划分训练集和测试集,比较经典决策树和条件决策树的效果。 条件决策树 算法如下: (1) ...

  • 机器学习6-决策树

    一. 决策树概述 1.1 什么是决策树 决策树输入: 测试集决策树输出: 分类规则(决策树) 1.2 决策树算法概...

  • 牛逼的泡菜(Pickle模块应用)

    在学习决策树时,对决策树的存储使用了这样一段代码 于是可以看出Pickle模块是用来进行数据的本地存储的,其用法如...

  • DxChain测试链Andes发布 以存储为算力的第一个区块诞生

    DxChain存储测试网的第一个块今天产生了! 经过6个月的设计、开发和测试,DxChain的存储侧链测试网Bet...

  • 内存服务和存储

    layout: docs-default 内存服务和存储 在开发和测试环境可以使用内存服务和存储快速设置和启动Id...

  • Hive 主流文件存储格式对比

    Hive 主流文件存储格式对比 1、存储文件的压缩比测试 1.1 测试数据 1.2 TextFile 创建表,存储...

  • 2019-02-22

    ML——决策树 决策树是基于树结构来进行决策的,根节点包含样本全集,其每个内部节点对应于一个属性测试,每个分...

  • 西瓜书学习笔记-决策树

    决策树 1 基本流程 决策树基于树结构进行决策,决策过程的每个判定问题都是对某个属性的“测试”。 一般的,一棵决策...

网友评论

      本文标题:决策树_测试和存储

      本文链接:https://www.haomeiwen.com/subject/ymtjdctx.html