美文网首页
data mining-基于实例的学习

data mining-基于实例的学习

作者: crishawy | 来源:发表于2018-09-24 21:56 被阅读0次

在基于实例的学习中,训练样本被完全保存起来,并且使用距离函数带来判定训练集中的哪个实例与一个未知的测试实例最近。

距离函数

选择欧几里得距离,因为更高的指数距离增加了大差异的影响力而削弱了小差异的影响力,欧几里得距离是一个折中的方法。
注意:通常要使用min-max方法对属性进行归一化处理。

高效的寻找最近邻

基于实例的学习方法很简单而且有效,但速度慢,传统的只需要计算测试点与实例点的各个距离,筛选出最近的即可,但遍历大量数据需要花费大量时间。
一种更加有效的方法是使用树结构kD树。它用一个超平面将输入实例空间分隔开,再将每一个部分递归的进行分裂。在二维空间里,所有的分裂都与轴平行或垂直,具体的原理类似分支限界法的剪枝原理

基于实例的学习方法的讨论

首先原理简单、效果好,但由于数据库很容易受干扰样本的破坏,可以使用k最近邻法,让k个最近邻根据少数服从多数的原则投票测试样例属于哪个类别。
当样本数量非常少时,最近邻法效果很差。当样本数量无穷大和投票实例k无穷大时,最近邻法理论上误差概率达到最小。
注意:kD树对于实例空间的纬度很大时,其效率变得非常低,当属性很小(最高为10),才有应用价值。球树是最近研究的通用结构

相关文章

  • data mining-基于实例的学习

    在基于实例的学习中,训练样本被完全保存起来,并且使用距离函数带来判定训练集中的哪个实例与一个未知的测试实例最近。 ...

  • data mining-概念、实例和属性

    对于机器学习方案如何运作,主要包括输入、输出、算法、以及评价。本文主要介绍机器学习方案的输入等概念。 概念 一个具...

  • data mining-评估学习结果

    评估是数据挖掘能否取得真正进展的关键一环。 训练和测试 对于分类问题,自然采用误差率来衡量一个分类器的性能,为了能...

  • Pandas 数据选取之loc iloc ix

    基于想同时学习金融和pandas的初衷,代码实例会使用到tushare 话题部分源于Data analysis ...

  • data mining-输出:知识的表达

    机器学习方法的基本知识表达形式是以决策树或者规则来展现,知识是用来描绘由机器学习方法产生的结构。 表 采用与输入方...

  • vue学习笔记

    .$data .#$el $data表示vue实例中data的值$el表示vue实例中el的值,注意 el效果等...

  • Vue.js教程_3

    计算属性:computed与el、data、methods并列,是Vue实例中的一个方法。 计算属性是基于它们的响...

  • 实例属性

    vm.$data 实例对象data属性 vm.$props 实例对象props属性 vm.$el 实例对象根DOM...

  • vue 中 $el与$refs 区别

    * vm.$el 获取Vue实例关联的DOM元素; * vm.$data 获取Vue实例的data选项(对象) *...

  • vue框架深度解析之vue基础

    Vue实例 Vue实例创建和作用 -- 1. app.$data -> 所有data的数据 [obj](app.d...

网友评论

      本文标题:data mining-基于实例的学习

      本文链接:https://www.haomeiwen.com/subject/liphoftx.html