美文网首页
分类模型—非监督学习

分类模型—非监督学习

作者: Carolina_Wang | 来源:发表于2020-04-01 14:01 被阅读0次

监督学习和非监督学习的区别

监督学习是有一个有标签的训练集,我们的目标是能找到区分正负样本的决策边界,需要使用已有数据拟合一个假设函数;而非监督学习的数据不带有任何标签,需要通过一系列规则(距离、相似度等)来分辨出相同数据,最终仅仅输出属于同一类别的数据而不输出所属标签。

常见的非监督学习算法

系统聚类、层次聚类、基于密度聚类

相似性度量方法

  • 样本点指甲的相似性度量

基于距离
欧式距离、编辑距离
闵可夫斯基距离:与各指标的量纲有关,没有考虑各个变量之间的相关性和重要性
马氏距离:不仅考虑了观测变量之间的相关性,也考虑了各个观测指标取值的差异程度
相似系数:皮尔逊相关系数、余弦夹脚
实际应用中有明确的意义,比如经济变量,则使用相似系数;进行聚类之前已经对变量的相关性做了处理,采用欧式距离;聚类方法选用力差平方和,采用欧式距离;

  • 类与类之间的相似性度量

最短距离、最长距离、组间平均连接、重心法、离差平方和法、

算法详情

  • 简介

系统聚类:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其他类的距离或相似性测度,直到所有对象都归为一类为止。
层次聚类:先计算样本点之间的距离,距离最近的合并成一类,可以分成自底向上和自顶向下两种

相关文章

  • 分类模型—非监督学习

    监督学习和非监督学习的区别 监督学习是有一个有标签的训练集,我们的目标是能找到区分正负样本的决策边界,需要使用已有...

  • 客户分群-聚类算法

    机器学习算法分类 有监督学习 有训练样本 分类模型 预测模型 无监督学习 无训练样本 关联模型 聚类模型 聚类算法...

  • 机器学习的类型

    二元分类、多元分类、回归、结构化学习、······ 监督学习、非监督学习、半监督学习、强化学习、······ 成批...

  • 深度学习的一些基本概念(一)

    申明:非原创,转载自《有监督学习、无监督学习、分类、聚类、回归等概念》 有监督学习、无监督学习、分类、聚类、回归等...

  • 关于决策树模型,你需要知道的|从ID3到XGBoost

    引子:决策树模型(Decision Trees,DTs)是一种非参监督式学习模型。它既可以应用于分类问题,也可以应...

  • 《统计学习方法》-第一章(3)

    生成模型与判别模型 监督学习的任务就是学习一个模型,这个 模型一般是决策函数:或者条件概率分布: 分类 监督学习的...

  • 第一章:统计学习方法概论

    统计学习方法三要素:模型,策略,算法。分为监督学习,非监督学习,强化学习,半监督学习 假设空间:模型的集合策略:损...

  • 2.3 机器学习概念 -方法分类

    机器学习的方法分类 监督学习 非监督学习 半监督学习 增强学习 1. 监督学习 含义:给机器训练的数据,有了"标记...

  • 分类模型—监督学习

    监督学习 KNN 基本原理 寻找目标数据点附近最近的K个点,采用投票的方式判断测试数据点所属类别 算法步骤 1.计...

  • 【百面机器学习】非监督学习-K均值聚类

    相对于监督学习,非监督学习的输入数据没有标签信息,需要通过算法模型来挖掘数据内在的结构和模式。非监督学习主要...

网友评论

      本文标题:分类模型—非监督学习

      本文链接:https://www.haomeiwen.com/subject/ivzouhtx.html