聚类、分类

作者: Jeriah | 来源:发表于2017-03-06 16:15 被阅读44次

clustering

k-means法

API

>>> from sklearn.cluster import KMeans
>>> import numpy as np
>>> X = np.array([[1, 2], [1, 4], [1, 0],
...               [4, 2], [4, 4], [4, 0]])
>>> kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
>>> kmeans.labels_
array([0, 0, 0, 1, 1, 1], dtype=int32)
>>> kmeans.predict([[0, 0], [4, 4]])
array([0, 1], dtype=int32)
>>> kmeans.cluster_centers_
array([[ 1.,  2.],
       [ 4.,  2.]])
批量 K-means 法 MiniBatchKMeans

API

相似性传播 Affinity Propagation

API

适合中小型的数据集

均值漂移 MeanShift

API

回归

用到的回归类

regr = linear_model.LinearRegression()
线性回归的多分类

例子

OvO 一对一

把类别两两配对,制造N(N-1)个分类器。所有分类器预测结果最重合的那个类别,即为此点的分类。

OvR 一对多

共有N个分类器,每个分类器把一个类别记为‘+’的,其他类别一块记为‘-'的。预测时,若有一个分类器预测结果为+,则把它当做最终结果。

Paste_Image.png

OvO的存储开销比较大,时间开销更小,由于用所有类别训练,结果比一对多更准。

MvM 多对多

每个分类器对所有类进行划分,分为-和+。有二元编码和三元编码,三元编码多了个「停用类」。

方法称作「纠错输出码」EOOC。

这三个方法很难说出谁更强。

相关文章

  • 聚类、分类

    clustering k-means法 API 批量 K-means 法 MiniBatchKMeans API ...

  • K-Means聚类算法

    聚类 聚类 是一种无监督学习,它将相似对象归到一个簇中。簇中的对象越相似,聚类的效果越好。聚类跟分类的区别,分类事...

  • Kmeans聚类

    1 聚类与分类的区别2 k-means 聚类基本概念3 算法优缺点4 算法思路5 代码实现 1 聚类与分类的区别 ...

  • 聚类算法k-means

    聚类算法 聚类算法 是 无监督学习 聚类算法有特征,无标签,是无监督分类。 sklearn 聚类模块 cluste...

  • 大数据--聚类算法

    本篇结构 简介 聚类算法的分类 K-Means聚类算法 DBSCAN聚类算法 本篇介绍了聚类算法的种类,重点关注K...

  • 第一章 回归,分类 & 聚类

    •分类数据 •数据回归分析 •聚类数据 •如何构建机器学习问题 虽然还有其他模型,但是回归,分类和聚类在机器学习问...

  • 常用的聚类方法

    1.K-means 适用于样本聚类 2.分层聚类 适用于变量聚类 3.两步聚类 适用于分类变量和连续变量聚类 4....

  • 神一样的产品经理-数据挖掘模型

    常见挖掘模型有以下几类: 1 聚类 聚类(Clustering)是根据特定的标准将数据划分为不同的组。 聚类和分类...

  • 自然语言处理N天-Day0601基于ML的中文短文本分类

    这两节课分别是分类和聚类问题,刚才突然大脑短路,在想分类和聚类的区别。 分类就是根据文本的特征或属性,划分到已有的...

  • 【机器学习与R语言】11- Kmeans聚类

    1.理解Kmeans聚类 1)基本概念 聚类:无监督分类,对无标签案例进行分类。 半监督学习:从无标签的数据入手,...

网友评论

    本文标题:聚类、分类

    本文链接:https://www.haomeiwen.com/subject/gmyygttx.html