美文网首页
关于无监督、聚类和主题模型

关于无监督、聚类和主题模型

作者: Silv_Kim | 来源:发表于2020-02-11 11:44 被阅读0次

Some references

1 吴恩达ML

Clustering

image.png

K-Means (usually two steps in each inner loop)

image.png

First step: Cluster assignments steps
Next: move cluster centroid to where close to the average of other dots

image.png
Optimization objective
image.png
distortion function

Random Initialization

随机选点
容易陷入局部最优 所以要多次kmeans
K值较小时random可以更好的最小化畸变函数而比较好地聚类
Choosing the number of K
更多的时候是自己设置,there isnt always a good answer elbow并不常用
image.png

2. 北理工ML

主题模型

发展历程
image.png
MK矩阵:每个词w 在 m行文档K列主题 的分布矩阵
image.png
吉布斯采样

3. 周志华ML

聚类

  • 聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集 称为一个"簇" (cluster). 聚类过程仅能自动形成簇结构,簇所对应的概念语义需由使用者来把握和命名.
  • 性能度量:聚类结果的"簇内相似 度" (intra-cluster similarity)高且"簇间相似度" (inter-cluster similarity)低. 聚类性能度量大致有两类. 一类是将聚类结果与某个"参考模 型" (reference model)进行比较,称为"外部指标" (external i丑dex); 另一 类是直接考察聚类结果而不利用任何参考模型,称为"内部指标" (internal index).

Prototype-based clustering

K-means


相关文章

  • 关于无监督、聚类和主题模型

    Some references http://www.52nlp.cn/2012/04 https://githu...

  • 客户分群-聚类算法

    机器学习算法分类 有监督学习 有训练样本 分类模型 预测模型 无监督学习 无训练样本 关联模型 聚类模型 聚类算法...

  • LDA

    主题模型用于提取文本信息中的主题。是无监督学习方法。主题模型主要用于文本聚类,用于对非结构化的本文提取信息和特征。...

  • 机器学习-吴恩达笔记8(1)之K-means

    Week8-聚类与降维 无监督学习unsupervised learning 无监督学习简介 聚类和降维是无监督学...

  • 聚类算法k-means

    聚类算法 聚类算法 是 无监督学习 聚类算法有特征,无标签,是无监督分类。 sklearn 聚类模块 cluste...

  • knn 笔记

    经常把knn和kmeans搞混,knn是监督学习,用于分类或回归,kmeans是无监督的聚类模型。 对于knn,这...

  • 10 集成学习;聚类学习分类图像

    聚类无监督学习

  • 算法笔记一:梯度下降线性回归与分类

    算法构成 目前算法模型主要解决回归、分类、聚类问题。也可以通过训练数据集中有无标签分为,有监督学习和无监督学习。下...

  • 深度学习的一些基本概念(一)

    申明:非原创,转载自《有监督学习、无监督学习、分类、聚类、回归等概念》 有监督学习、无监督学习、分类、聚类、回归等...

  • 机器学习-聚类

    简介 前面介绍的线性回归,SVM等模型都是基于数据有标签的监督学习方法,本文介绍的聚类方法是属于无标签的无监督学习...

网友评论

      本文标题:关于无监督、聚类和主题模型

      本文链接:https://www.haomeiwen.com/subject/hhinxhtx.html