美文网首页
2019-01-21 k均值的优化目标

2019-01-21 k均值的优化目标

作者: 奈何qiao | 来源:发表于2019-01-21 11:39 被阅读0次

K均值的优化目标函数能帮助我们调试学习算法, 确保K均值算法是在正确运行中。

当K均值正在运行时,将对两组变量进行跟踪。首先是 c(i):它表示的是当前的样本 x(i) 所归为的那个簇的索引或者序号;另外一组变量用 μk 来表示, 第 k 个簇的聚类中心。 

  \mu _{c(i)} 来表示x(i) 所属的那个簇的聚类中心。例如:假如说x(i) 被划为了第5个簇, x(i) 的序号也就是 c(i) 等于5。因为 c(i) = 5 表示的就是x(i) 这个样本被分到了第五个簇,因此μ 下标 c(i) 就等于 μ5 。所以,这里的 μc(i) 就是第5个簇的聚类中心。

K均值对象

红色框出了这部分也即每个样本 x(i) 到 x(i) 所属的聚类簇的中心距离的平方值。

这个代价函数在K均值算法中有时候也叫做失真代价函数。

选择 c(1) c(2) 一直到 c(m)来最小化这个代价函数, 这个过程就是把这些点划分到离它们最近的那个聚类中心,因为这样才会使得点到对应聚类中心的距离最短。

说这一步是选择了能够最小化 J 的 μ 的值。 最小化代价函数 J 关于,这里的 wrt 表示with respect to (关于) 。因此是最小化 J 关于所有聚类中心的位置 μ1 到 μK。

 K均值算法实际上是把这两组变量在这两部分中分割开来考虑,分别最小化 J 。首先是 c 作为变量,然后是 μ 作为变量,那么 K均值的工作就是,首先关于 c 求 J 的最小值,然后关于 μ求 J 的最小值,然后反复循环。这就是 K均值算法。

 K均值算法

相关文章

网友评论

      本文标题:2019-01-21 k均值的优化目标

      本文链接:https://www.haomeiwen.com/subject/rszqjqtx.html