K-Means
1.随机选取k个质心点
2.计算各个点到质心的距离
3.将点的类划分为离他最近的质心,形成K个cluster
4.根据分好类的cluster,在每一个cluster内重新计算质心(平均每个点的值)
5.重复2~4知道满足迭代次数或者误差小于指定的值。
K-Medoids
1.随机选取K个质心的值
2.计算各个点到质心的距离
3.将点的类划分为离他最近的质心,形成K个cluster
4.根据分好类的cluster,在每个cluster内重新计算质心:(将中心点限制在当前的cluster所包含的的据点的集合中,也就是我们将从当前cluster中选取这样一个点——它到其他所有(当前cluster中的)点的距离之和最小)
4.1 计算cluster内所有样本点到其中一个样本点的曼哈顿距离和绝对误差
4.2 选出使cluster绝对误差最小的样本点作为质心点
5.重复迭代2~4步直到满足迭代次数或者误差小于指定的值
区别:k-means的质心是各个样本点的平均,可能是样本点中不存在的点。
k-medoids的质心一定是某个样本点的值。
k-means 和 k-medoids 之间的差异就类似于一个数据样本的均值 (mean) 和中位数 (median) 之间的差异:前者的取值范围可以是连续空间中的任意值,而后者只能在给样本给定的那些点里面选。
2018.9.5
网友评论