K-均值算法概述:
首先,我们有一个无标签数据集,我们想要把它们分成两个类,然后我们使用k-均值算法来做:
1、我们选取两个点,称为聚类中心(cluster centroids):
2、遍历所有的点,更靠近哪个聚类中心,就把它归为那一个类中:
3、移动聚类中心到它们自己类的均值处:
4、然后我们继续第2步,遍历所有的点,看它离哪个聚类中心更近就把它归到那一类中:
5、继续第3步,移动聚类中心到它们自己类的均值处:
6、继续第2步:
7、继续第3步:
8、继续第2步:
如此反复,当点的颜色不再变化,我们便认为K均值方法已经收敛了。
输入:
- K(聚类数)
- 训练集{x(1),x(2),......,x(m)}
对于没有明显区分的数据也可以很好的分开:
网友评论