美文网首页
用K-Means算法进行文本聚类

用K-Means算法进行文本聚类

作者: Shira0905 | 来源:发表于2017-06-04 12:57 被阅读0次

    K-Means聚类算法

    KMeans算法的基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心,从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。

    K-Means聚类算法主要分为三个步骤:

    • 第一步是为待聚类的点寻找聚类中心

    • 第二步是计算每个点到聚类中心的距离,将每个点聚类到离该点最近的聚类中去

    • 第三步是计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心
      反复执行(2)、(3),直到聚类中心不再进行大范围移动或者聚类次数达到要求为止

    下图展示了对n个样本点进行K-means聚类的效果,这里k取2:
    • 未聚类的初始点集
    • 随机选取两个点作为聚类中心
    • 计算每个点到聚类中心的距离,并聚类到离该点最近的聚类中去
    • 计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心
    • 重复(c),计算每个点到聚类中心的距离,并聚类到离该点最近的聚类中去
    • 重复(d),计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心

    相关文章

      网友评论

          本文标题:用K-Means算法进行文本聚类

          本文链接:https://www.haomeiwen.com/subject/ajuhxxtx.html