美文网首页
聚类算法

聚类算法

作者: 景宝宝1号 | 来源:发表于2018-08-14 20:41 被阅读0次

    常见的六大聚类算法:

    https://blog.csdn.net/Katherine_hsr/article/details/79382249

    K-means算法优点:

    (1)、是解决聚类问题的一种经典算法,简单、快速

    (2)、对处理大数据集,该算法保持可伸缩性和高效性

    (3)、当簇接近高斯分布时,它的效果较好。

    K-means算法缺点:

    (1)、在簇的平均值可被定义的情况下才能使用,可能不适用于某些应用;

    (2)、在 K-means 算法中 K 是事先给定的,这个 K 值的选定是非常难以估计的。很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适;

    (3)、在 K-means 算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化。这个初始聚类中心的选择对聚类结果有较大的影响,一旦初始值选择的不好,可能无法得到有效的聚类结果;

    (4)、该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的;

    (5)、若簇中含有异常点,将导致均值偏离严重(即:对噪声和孤立点数据敏感);

    (6)、不适用于发现非凸形状的簇或者大小差别很大的簇。

    聚类算法之高斯混合模型:

    https://www.jianshu.com/writer#/notebooks/28488802/notes/32241552

    相关文章

      网友评论

          本文标题:聚类算法

          本文链接:https://www.haomeiwen.com/subject/bpjubftx.html