可以看到,在鸢尾花数据集中二分k-medoids的效果比k-means要差,这是因为鸢尾花数据集的分布规律体现不出k-medoids的优势,在因此针对不同数据分布选取不同的聚类方法十分重要。
另外,基于密度的dbscan在鸢尾花数据中表现最差,一部分是因为数据的分布不利于密度聚类,还有一部分原因是调参。eps和min_examples这两个参数的值对聚类结果影响很大,这里使用默认的参数,因为我越调结果越差。
可以看到,在鸢尾花数据集中二分k-medoids的效果比k-means要差,这是因为鸢尾花数据集的分布规律体现不出k-medoids的优势,在因此针对不同数据分布选取不同的聚类方法十分重要。
另外,基于密度的dbscan在鸢尾花数据中表现最差,一部分是因为数据的分布不利于密度聚类,还有一部分原因是调参。eps和min_examples这两个参数的值对聚类结果影响很大,这里使用默认的参数,因为我越调结果越差。
本文标题:鸢尾花
本文链接:https://www.haomeiwen.com/subject/dojnihtx.html
网友评论