美文网首页
如何选择计算相似的算法

如何选择计算相似的算法

作者: 编程回忆录 | 来源:发表于2017-09-28 22:54 被阅读0次

    通常计算相似度的算法有3种:

    • 纳尔逊相关系数
    • 欧氏距离或者曼哈顿距离
    • 余弦相似度
      我们可以根据数据的特性做成如下选择:
      如果数据受分数贬值(grade-inflation,即不同用户使用不同的评级范围)的影响,则使用皮尔逊相关系数。
      如果数据稠密(几乎所有属性都没有零值)且属性值大小十分重要,那么使用诸如欧氏距离或者曼哈顿距离。
      如果数据稀疏,考虑使用余弦相似度。

    相关文章

      网友评论

          本文标题:如何选择计算相似的算法

          本文链接:https://www.haomeiwen.com/subject/cfqbextx.html