通常计算相似度的算法有3种:
- 纳尔逊相关系数
- 欧氏距离或者曼哈顿距离
- 余弦相似度
我们可以根据数据的特性做成如下选择:
如果数据受分数贬值(grade-inflation,即不同用户使用不同的评级范围)的影响,则使用皮尔逊相关系数。
如果数据稠密(几乎所有属性都没有零值)且属性值大小十分重要,那么使用诸如欧氏距离或者曼哈顿距离。
如果数据稀疏,考虑使用余弦相似度。
通常计算相似度的算法有3种:
本文标题:如何选择计算相似的算法
本文链接:https://www.haomeiwen.com/subject/cfqbextx.html
网友评论