美文网首页
如何选择计算相似的算法

如何选择计算相似的算法

作者: 编程回忆录 | 来源:发表于2017-09-28 22:54 被阅读0次

通常计算相似度的算法有3种:

  • 纳尔逊相关系数
  • 欧氏距离或者曼哈顿距离
  • 余弦相似度
    我们可以根据数据的特性做成如下选择:
    如果数据受分数贬值(grade-inflation,即不同用户使用不同的评级范围)的影响,则使用皮尔逊相关系数。
    如果数据稠密(几乎所有属性都没有零值)且属性值大小十分重要,那么使用诸如欧氏距离或者曼哈顿距离。
    如果数据稀疏,考虑使用余弦相似度。

相关文章

  • 如何选择计算相似的算法

    通常计算相似度的算法有3种: 纳尔逊相关系数 欧氏距离或者曼哈顿距离 余弦相似度我们可以根据数据的特性做成如下选择...

  • [转发]技术人员的发展之路|陈皓|左耳朵耗子

    2012年的时候写过一篇叫《程序算法与人生选择》的文章,我用算法来类比如何做选择,说白了就是怎么去计算,但是并没有...

  • 技术人员的发展之路

    2012年的时候写过一篇叫《程序算法与人生选择》的文章,我用算法来类比如何做选择,说白了就是怎么去计算,但是并没有...

  • 技术人员的发展之路

    2012年的时候写过一篇叫《程序算法与人生选择》的文章,我用算法来类比如何做选择,说白了就是怎么去计算,但是并没有...

  • 数据结构与算法之美 复杂度分析上

    [数据结构与算法之美:如何分析、统计算法的执行效率和资源消耗?(03)] 一、如何分析、统计算法的执行效率和资源消...

  • 散列表 (哈希表)

    1. 哈希算法 如何选择哈希算法: 计算公式花费的时间 关键字的长度 散列表大小 关键字分布情况 记录查找概率 1...

  • 数据结构与算法-散列表(哈希表)

    1. 哈希算法 如何选择哈希算法: 计算公式花费的时间 关键字的长度 散列表大小 关键字分布情况 记录查找概率 1...

  • 技术人员的发展之路

    之前写过一篇叫《程序算法与人生选择》的文章,我用算法来类比如何做选择,说白了就是怎么去计算,但是并没有讲程序员可以...

  • Spark RDD持久化级别

    RDD持久化用于RDD重用和节省重新计算,方便构建迭代算法,缓存粒度为整个RDD 持久化级别 如何选择存储级别? ...

  • 前端面试题总结【8】:CSS面试必问点!

    CSS 选择符有哪些?哪些属性可以继承?优先级算法如何计算? CSS3新增伪类有那些? CSS 选择符:1.id选...

网友评论

      本文标题:如何选择计算相似的算法

      本文链接:https://www.haomeiwen.com/subject/cfqbextx.html