美文网首页
余弦相似度计算

余弦相似度计算

作者: 三方斜阳 | 来源:发表于2021-03-13 21:48 被阅读0次

1. 余弦相似度:

余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。
余弦相似度的计算用的很广泛,在NLP计算中,常用来计算词语的相似度,因为词,或者文本表示成分布式向量之后,可以很方便的计算他们的余弦相似度来评估他们的语义相似性。


两个向量的方向重合时夹角余弦取最大值1,当两个向量的方向完全相反夹角余弦取最小值-1,两个方向正交时夹角余弦取值为0,两个向量越相似,余弦相似度越大(接近1).

- scipy

from scipy.spatial.distance import cosine
import numpy as np
a=np.array([1,2,3])
b=np.array([2,2,3])
print(1-cosine(a,b))#cosin() 中参数可以直接是 list

- sklearn 可以对矩阵进行计算

import numpy as np
from sklearn.metrics.pairwise import cosine_similarity
a=np.array([1,2,3]).reshape(1,3)#[[1 2 3]]
b=np.array([2,2,3]).reshape(1,3)#[[2 2 3]]
cosine_similarity(a,b)   
>>array([[0.97230559]])
a=np.arange(15).reshape(3,5)
b=np.arange(20).reshape(4,5)
print(a)
print(b)
cosine_similarity(a,b)   #第一行的值是a中的每第一个行向量与b中每一个行向量之间的余弦相似度
cosine_similarity(a)# a 中的行向量之间的两两余弦相似度
>>
1. 
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]]
2. 
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]
 [15 16 17 18 19]]
3.
[[1.         0.91465912 0.87845859 0.86154979]
 [0.91465912 1.         0.99663684 0.99323905]
 [0.87845859 0.99663684 1.         0.9994114 ]]
4. 
array([[1.        , 0.91465912, 0.87845859],
       [0.91465912, 1.        , 0.99663684],
       [0.87845859, 0.99663684, 1.        ]])

相关文章

  • 余弦相似度计算

    1. 余弦相似度: 余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向...

  • 20-余弦相似度及其R实现

    1 余弦相似度 余弦相似度 (Cosine Similarity) 通过计算两个向量的夹角余弦值来评估他们的相似度...

  • 余弦相似度理解及shengxin中应用

    cosin similarity(余弦相似度) 1,它最常见的应用是计算文本相似度。将文本转换为向量 2,余弦相似...

  • Python 使用sklearn计算余弦相似度

    背景 在计算相似度时,常常用到余弦夹角来判断相似度,Cosine(余弦相似度)取值范围[-1,1],当两个向量的方...

  • 余弦相似度算法与kotlin实现

    余弦相似度计算 余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角...

  • 模型评估——余弦距离的应用

    余弦相似度和余弦距离: 余弦相似度取值范围为[-1,1] 余弦距离:1-余弦相似度,取值为 [0,2] 余弦距离和...

  • NLP详解

    (一)余弦相似度、向量空间模型 1、相似度 • 相似度度量:计算个体间相似程度• 相似度值越小,距离越大,相似度值...

  • Python 计算余弦相似度

    以下代码用到了 numpy 包。代码实现的功能是计算两个向量之间的余弦相似度。我们可以把两个向量想象成空间中的两条...

  • Numpy计算余弦相似度:向量之间,向量与矩阵,矩阵与矩阵

    摘要:Numpy,Python 余弦相似度公式 余弦相似度是衡量向量夹角的余弦值作为相似度度量指标,夹角越小相似度...

  • 相似度计算方法:余弦相似度

    最近接触到了推荐系统 ,在这个专题中,和大家分享一下自己的收获和心得。 基于用户的协同过滤算法 基于用户的协同过滤...

网友评论

      本文标题:余弦相似度计算

      本文链接:https://www.haomeiwen.com/subject/qjqfcltx.html