别慌,我们不是讲数学。 :)
作为生活在三维向量中的生物,我们容易理解我们身处的三维世界,对一张平面、一条线也可以理解,而零维的一个点,似乎好好想一下也可以想通,可是,我们很难理解四维空间,有人说宇宙的最高维度是11维,我们不妨把超过这个维度的,我们事实上根本不可能理解的维度称为“甚高维”。
其实,如果像信息领域中使用的成百上千维的向量,实际上已经脱离了“向量”“空间”之类概念的原本意义,成为一种“泛化”的向量。
那么我们为何使用这种既没有物质指代,也不可能理解的东西呢?
在查询文档或文本时,我们可能会使用向量表示,这时,一个单词都可以成为一个单一的维度,这样就构成了一种相关性模型,在这种模型中,信息关键的指标是它的余弦相关值(放心,我们真的不是讲数学),相关值越接近1,文档与查询内容的相关性就越大。
在之后几天,我们会大略讲一下Vector这个类。
在书里,vector之前还讲述了一下Vector2d类,而且还颇费周章写了如何让两个类兼容,当然以本菜鸡自己的眼光来看,vector2d的学习意义大而实用意义不如vector,因为本菜鸡最近一直在刷Leetcode,所以还是写点常用的,如果要好好学Python,Vector2d还是很重要的。
网友评论