24号所看论文知识点的学习
1. PCA降维
论文里的PCA降维主要是用来在构建平衡树的时候使用。因为在构建平衡树的时候需要先将相似的item放在一个节点上,效率才更高,所以需要一个类似聚类的操作。代码中实现了3种方法:knn-based、PCA-based以及random-based。代码中的实验结果发现使用PCA-based效率更高。
PCA(Principal component analysis, 主成分分析)可以用主成分近似的表示原始数据,可以理解为发现数据的原始结构;也可以把数据由少数主成分表示,可以理解为对数据降维。具体的推导,性质和算法略。(可以参考《统计学习方法》)
2. VAE-based embedding
给自己留个坑。还没学。
网友评论