FM算法旨在解决稀疏数据下的特征组合问题。
多项式模型的特征组合要求两个特征都是非零的,但是在实际工程中的稀疏数据中这种样本非常少。
FM模型对稀疏数据有更好的学习能力,通过交互项可以学习特征之间的关联关系,并且保证了学习效率和预估能力。
将Wij拆解成vi与vj的向量点积,此时就不必要求xi与xj一定要同时非零的样本出现了,因为即使没有这种样本,假设有xh与xj的同时非零的样本存在,xk与xi同时非零的样本的存在,我们可以学到vh、vj、vk、vi。这样获得了vi与vj,就获得了曾经的wij。(此处用曾经的wij并不准确,只是方便理解这个曲线救国的过程。)
网友评论