机器学习必刷题-手撕推导篇(3)：FM与softmax

机器学习必刷题-手撕推导篇(3)：FM与softmax

作者: arrnos | 来源:发表于2019-08-03 13:06 被阅读1次

机器学习必刷题-手撕推导篇(3)：FM与softmax
机器学习必刷题-手撕推导篇(2)：BP算法推导
机器学习必刷题-手撕推导篇(1)：逻辑回归与k-means
Logistic Regression
2019-11-28
2018-10-28
5.machine_learning_LR_Softmax
复习之路
LeetCode刷题DAY 3：罗马数字转整数
支持向量机（SVM）入门理解与推导

本系列文章对常见的机器学习面试题进行了搜集、分类和整理，主要包括”手撕推导篇“、“模型比较篇”、“工程经验篇”以及“基础概念篇”等多个板块，旨在帮助广大算法工作者能够从容应对求职面试！

推导FM

(1) 线性拟合(LR)

image
缺点： 线性拟合无法自动表示特征的相互组合，组合特征都是通过人工特征工程加入的，费时费力。

(2) Poly2

在LR基础上，加入任意两个特征之间的关系其中，wij是feature pair（xi,xj）的权重，只有xi和xj都非零时，组合特征xixj才有意义。

由于样本数据非常稀疏，满足“xi和xj都非零”的样本将会非常少，很容易导致参数wij不准确，严重影响模型性能。

缺点：

参数空间大幅增加，由线性增加至平方级，训练效率极低且容易内存溢出； - 在数据稀疏的场景下，二次项系数难以充分训练。 - 当样本量不足以训练巨大的参数空间时，非常容易过拟合；

(3) FM

FM将wij分解为两个向量的内积：

image

其中，vi是一个k维向量。直观上看，FM的复杂度为O(kn2)，但是通过下式，FM的二次项可以化简，其复杂度可以优化到O(kn)。由此可见，FM可以在线性时间对新样本做出预测。

划重点：FM推导过程

(1) 根据矩阵对称性

image
(2) f求和项可以单独出来，而且

image

FM的优势：

参数的数量大幅度缩减，从n×(n−1)/2降低到nk； - 隐向量的点积可以表示原本两个毫无相关的参数之间的关系； - 可以解决稀疏向量问题，因为每个特征都有一个隐向量，就算是稀疏向量在训练样本没有出现过的组合在预测时也可以进行计算。

推导softmax

1、softmax函数

softmax回归是LR在多分类问题上的推广，一般用于神经网络的输出层，叫做softmax层。

假设在进入softmax函数之前，模型的全连接网络输出为：

image

其中，C为类别的个数。则对每个样本，它属于类别 i 概率为：

image

image

更详细地如下图所示：

image

2、softmax求导

对softmax函数进行求导，即求:

image

第 i 项的输出 yi 对j项输入 aj 求导。

代入softmax函数表达式，可以得到：

image

因此，

当 i = j 时：

image

当 i != j 时：

img

image

3、结合交叉熵loss求导

对一个样本来说，真实类标签分布与模型预测的类标签分布可以用交叉熵来表示：

image

最终，对所有的样本，我们有以下loss function：

img

img

更多参考：

softmax详细推导(简单实例)：https://www.cnblogs.com/zongfa/p/8971213.html image

相关文章

机器学习必刷题-手撕推导篇(3)：FM与softmax
本系列文章对常见的机器学习面试题进行了搜集、分类和整理，主要包括”手撕推导篇“、“模型比较篇”、“工程经验篇”以及...
机器学习必刷题-手撕推导篇(2)：BP算法推导
本系列文章对常见的机器学习面试题进行了搜集、分类和整理，主要包括”手撕推导篇“、“模型比较篇”、“工程经验篇”以及...
机器学习必刷题-手撕推导篇(1)：逻辑回归与k-means
本系列文章对常见的机器学习面试题进行了搜集、分类和整理，主要包括”手撕推导篇“、“模型比较篇”、“工程经验篇”以及...
Logistic Regression
推导 sigmoid 推导LR损失函数推导LR梯度下降 Softmax原理 softmax 损失函数 softm...
2019-11-28
softmax运算_360搜索机器学习——softmax计算 - 简书概率与统计——条件概率、全概率、贝叶斯、...
2018-10-28
机器学习之Softmax回归模型 Softmax在机器学习中有非常广泛的应用，但是刚刚接触机器学习的人可能对Sof...
5.machine_learning_LR_Softmax
机器学习逻辑回归与softmax 补充阅读资料：吴恩达老师机器学习课程笔记[https://github.com...
复习之路
总共分为五大部分：论文细节及其扩展的深度学习知识项目细节机器学习基础知识算法题（手撕代码） Linux常见...
LeetCode刷题DAY 3：罗马数字转整数
原文链接：LeetCode刷题DAY 3：罗马数字转整数微信公众号：机器学习养成记 LeetCode刷题第三天。...
支持向量机（SVM）入门理解与推导
首先推荐：机器学习实战教程（八）：支持向量机原理篇之手撕线性SVM机器学习实战教程（九）：支持向量机实战篇之再撕非...

网友评论

本文标题：机器学习必刷题-手撕推导篇(3)：FM与softmax

本文链接：https://www.haomeiwen.com/subject/nsrjdctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

机器学习与数据挖掘

机器学习和人工智能入门

热点阅读

机器学习与数据挖掘

机器学习

机器学习和人工智能入门

关于我们|服务条款|联系我们|机器学习必刷题-手撕推导篇(3)：FM与softmax|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！