1.基本概念
softmax regression是logistics regression的一般形式,两者都用于解决分类问题。区别在于,logistic regression一般用来解决二分类问题,而softmax regression 用来解决多分类问题。举例:
分类问题:根据给出的图像判断图中的动物为猫、狗还是鸡。
输入:2*2的图片,对应四象素为
标签:猫,狗,鸡,对应的离散值为
参数:
softmax 回归是一个简单的神经网络计算公式:
假设最终,通过比较数值大小可知,该动物为猫。
输出问题:1.输出值大小不确定,没有具体含义。
2.真实值是离散值,与不确定范围的输出值之间的误差难以衡量。
解决办法:softmax operator。将一个K维的任意实数向量压缩(映射)成另一个K维的实数向量,其中向量中的每个元素取值都介于(0,1)之间并且和为1。 是不是有点像Logistic 中sigmod函数?
最终,输出值为。由此可知,该图中动物存在0.88的概率为猫,0.12的概率为狗,几乎不可能是鸡。因此该图中动物根据分类结果显示为猫。
网友评论