Softmax
我们令 , 定义 softmax 函数为
这样,
Softmax Regression 算法是 Logistic Regression 算法在多分类上的推广,下面考虑 分类问题。假设我们有 个样本 , 令 , , 其中 。将 使用 one-hot 编码形式,仍然记作 , (比如 便可将 改写为一个 维列向量,该列向量中的除了位置 处的元素为 外,其余元素均为 ). 这样 ,
存在仿射映射 , 满足 . 其中 . 对于 中的 个样本,我们可以定义其样本估计所属类别的条件概率为 ()
其中,. 令
根据极大似然估计算法,可定义 Softmax Regression 的损失函数 (交叉熵) 为
其中 表示 的第 个元素, 表示长度为 的全一列向量。 指的是对 中的每个元素求 的操作。
网友评论