算法原理
LogisticRegression,明明是个分类问题,为什么叫逻辑回归呢?
线性回归
对于0-1分类问题,需要将预估值限制在0-1之间,但是的值域是,所以要将值域限制在
恰巧有一个函数 的定义域是 ,值域是,所以逻辑回归定义
极大似然估计
极大似然函数
对n个样本做最大似然估计
上式可以看出,似然函数最大化等价于损失函数最小化
对数损失函数
损失函数形式
多数二分类问题都用对数损失函数,对数损失函数有以下四种形式
上式2的推导可以直接代入求解得到
以下阐述式3推倒,式4由式3推倒得到
损失函数推导
设预估为1的概率
那预估为0的概率为
那么预估正确的概率为
目标就是让预估尽可能正确
所以损失函数可以定义为
待扩展
- 最大熵模型
网友评论