Andrew Ng ML(3)——Logistic回归

作者: tmax | 来源:发表于2018-12-19 17:01 被阅读0次

Andrew Ng ML(3)——Logistic回归
Andrew Ng ML学习总结
ML学习建议(Andrew Ng)
ML.Andrew Ng 4.24
exp函数
ml笔记2: classification and logist
AI数学基础16——训练/验证/测试集
Andrew Ng ML(1)——basic knowledge
Andrew Ng ML(2)——linear regressi
ML. Andrew Ng. 4.28 Ⅱ

Logistic回归（ $0<=h_\theta(x)<=1$ ）——分类算法

$h_\theta(x)=g(\theta^Tx)，g(z)=\frac{1}{1+e^{-z}}$ (Logistic function/sigmoid function)
$h_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}=P(y=1|x:\theta)$

由图可知，当 $\theta^Tx>=0$ 时 $h_\theta(x)>=0.5$ ，y的预测结果为1； $\theta^Tx<0$ 时 $h_\theta(x)<0.5$ ，y的预测结果为0
Decision boundary(决策边界)

$h_\theta(x)=g(\theta^Tx)=g(\theta_0 x_0,\theta_1 x_1... \theta_n x_n)$ ，确定 $\theta$ 的值，就可以确定一个决策边界（ $\theta^Tx=0$ 即为决策边界，决策边界与数据集无关，但是 $\theta$ 是通过数据集拟合得到的)
e.g.

线性决策边界

非线性决策边界

cost function(Logistic regressing)

in linear regressing: $J(\Theta)=\frac {1} {2m}\sum_1^m (h_{\Theta}(x^{(i)})-y^{(i)})^2=\frac{1}{m}\sum_1^m Cost(h_\theta(x),y)$

其中 $Cost(h_\theta(x),y)=\frac{1}{2}(h_{\Theta}(x^{(i)})-y^{(i)})^2$ , $h_\theta(x)=\theta^Tx$

in logistic regressing

$h_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}$ ，若过不改变 $Cost(h_\theta(x),y),$ 则 $J(\theta)$ 图像含有大量局部最小值 $\Downarrow$

适用于logistic regressing的 $Cost(h_\theta(x),y)=\begin{cases}-log(h_\theta(x)) --if:y=1\\-log(1-h_\theta(x))--if:y =0\end{cases}$

当y=1，并且假设函数h趋于0，Cost会趋于无穷（即：结果应该为1，但是预测值却为0，这时候Cost很大用来惩罚算法）

与上图类似

cost fcuntion 的简化以及 $\theta$ 最优解的求法（梯度下降）

$Cost(h_\theta(x),y)=\begin{cases}-log(h_\theta(x)) --if:y=1\\-log(1-h_\theta(x))--if:y =0\end{cases}$
$=-ylog(h_\theta(x))-(1-y)log(1-h_\theta(x))$
因此
$J(\theta)=\frac{1}{m}\sum_1^mCost(h_\theta(x^{(i)}),y^{(i)})$
$=\frac{1}{m}\sum_1^m[-ylog(h_\theta(x^{(i)}))-(1-y^{(i)})log(1-h_\theta(x^{(i)}))]$
$=-\frac{1}{m}\sum_1^m[ylog(h_\theta(x^{(i)}))+(1-y^{(i)})log(1-h_\theta(x^{(i)}))]$

Q:如何求解 $J(\theta)$ 对 $\theta$ 的偏导？

【via:https://www.cnblogs.com/HolyShine/p/6403116.html】

故， $\frac{\partial J(\theta)}{\partial \theta_j}=\frac{1}{m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)}).x_j^{(i)}$

logistic regressing gradient descent

与`线性回归`对应的式子是`相同`的！！！因此，也可以用`线性回归`中的方法来监测`是否收敛`，也可以使用`特征收缩`来使得梯度下降的更快

Advanced optimization (高级优化)——使得最小化logistic regressing中的cost function $J(\theta)$ 更快（相对于Gradient descent）

高级优化算法以及优缺点（主要是速度更快，并且不需要选择α）

Multi-class classification

方法：将一个N分类问题分成N个二元分类问题

e.g.

将样本输入N个分类器，输出概率最高的分类器对应的类别，即为预测的结果

Andrew Ng ML(3)——Logistic回归
Logistic回归（）——分类算法 (Logistic function/sigmoid function)由图...
Andrew Ng ML学习总结
概述断断续续，一个月的时间，把吴老师的机器学习视频教程看完，收获很多，从一无所知到概念的理解、公式的推导、算法的探...
ML学习建议(Andrew Ng)
贴上吴恩达的建议（渣译）来自Bilibili机器学习视频148楼NewConstance用户在社交媒体上关注那些...
ML.Andrew Ng 4.24
机器学习定义近代的定义如下：一个计算机程序叫做机器学习，如果它从任务T的经验E中学习，该程序依赖某种指标P.并且...
exp函数
（Andrew Ng《机器学习》中ex2，Logistic Regression）A是常数我们就不说了，假如A是向...
ml笔记2: classification and logist
笔记中理论部份来自 Andrew Ng 公开课，工程部份来自 spark 1.6. 我的理解 logistic ...
AI数学基础16——训练/验证/测试集
参考文献：Andrew Ng《Setting up your ML application》应用型机器学习，是一...
Andrew Ng ML(1)——basic knowledge
introduction supervised learning(with labels)regressingcl...
Andrew Ng ML(2)——linear regressi
linear regressing with multiple variables(supervised lear...
ML. Andrew Ng. 4.28 Ⅱ
Andrew会花很多时间来教授案例，这样的好处是往往能够避免我们去走别人已经走过的弯路，以便于我们开发机器学习系统...

Andrew Ng ML(3)——Logistic回归

Logistic回归（ $0<=h_\theta(x)<=1$ ）——分类算法

Decision boundary(决策边界)

cost function(Logistic regressing)

in linear regressing: $J(\Theta)=\frac {1} {2m}\sum_1^m (h_{\Theta}(x^{(i)})-y^{(i)})^2=\frac{1}{m}\sum_1^m Cost(h_\theta(x),y)$

in logistic regressing

cost fcuntion 的简化以及 $\theta$ 最优解的求法（梯度下降）

Q:如何求解 $J(\theta)$ 对 $\theta$ 的偏导？

故， $\frac{\partial J(\theta)}{\partial \theta_j}=\frac{1}{m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)}).x_j^{(i)}$

与`线性回归`对应的式子是`相同`的！！！因此，也可以用`线性回归`中的方法来监测`是否收敛`，也可以使用`特征收缩`来使得梯度下降的更快

Advanced optimization (高级优化)——使得`最小化`logistic regressing中的cost function $J(\theta)$ `更快`（相对于Gradient descent）

Multi-class classification

相关文章