之前B哥告诉我们,写博客是为了让别人能看得懂,不是为了自己记笔记的。简书暂时充当了我的博客功能吧。很久没有写简书了,这段时间学习了挺多东西的,有时间就来码一点。
最近在学习机器学习的内容,之前看了一本Spark MLlib机器学习,虽然有些算法的原理,但是讲的不深,于是开始看CS229的公开课,辅以李航的统计学习方法和周志华的西瓜书。
首先在介绍这写之前,要引入一个概念:广义线性模型(插入公式真累)
![](https://img.haomeiwen.com/i3007136/c8087388e83201da.png)
其中广义线性模型是假设每个观测值y都来自一个指数族分布。比如伯努利分布写成广义线性模型就是
![](https://img.haomeiwen.com/i3007136/92999f9d8ac31c9f.png)
同样的,高斯分布写成广义线性模型就是
![](https://img.haomeiwen.com/i3007136/a94040a3ed749b23.png)
对于广义线性模型的假设,是使
![](https://img.haomeiwen.com/i3007136/3e55cffba949eb4e.png)
使得可以用回归模型拟合曲线。
例如,对于逻辑回归
![](https://img.haomeiwen.com/i3007136/5093f6e382efa4c5.png)
对于线性回归
![](https://img.haomeiwen.com/i3007136/f71db4befa114053.png)
网友评论