数据:
image.png需求:预测贷款额度
已知:工资,年龄
分析:额度是未知数y,工资,年龄是已知数x1,x2(特征)
找出y与x1,x2的关系,y=f(x1,x2),就可以预测贷款额度咯
假设:
y(x) = α1 * x1 + α2 * x2 + θ 【线性回归】
α1是x1的权重, α2是x2的权重,θ是偏移量
image.png
一段话:
有许多特征 a ,b , d ....n
这些特征描述了一种情况 y
所以 在已知的数据中, y = f(a ,b , d ....n),特征与结论有某种关系,这种关系用f表示
我们目的是找到这种关系f,来帮助预测,但不关注f,重心在预测
线性回归,就是描述了这些特征与结论用一种线性关系来表达
预测的y*
真实的y_
y_ = y* + θ 有个误差
利用这个误差,来反向逼近预测
而这个误差,建立模型,就是高斯分布
因为高斯面积是1,代表整个预测,高斯函数
g(θ) = xxx
到g(θ)取max时,θ就越趋近0
似然函数 就是高斯函数相乘 g(θ)g(θ)...*
所以是 最大似然,就是为了让θ最趋近于0
为了方便求解,log似然,乘法变加法
加法的结果就是 a - b 形式
那么 b应该尽量小 , 这里的 b 就是 J(θ)----目标函数 (y_ - y*)^2 就是误差的平方
y* = θ^T·X
(y_ - θT·X)2 取最小值
对θ求偏导
网友评论