前言

作者: 水墨点滴 | 来源:发表于2018-09-24 23:11 被阅读0次

梳理统计学习相关的体系

进入统计机器学习模型部分,首先从最基础的从回归分析说起。

1.回归分析

回归分析大家相对来说都已经比较了解,本质上说是以用数据去拟合自变量与解释变量之间的线性关系。是后续各种统计学习模型的基础。本部分对此不做详细介绍,这次从最小二乘的几何意义角度去看回归分析。

Y = X’B
我们知道最终的估计满足 (y-X\hat\beta)^TX=0。所以从几何角度上看,最优估计是在空间上的正交投影

回归分析的几何解释

统计/回归分析中的的一些基本概念:

  • t 检验
  • F 检验
  • p value
  • 多重共线性

关于统计基础以及其在工作中的常用应用,可参见(##先占坑)

2.正则化处理

训练数据是有限的时候,总可以通过增加参数的方法提高模型复杂度,降低训练误差,但是其泛化能力不好。正则化即通过调整参数的取值,来平衡偏差方差的关系。

线性回归中,最直接的方法就行在loss function中添加正则化项。一般形式如下:

E(w) = \sum [f(x_i, w) - y_i]^2 + \lambda g(||w||_p)

  • 当取一范数时,即为lasso;
  • 二范数:岭回归
  • 一范数和二范数组合:弹性网络。 a||w||^2_2 + (1-a)||w||_1

一范数和二范数的几何意义区别如下(这里就不解释了):

  • lasso会将特征衰减到0
  • 岭回归大量特征系数都比较小
  • 弹性网络结合了两种方法的优点
lasso与岭回归的对比

从概率不同学派的角度来看上面的问题。
正则化的方式,是从频率学派角度来看;而贝叶斯学派视角来看,正则化其实就是引入了关于参数的先验信息。

贝叶斯学派是假定参数服从某种分布,然后根据其分布利用积分的方法将其消除掉。这一过程叫边际化。边际化的过程其实恰好是正则化/泛化的过程。

可以证明,岭回归是w满足正态分布,lasso是当w满足拉普拉斯分布时候通过最大后验概率得到的估计结果。

# code
import numpy as np
import matplotlib.pyplot as plt  
from sklearn.linear_model import Lasso,LassoCV,LassoLarsCV   # Lasso回归,LassoCV交叉验证实现alpha的选取,LassoLarsCV基于最小角回归交叉验证实现alpha的选取

# ========Lasso回归========
model = Lasso(alpha=0.01)  # 调节alpha可以实现对拟合的程度
# model = LassoCV()  # LassoCV自动调节alpha可以实现选择最佳的alpha。
# model = LassoLarsCV()  # LassoLarsCV自动调节alpha可以实现选择最佳的alpha
model.fit(X, y)   # 线性回归建模
print('系数矩阵:\n',model.coef_)
print('线性回归模型:\n',model)
# print('最佳的alpha:',model.alpha_)  # 只有在使用LassoCV、LassoLarsCV时才有效
# 使用模型预测
predicted = model.predict(X)

相关文章

  • 前言的前言

    真想不到,我已开始提笔写前言了。然而一切都还没有呢,所以只好叫前言的前言了。 正因为一切都还没有,我更要在此时写下...

  • 前言的前言

    在生物定量化大潮的前夕,我想整理一下近现代生物的发展脉络。可能是个比较大的工程。由于越接近现代,生物学的分支越庞杂...

  • 不算前言的前言

    不知从何时起,就有个写作梦,走到哪里就想记录下哪里的心情。 永远分裂成两个自己,一个阳光明媚,一个...

  • 不算前言的前言

    终于攒够了50个简书贝,可以开连载了。 之前在自己的书院做过一期专题,把一些有趣的或是被人误解的历史人物,拿出来梳...

  • 不是前言的前言

    曾有一个小小的心愿,期待着能够有一本自己的作品,然而,作为一个学习者,要写出一本书谈何容易?看看别人写的东西都挺好...

  • 前言

    最开始接触网页制作,是从前端三大件(html+css+javascript)开始。稀里糊涂半生不熟,能做出静态页面...

  • 前言

    历史就是这样,离得越远细节越模糊,但脉络越清晰。 大约50亿年前,在银河系的一个旋臂上,一颗被我们称为太阳的恒星诞...

  • 前言

    大家好!我是行知而立,师范出身,现为人民教师一名。经常听到很多的学弟学妹们向我请教,说作为一名师范生,要考教师资格...

  • 前言

    我曾经是一个软件开发工程师,在日企待了一年后,我看不到自己的前景,而且莫名其妙地会有一种躁动,在每日加班的高压下,...

  • 前言

    自从有了你,我的世界一片粉红,还透着酸臭的气息。 打算从这里,把我和我记的点点滴滴写成故事,原谅我觉得太过于幸福,...

网友评论

      本文标题:前言

      本文链接:https://www.haomeiwen.com/subject/mdahoftx.html