美文网首页
算法概论

算法概论

作者: Diamond1995 | 来源:发表于2019-03-30 22:10 被阅读0次

1.监督学习和无监督学习:

监督学习(supervised learning):

    输入数据有特征值和标签值,利用数据去训练一个模型,当新数据来时,可以输出一个预测的标签值。

根据输出值类型不同可以进行分为分类还是回归:

分类常见算法:逻辑回归,CART树,KNN和SVM。

回归常见算法:线性回归,决策树。

无监督学习(unsupervised learning):

输入数据没有标签值,需要模型自己去寻找数据之间的相似点,并归结为一簇。

常见的算法:K-means,DBSCAN。

2.泛化能力:

指一个模型对未知数据的预测能力。

3.过拟合和欠拟合:

过拟合指模型对训练集学习的太多,模型对训练集的预测误差很下,但是模型的泛化能力很差,对测试集的预测能力很差。

解决方法:添加更多的训练集,对于树模型,降低模型的深度,剪枝,对正则化的系数提高,增加对模型的惩罚系数。

欠拟合:模型对训练集预测不够,导致模型的预测误差很大。

解决方法:增加特征数,减少正则化的惩罚系数。提升树的深度。

4.交叉验证:

将数据分为三份,一份训练集,一份验证集,一份测试集。

训练集用于模型的 训练,验证集用于模型的选择,参数的调整。

测试集用于的模型的评估。

5.线性回归的原理:

线性回归模型是基于最小二乘法来进行模型建模的,最小二乘法就是试图寻找一条直线是所有的样本点到直线上的欧氏距离之和最小。

6.线性回归损失函数,代价函数,目标函数。

线性回归是基于均方误差来进行模型求解称为最小二乘法。

7.优化方法-最小二乘法,梯度下降法

通过让损失函数最小,而求解模型最佳参数。

一般有2种方法求解:

1.最小二乘法

:就是直接求损失函数的参数偏导数,令其为0.然后联合方程得到结果。

2.梯度下降法

梯度:对于多元函数来说,把求得的各个参数的偏导数以向量形式写出来,就是梯度。梯度表示函数变化最快的地方。我们只要不断沿着梯度方法,就能找到函数的最小值,前提是函数是凸函数,非凸有可能只能找到局部最小值。

梯度下降法是启发式,迭代进行,最小二乘是直接求解各个参数,梯度下降是逐步求解。

第一步:计算出函数的梯度。

第二步:初始化一个参数值和前进的步长。计算参数的梯度。

第三步:更新向量。

其中如果梯度跟新小于阈值,就停止下降,说明达到的极小值。

8.线性回归的评估指标

模型评估一般用均方误差MSE

或者RMSE:均方根误差,来计算模型的好坏

9.sklearn参数详解

    

相关文章

  • 给我巨大影响的技术书籍

    算法《算法概论》《算法设计与分析基础》 Anany Levitin《算法引论》Udi Manber《算法导论》《什...

  • 算法概论

    题目: 2.14 给定一个含有n个元素的数组,注意到数组中的某些元素是重复的,即这些元素在数组中出现不止一次。给出...

  • 算法概论

    1.监督学习和无监督学习: 监督学习(supervised learning): 输入数据有特征值和标签值,利...

  • 算法概论

    1.算法定义 算法是一组有穷的规则,它规定了解决某一特定类型问题的一系列计算方法 2.算法的五个特性 确定性:无二...

  • 常见算法概论

    前言 算法与数据结构是计算机科学中的核心内容,算法是研究解决问题的方法,而数据结构则是设计一种更好的组织和使用数据...

  • 二、算法概论

    1.概念 算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。 2...

  • 二、算法概论

    数据结构目录 1.概念 算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多...

  • 算法概论笔记 - 图

    现实生活中有很大一类问题可以用简洁明了的图论语言来描述,可以转化为图论问题。 相关定义 图可以表示为G=(V, E...

  • 《算法概论》习题8.10

    a. 令图G 为一个环,环上的顶点数等于图 H 的顶点数。那么若G 是 H 的同构子图,则说明 H 存在 Rudr...

  • 常用密码算法

    概论 在平时的开发过程中,我们基本上会使用到对称加解密算法,非对称加解密算法以及摘要算法。虽然有很多轮子可供开发者...

网友评论

      本文标题:算法概论

      本文链接:https://www.haomeiwen.com/subject/rmgsbqtx.html