美文网首页
其他知识点

其他知识点

作者: 潇萧之炎 | 来源:发表于2019-09-20 00:54 被阅读0次

一、最大熵模型与逻辑回归:都是求的最大似然概率

https://www.jianshu.com/p/e7c13002440d
最大熵思想是什么
最大熵模型是如何运用最大熵思想的
分类模型有判别模型和生成模型两种,判别模型是要学习一个条件概率分布 P(y|x)。
总结来说,最大熵的思想是,当你要猜一个概率分布时,如果你对这个分布一无所知,那就猜熵最大的均匀分布,因为均匀分布总是同类分布中熵最大的分布。
如果你对这个分布知道一些情况,那么,最好的分布就是符合这个经验知识的前提下,熵最大的分布。
区别:
我们从最大熵的思想出发得出的最大熵模型,最后的最大化求解就是在求P(y|x)的对数似然最大化。
逻辑回归也是在求条件概率分布关于样本数据的对数似然最大化。二者唯一的不同就是条件概率分布的表示形式不同。

概率分布是对随机变量的刻画,不同的随机变量有着相同或不同的概率分布,熵,就是对不同概率分布的刻画!
本质上,是为了描述不确定的程度,并以此对不同的概率分布进行比较。

二、归一化与标准化

1.是什么
归一化就是将训练集中某一列数值特征(假设是第i列)的值缩放到0和1之间
标准化就是将训练集中某一列数值特征(假设是第i列)的值缩放成均值为0,方差为1的状态。
归一化和标准化的相同点都是对某个特征(column)进行缩放而不是对某个样本的特征向量(row)进行缩放。
也就是只能对列进行缩放,不能对行缩放。对特征向量进行缩放是毫无意义的,比如三列特征:身高、体重、血压
每一条样本(row)就是三个这样的值,不能将身高、体重和血压混到一起去!

2.区别
标准化是更常用的手段,归一化的应用场景是有限的。
(1)标准化更好保持了样本间距。当样本中有异常点时,归一化有可能将正常的样本“挤”到一起去
(2)标准化更符合统计学假设。对一个数值特征来说,很大可能它是服从正态分布的

3.逻辑回归必须要进行标准化吗?
(1)如果你不用正则,那么,标准化并不是必须的,如果你用正则,那么标准化是必须的。
(2)如果不用正则,那么标准化对逻辑回归好处。
进行标准化后,得出的参数值的大小可以反应出不同特征对样本label的贡献度,方便进行特征筛选。如果不做标准化,是不能这样来筛选特征的。
(3)做标准化注意事项。
最大的注意事项就是先拆分出test集,不要在整个数据集上做标准化,因为那样会将test集的信息引入到训练集中。
如果不剔除,标准化后的训练集实际上是受到test集的影响的,学到了test集的特征,相当于剧透了。

三、残差

https://baijiahao.baidu.com/s?id=1623788086443170342&wfr=spider&for=pc

首先,我们需要明确几个概念:
越深层次的神经网络就能提取更潜藏的数据特征(在不损失广度的情况下)
数据特征是以每层的权重矩阵来表示的
权重矩阵是根据反向传播训练的
反向传播基本等同于梯度(导数)优化

相关文章

  • 其他知识点

    一、最大熵模型与逻辑回归:都是求的最大似然概率 https://www.jianshu.com/p/e7c1300...

  • typeScript--其他知识点

    ! 表示一个值一定存在,这有点像as关键字,由开发者决定而不是让ts推断 ? 用于安全的访问一个对象 一般在...

  • 复习《高难度沟通》课程

    复习模板: 日期: 分享者: 复习章节: 个人对知识点的理解: 知识点适用场景(事例说明): 可以链接的其他知识点...

  • 19/1/1 第一周小结

    计划下一周读完其他的课程。周末补充,C语言和C++其他知识点

  • PL/SQL基础知识详解

    PL/SQL 这是对Oracle-SQL知识点详细介绍的文章系列,其他文章如下: Oracle-SQL系列知识点(...

  • 2019-05-10

    目录 一、基础知识点 二、第三方框架 三、算法 四、编码格式(优化细节) 五、其他知识点 一、基础知识点 1、设计...

  • 分享3

    哪些是给学其他知识做铺垫的?哪里是知识点的重点?中考着重考的是哪些知识点?这些知识点在中考的难度又到什么程度...

  • vue其他知识点简单记录

    路由: 过渡动画 组件 数据绑定 事件 方法:事件可以调用方法 子父组件传值 插槽 动态组件

  • 其他知识点(Math和Date)

    Math Math为js内置的一个对象。其中有很多的方法,比如Math.random() Math.random(...

  • JVM知识点——其他知识梳理

    其他知识梳理 详解分代回收 前面提到过,java的堆内存被分代管理,分代管理主要是为了方便垃圾回收,这样做基于2个...

网友评论

      本文标题:其他知识点

      本文链接:https://www.haomeiwen.com/subject/eeeductx.html