美文网首页原生js
统计自然语言处理-预备知识

统计自然语言处理-预备知识

作者: 小妍妍说 | 来源:发表于2018-07-18 11:17 被阅读0次

一、概率论

1.1 期望和方差

​ 期望值是指随机变量所取值的概率平均。

​ 方差是描述该随机变量的值偏离其期望值的程度。

1.2 边缘概率密度

如果二维随机变量的分布函数F{x,y}为已知,那么随机变量x,y的分布函数F𝗑{x}和Fʏ{y}可由F{x,y}求得。则F𝗑{x}和Fʏ{y}为分布函数F{x,y}的边缘分布函数。

边缘密度函数:[图片上传失败...(image-b7d715-1531878274465)]

二、信息论

2.1 信息量

信息量就是不确定度,越是不能判断未来有多少可能,信息度就越大。

2.2 熵

为了让信息可以量化,提出了信息熵的概念。熵就是信息量的集合。

​ 例如我们讨论太阳从哪升起。本来就只有一个结果,我们早就知道,那么无论谁传递任何信息都是没有信息量的。当可能结果数量比较大时,我们得到的新信息才有潜力拥有大信息量。

香农是信息论的创始人,

热力学中,熵指分子运动的混乱度:越混乱,熵越大。

信息论中,熵指一个随机变量的不确定性的数量。(随机变量的值是确定的时候,熵为0)

香农总结出了信息熵的三条性质:

  • 单调性,即发生概率越高的事件,其所携带的信息熵越低。极端案例就是“太阳从东方升起”,因为为确定事件,所以不携带任何信息量。从信息论的角度,认为这句话没有消除任何不确定性。

  • 非负性,即信息熵不能为负。这个很好理解,因为负的信息,即你得知了某个信息后,却增加了不确定性是不合逻辑的。

  • 累加性,即多随机事件同时发生存在的总不确定性的量度是可以表示为各事件不确定性的量度的和。

事件 [图片上传失败...(image-d52a4c-1531878274465)]

同时发生,两个事件相互独立 [图片上传失败...(image-db5158-1531878274465)] ,

那么信息熵 [图片上传失败...(image-2668db-1531878274465)]

如果两个事件不相互独立,那么满足

[图片上传失败...(image-9c14a2-1531878274465)]

,其中 [图片上传失败...(image-3465ad-1531878274465)]

是互信息(mutual information),代表一个随机变量包含另一个随机变量信息量的度量。下面介绍互信息

2.3 互信息

比如一个点到点通信系统中,发送端信号为 [图片上传失败...(image-d70f4c-1531878274465)]

,通过信道后,接收端接收到的信号为 [图片上传失败...(image-332b77-1531878274465)]

,那么信息通过信道传递的信息量就是互信息 [图片上传失败...(image-be7c04-1531878274465)]

。根据这个概念,香农推出了一个十分伟大的公式,香农公式,给出了临界通信传输速率的值,即信道容量:

[图片上传失败...(image-7e4c40-1531878274465)]

2.4 交叉熵

用来衡量估计模型与真实概率分布之间差异情况。模型的交叉熵越小,模型的表现越好。

[图片上传失败...(image-4c4d80-1531878274465)]

2.5 相对熵(KL距离)

对两个事件的不相似性对量,相对熵越大,两个事件的差异越大。

[图片上传失败...(image-11693e-1531878274465)]

2.6 联合熵

描述一对随机变量平均需要的信息量

[图片上传失败...(image-668298-1531878274464)]

2.7 条件熵

  • X确定时,Y的不确定性度量

  • 在X发生是前提下,Y发生新带来的熵。

相关文章

  • 统计自然语言处理-预备知识

    一、概率论 1.1 期望和方差 ​ 期望值是指随机变量所取值的概率平均。 ​ 方差是描述该随机变量的值偏离其期望值...

  • <<数学之美>> part1

    摘要 : [自然语言处理] [基于规则] [基于统计] [统计语言模型] [马尔科夫] [分词] 自然语言处理--...

  • NLP入门之N元语法模型

    在上边我们知道其实当今的自然语言处理的主流趋势是统计自然语言处理,而统计自然语言处理的基本目的就是结合语料库中的一...

  • 自然语言处理

    读书 数学之美 统计学习方法 李航 统计自然语言处理 宗庆成 需要数据结构与算法的知识

  • 决定的方向

    花了不少时间决定了一个方向:自然语言处理。对这个很感兴趣 目前通读了《统计自然语言处理》,瞄了《自然语言处理综论》...

  • 自然语言处理数学基础

    在基于统计方法的自然语言处理研究中,有关统计学和信息论等方面的知识是不可缺少的基础。 1.概率论部分 1.1 概率...

  • 统计自然语言处理

    预备知识 一、概率论 1.1 期望和方差 期望值是指随机变量所取值的概率平均。 方差是描述该随机变量的值偏离其期望...

  • 自然语言处理之概率图模型--预备知识

    概述 本章将介绍一些概率论、图、信息论、马尔可夫等相关基础知识,这些知识点将会贯穿于概率图多个模型的讲解中,在相应...

  • 白话自然语言处理(1)

    这是一个瞎扯淡自然语言处理的系列,讲讲自己的经历以及自然语言处理的基本知识,或片面或错误,纯属扯淡。 我和自然语言...

  • NLP第二篇-数学基础

    在基于统计方法的自然语言处理研究中,有关统计学和信息论等方面的知识是不可缺少的基础,所以这一篇主要回顾一些基本的数...

网友评论

    本文标题:统计自然语言处理-预备知识

    本文链接:https://www.haomeiwen.com/subject/ubonpftx.html