Syntagmatic 关系发现:熵

作者: 朱小虎XiaohuZhu | 来源:发表于2015-06-15 20:36 被阅读283次

Neil Zhu,简书ID Not_GOD,University AI 创始人 & Chief Scientist,致力于推进世界人工智能化进程。制定并实施 UAI 中长期增长战略和目标,带领团队快速成长为人工智能领域最专业的力量。
作为行业领导者,他和UAI一起在2014年创建了TASA(中国最早的人工智能社团), DL Center(深度学习知识中心全球价值网络),AI growth(行业智库培训)等,为中国的人工智能人才建设输送了大量的血液和养分。此外,他还参与或者举办过各类国际性的人工智能峰会和活动,产生了巨大的影响力,书写了60万字的人工智能精品技术内容,生产翻译了全球第一本深度学习入门书《神经网络与深度学习》,生产的内容被大量的专业垂直公众号和媒体转载与连载。曾经受邀为国内顶尖大学制定人工智能学习规划和教授人工智能前沿课程,均受学生和老师好评。

Syntagmatic 关系发现:熵

Paste_Image.png

Syntagmatic 关系 = 相关共现

当“eats”出现时,其他什么样的词同样可能会出现。

Paste_Image.png

推测“eats”的左边和右边会出现什么词?

词的预测:直觉

预测问题:词 W 出现(不出现)在这个分段中?

Paste_Image.png

词的预测:形式化定义

Paste_Image.png

X_w 越是随机,预测的难度就越高
那么如何来量化地度量诸如 X_w 的随机性呢?

熵 H(X) 度量了 X 的随机性

Paste_Image.png

熵 H(x) :抛硬币

Paste_Image.png

公平的硬币其熵非常的高,偏差的硬币则相反。

用于词预测的熵

Paste_Image.png

熵高的词更难被预测对。而熵低的词如 the 则由于其出现的概率接近 1 所以非常容易预测,然而这并没有什么用。

相关文章

  • Syntagmatic 关系发现:熵

    Neil Zhu,简书ID Not_GOD,University AI 创始人 & Chief Scientist...

  • 机器学习与模式识别 整理 2015-6-30

    深度学习和图模型Deep Learning-complex structure Syntagmatic 关系发现:...

  • Syntagmatic 关系发现:互信息

    Neil Zhu,简书ID Not_GOD,University AI 创始人 & Chief Scientist...

  • 文本挖掘第二周

    文本挖掘第二弹 本周目标 正式上车 一 组合关系发现和熵(单词关联挖掘) 1.1熵函数 一个词相随出现的概率定义:...

  • 联合信息熵和条件信息熵

    下面这几个熵都是描述联合分布中的两个变量相互影响的关系。 联合信息熵 联合信息熵的定义如下: 条件信息熵 条件信息...

  • 香农熵

    香农熵,又称信息熵,熵,可以用来代表某数据集合的不一致性。熵的值越高,则代表数据集的不一致性越高。 熵与概率的关系...

  • 人工智能通识-科普-信息增益-2

    欢迎关注我的专栏( つ•̀ω•́)つ【人工智能通识】 信息量、信息熵、条件熵、信息增益的关系是怎样的? 信息熵与信...

  • 一、看文章 “熵”不起:从熵、最大熵原理到最大熵模型(一)“熵”不起:从熵、最大熵原理到最大熵模型(二)“熵”不起...

  • 读《心流》:自造内心秩序之途(二)

    米哈里借鉴物理学概念‘熵’提出了精神熵。而精神熵的反面就是最优体验,也就是心流。米哈里在调查中发现,更多的心流出现...

  • 熵减:华为活力之源-读书笔记

    熵减:华为活力之源 第一部分 理论探索篇 华为之熵,光明之矢 露道夫•克劳修斯发现热力第二定律时,定义了熵。自然社...

网友评论

本文标题:Syntagmatic 关系发现:熵

本文链接:https://www.haomeiwen.com/subject/fdqsqttx.html