美文网首页
word2vec 初步入门(1)---预备知识

word2vec 初步入门(1)---预备知识

作者: 一心一意弄算法 | 来源:发表于2017-06-18 22:03 被阅读42次

知识预备

在了解wrod2vec之前,我们需要了解sigmoid函数,贝叶斯公式,哈夫曼编码等内容。

sigmoid函数

使用过逻辑回归的同学应该了解,是一个定义域为(-∞,+∞),值域为(0,1),其定义为:

image.png

函数图像如下:

image.png

贝叶斯公式

贝叶斯公式是用来描述两个条件概率之间的关系,基于贝叶斯公式的分类方法可以查看我之前写的文章 http://www.jianshu.com/p/7b0ab1bddaf0

哈夫曼(hufuman)编码

赫夫曼编码的具体方法:先按出现的概率大小排队,把两个最小的概率相加,作为新的概率 和剩余的概率重新排队,再把最小的两个概率相加,再重新排队,直到最后变成1。每次相 加时都将“0”和“1”赋与相加的两个概率,读出时由该符号开始一直走到最后的“1”, 将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的赫夫曼编码。

哈夫曼(hufuman)树的构造

简单来说,假设有给定 n个权值{w1,w2,w3,...,wn}, 我们可以把这些通通看成一颗树,每棵树只有一个节点。
1.从这些权值中找出最小的两个,合并构建一棵新的树,这两个权值分别作为新树的左右子树,新树的根节点则是子树根节点和相加。
2.n个权值中去除合并的值,添加新树的值,继续上一步骤,直至所有的权值合并完全。

举个例子:

hufumantree.png

由图可见,权值越大的离根节点越近。

相关文章

  • word2vec 初步入门(1)---预备知识

    知识预备 在了解wrod2vec之前,我们需要了解sigmoid函数,贝叶斯公式,哈夫曼编码等内容。 sigmoi...

  • 探秘Word2Vec(一)-预备知识

    2013年,Google开源了一款用于词向量计算的工具——word2vec,引起了工业界和学术界的关注。首先,wo...

  • 入门级知识

    入门知识_1 入门知识_2 入门知识_3 入门知识4

  • embedding之word2vec

    1. 什么是Word2Vec和Embeddings? Word2Vec是从大量文本语料中以无监督的方式学习语义知识...

  • 2019-11-07 检查gcc交叉编译器预定义宏(ARM32/

    预备知识1 预备知识2https://www.veryarm.com/872.html Ubuntu 安装64位a...

  • 深度学习预备知识(持续更新)

    标签(空格分隔): 计算机视觉 深度学习 1、前言 在进入深度学习之前,究竟需要怎样的预备知识才能比较好地入门,在...

  • 【 数据结构 & 算法 】—— 二叉树、图

    思维导图 预备知识:二叉树定义(★) 预备知识_二叉树定义.cpp 预备知识:二叉树的深度遍历(★) 预备知识_二...

  • 预备知识

    M3内核基本结构 Cortex-M3内核是32位的 M3F103内核采用Thumb-2指令集 支持16/32位指令...

  • 预备知识

    数据仓库定义 数据仓库的基本概念 面向主题的、集成的、非易失的、反应历史变化的,数据集合,用于支持管理决策。 数据...

  • 预备知识

    定义一个结构体,包括邻接结点和边权值,用来表示一条边 用vector表示结点 清空 添加 删除

网友评论

      本文标题:word2vec 初步入门(1)---预备知识

      本文链接:https://www.haomeiwen.com/subject/hlddqxtx.html