美文网首页
数据结构-哈夫曼树

数据结构-哈夫曼树

作者: 鼬殿 | 来源:发表于2020-07-07 17:01 被阅读0次

哈夫曼编码(Huffman Coding)

◼ 哈夫曼编码,又称为霍夫曼编码,它是现代压缩算法的基础
◼ 假设要把字符串【ABBBCCCCCCCCDDDDDDEE】转成二进制编码进行传
可以转成ASCII编码(65~ 69,1000001~1000101),但是有点冗长,如果希望编码更短呢?
可以先约定5个字母对应的二进制



✓ 对应的二进制编码:



✓ 一共20个字母,转成了60个二进制位

如果使用哈夫曼编码,可以压缩至41个二进制位,约为原来长度的68.3%

哈夫曼树

◼ 先计算出每个字母的出现频率(权值,这里直接用出现次数)
【ABBBCCCCCCCCDDDDDDEE】


◼ 利用这些权值,构建一棵哈夫曼树(又称为霍夫曼树、最优二叉树)
◼ 如何构建一棵哈夫曼树?(假设有 n 个权值)
1. 以权值作为根节点构建 n 棵二叉树,组成森林
2. 在森林中选出 2 个根节点最小的树合并,作为一棵新树的左右子树,且新树的根节点为其左右子树根节点之和
3. 从森林中删除刚才选取的 2 棵树,并将新树加入森林
4. 重复 2、3 步骤,直到森林只剩一棵树为止,该树即为哈夫曼树

构建哈夫曼编码


◼ left为0,right为1,可以得出5个字母对应的哈夫曼编码



◼【ABBBCCCCCCCCDDDDDDEE】的哈夫曼编码是



◼ 总结
  • n 个权值构建出来的哈夫曼树拥有 n 个叶子节点
  • 每个哈夫曼编码都不是另一个哈夫曼编码的前缀
  • 哈夫曼树是带权路径长度最短的树,权值较大的节点离根节点较近
  • 带权路径长度:树中所有的叶子节点的权值乘上其到根节点的路径长度。与最终的哈夫曼编码总长度成正比关系。

相关文章

  • 哈夫曼树

    数据结构——哈夫曼树 哈夫曼树又被称为最优二叉树,是指一类带权路径长度最小的二叉树,哈夫曼树的遍历不是唯一的,因为...

  • 数据结构06-哈夫曼树与哈夫曼编码

    数据结构06-哈夫曼树 一、哈夫曼树的基本概念 1.哈夫曼树 给定n个权值作为n个叶子节点,构造一棵二叉树,若带权...

  • 《恋上数据结构与算法一》笔记(十八)哈夫曼树

    目录 哈夫曼编码(Huffman Coding) 哈夫曼树 构建哈夫曼树 构建哈夫曼编码 一 哈夫曼编码(Huff...

  • 《数据结构与算法》总结(七)哈夫曼树

    目录 哈夫曼编码(Huffman Coding) 哈夫曼树 构建哈夫曼树 构建哈夫曼编码 一 哈夫曼编码(Huff...

  • 2018-11-27

    专业英语 第九章 数据结构 根据哈夫曼树求哈夫曼编码以及图的基本定义

  • 大师兄的数据结构学习笔记(九): 图

    大师兄的数据结构学习笔记(八): 哈夫曼树与哈夫曼编码[https://www.jianshu.com/p/7e4...

  • A simple test

    哈夫曼编码 此代码用于生成哈夫曼树并且获取哈夫曼编码

  • 初识哈夫曼树

    何为哈夫曼树: 哈夫曼树是压缩算法中非常重要数据结构。百度百科解释:给定n个权值作为n个叶子节点,构造一棵二叉树,...

  • 2018-11-27

    今天看了哈夫曼构造过程,了解如何构造哈夫曼树。

  • 哈夫曼树(代码实现)

    前面我们介绍了哈夫曼树的理论实现,现在介绍一下具体代码实现。 我们先定义哈夫曼树节点的数据结构。 在有了树节点之后...

网友评论

      本文标题:数据结构-哈夫曼树

      本文链接:https://www.haomeiwen.com/subject/gufzqktx.html