美文网首页
18_哈夫曼树

18_哈夫曼树

作者: 伶俐ll | 来源:发表于2020-09-11 13:41 被阅读0次
    哈夫曼编码的用途

    哈夫曼编码,又称霍夫曼编码,它是现代压缩算法的基础

    假设要把字符串【ABBBBCCCCCCCCDDDDDDEE】转成二进制编码进行传输

    • 转成ASCII编码(65~69,1000001 ~ 10000101),但是有点冗长,如果希望编码更短呢?
    • 可以先约定5个字母对应的二进制
      A:000 B:001 C:010 D:011 E:100
      一共20个字母,转成了60个二进制位

    如果使用哈夫曼编码,可以压缩至41个二进制位,约为原来长度的68.3%

    哈夫曼树

    • 先计算出每个字母的出现频率(权值,这里直接用出现次数)【ABBBBCCCCCCCCDDDDDDEE】


      Snip20200910_3.png
    • 利用这些权值,构建一棵哈夫曼树(又称为霍夫曼树,最优二叉树)
    构建哈夫曼树

    假设有n个权值

    1. 以权值作为根节点构建n棵二叉树,组成森林
    2. 在森林中选出2个根节点最小的树合并,作为一棵新树的左右子树,且新树的根节点为其左右子树根节点之和
    3. 从森林中删除刚才选取的2棵树,并将新树加入森林
    4. 重复2、3步骤,直到森林只剩一棵树为止,该树即为哈夫曼树


      Snip20200910_4.png
    构建哈夫曼编码
    • left为0,right为1,可以得出5个字母对应的哈夫曼编码


      [图片上传中...(Snip20200910_4.png-b9dccd-1599707714455-0)]

    【ABBBBCCCCCCCCDDDDDDEE】的哈夫曼编码是 11101101101101100000000010101010101011111111

    总结
    • n个权值构建出来的哈夫曼树拥有n个叶子节点
    • 每个哈夫曼编码都不是另一个哈夫曼编码的前缀
    • 哈夫曼树是带权路径长度最短的树,权值较大的节点离根节点较近
    • 带权路径长度:树中所有的叶子节点的权值乘上其到根节点的路径长度。
    • 带权路径长度与最终的哈夫曼编码总长度成正比关系

    相关文章

      网友评论

          本文标题:18_哈夫曼树

          本文链接:https://www.haomeiwen.com/subject/jbnuektx.html