200行C++代码的Huffman编码实现

作者: Collie | 来源:发表于2019-08-15 18:04 被阅读0次

[Python&DS]- Python实现Huffman
200行C++代码的Huffman编码实现
技术图文：如何通过 LINQ 查找集合中的重复数据？
Huffman编码源代码
huffman编码
java实现huffman编码
哈夫曼编码（Huffman编码）
哈夫曼(Huffman)编码python代码实现
huffman树及编码的实现
C/C++实现文件压缩与解压！（源码+文档）附带教学

好吧，其实这个说是C语言写的更合适，因为只是最后遍历Huffman编码树的时候用到了C++标准库的vector。是我学习《数据结构（C语言版）》（清华大学出版社，严蔚敏，吴伟民，1997.4）时编写的代码。如果从学习的角度，那么遍历生成编码时所用的栈，也应该自己实现。但是栈的存储结构一般用的就是链式线性表，所以没有必要自己再去实现，并且也非常易于实现。
我不知道为什么该教材第148页可以只用不到30行就实现了。但是这本教材用的命名方式让我非常不舒服，于是我自己编写了包括KMP算法，Huffman编码的实现。

#include <iostream>
#include <vector>

//考试的时候怎么可能足够时间去编写哈夫曼编码啊
namespace huffman
{
    typedef struct Node_s {
        struct {
            struct { struct Node_s *left, *right; } children;
            struct { struct Node_s *last, *next; } siblings;
        } relatedNodes;

        //dataFields
        double weight;//权重
        size_t symbolIndex;
    } Node_t;

    inline Node_t *initAsLinkedList(double *weights, size_t size)
    {
        if (size == 0 || weights == 0) return NULL;
        Node_t *current, *head;
        for (size_t i = 0; i < size; i++)
        {
            if (i == 0)
            {
                //分配首个空间赋值给head
                current = (Node_t *)malloc(sizeof(Node_t));
                current->relatedNodes.siblings.last = NULL;
                current->relatedNodes.siblings.next = NULL;

                head = current;
            }
            else
            {
                //创建并跳转到下一个结点
                current->relatedNodes.siblings.next = (Node_t *)malloc(sizeof(Node_t));
                current->relatedNodes.siblings.next->relatedNodes.siblings.last = current;
                current = current->relatedNodes.siblings.next;
            }
            //在初始时，所有的结点都没有子树
            current->relatedNodes.children.left = current->relatedNodes.children.right = NULL;
            //赋值数据域
            current->weight = *(weights + i);
            current->symbolIndex = i;
        }
        current->relatedNodes.siblings.next = NULL;
        return head;
    }

    inline Node_t *combindNodes(Node_t *left, Node_t *right)
    {
        Node_t *newRoot = (Node_t *)malloc(sizeof(Node_t));
        newRoot->relatedNodes.siblings.last = newRoot->relatedNodes.siblings.next = NULL;

        left->relatedNodes.siblings.last = left->relatedNodes.siblings.next = NULL;
        right->relatedNodes.siblings.last = right->relatedNodes.siblings.next = NULL;
        newRoot->relatedNodes.children.left = left;
        newRoot->relatedNodes.children.right = right;
        newRoot->weight = left->weight + right->weight;
        newRoot->symbolIndex = -1;
        return newRoot;
    }

    inline Node_t *generateHuffmanTree(Node_t *initialLinkedList)
    {
        if (initialLinkedList == NULL) return NULL;

        if (initialLinkedList != NULL &&
            initialLinkedList->relatedNodes.siblings.next == NULL)
        {
            return initialLinkedList;
        }
        //main process
        Node_t *linkedList = initialLinkedList;
        while (true)
        {
            if (linkedList != NULL &&
                linkedList->relatedNodes.siblings.next != NULL &&
                linkedList->relatedNodes.siblings.next->relatedNodes.siblings.next == NULL)
            {
                //the number of node in the linked list is 2
                //just combind them together and return
                return combindNodes(linkedList, linkedList->relatedNodes.siblings.next);
            }
            else
            {//the number of node in the linked list is more than 3 or equals 3
                //搜索权值最小的两个结点
                Node_t *smallest[2] = { linkedList,linkedList->relatedNodes.siblings.next };
                for (Node_t *current = linkedList->relatedNodes.siblings.next->relatedNodes.siblings.next;
                    current != NULL; current = current->relatedNodes.siblings.next)
                {
                    if (current->weight >= smallest[0]->weight &&
                        current->weight >= smallest[1]->weight) continue;
                    else
                    {
                        //用当前的替换掉最大的那一个
                        if (smallest[0]->weight < smallest[1]->weight)
                        {
                            smallest[1] = current;
                        }
                        else
                        {
                            smallest[0] = current;
                        }
                    }
                }

                //找到了最小的两个之后就先将两个结点从链表中移除
                for (unsigned short int i = 0; i < 2; i++)
                {
                    if (smallest[i]->relatedNodes.siblings.last == NULL)
                    {
                        //说明刚好是链表的头结点,那么需要改变链表的起始指针到下一个结点
                        smallest[i]->relatedNodes.siblings.next->relatedNodes.siblings.last = NULL;
                        linkedList = smallest[i]->relatedNodes.siblings.next;
                        smallest[i]->relatedNodes.siblings.last = 
                            smallest[i]->relatedNodes.siblings.next = NULL;
                    }
                    else if (smallest[i]->relatedNodes.siblings.next == NULL)
                    {
                        //说明刚好是链表的尾结点，那么需要将上一个置为尾结点
                        smallest[i]->relatedNodes.siblings.last->relatedNodes.siblings.next = NULL;
                        smallest[i]->relatedNodes.siblings.last =
                            smallest[i]->relatedNodes.siblings.next = NULL;
                    }
                    else
                    {
                        //既不是链表的头也不是链表的尾
                        smallest[i]->relatedNodes.siblings.last->relatedNodes.siblings.next =
                            smallest[i]->relatedNodes.siblings.next;
                        smallest[i]->relatedNodes.siblings.next->relatedNodes.siblings.last =
                            smallest[i]->relatedNodes.siblings.last;
                        smallest[i]->relatedNodes.siblings.last =
                            smallest[i]->relatedNodes.siblings.next = NULL;
                    }
                }
                //然后将生成的新结点加入链表（就加入链表的尾部吧）
                for (Node_t *currentNode = linkedList;;
                    currentNode = currentNode->relatedNodes.siblings.next)
                {
                    if (currentNode->relatedNodes.siblings.next == NULL)
                    {
                        //找到了最尾的一个结点
                        currentNode->relatedNodes.siblings.next = 
                            combindNodes(smallest[0], smallest[1]);
                        currentNode->relatedNodes.siblings.next->relatedNodes.siblings.last =
                            currentNode;
                        break;
                    }
                }
            }
        }
    }

    //codePrefix相当于上层传下来的编码
    inline void encode(Node_t *node, std::vector<bool> &codePrefix)
    {
        //如果左子树和右子树都空，说明这是叶子结点
        if (node->relatedNodes.children.left == NULL&&
            node->relatedNodes.children.right == NULL)
        {
            std::cout << node->symbolIndex << " " << node->weight << "\t";
            for (std::vector<bool>::const_iterator bitIterator = codePrefix.begin();
                bitIterator != codePrefix.end(); bitIterator++)
            {
                std::cout << *bitIterator;
            }
            std::cout << std::endl << std::flush;
        }
        else
        {
            //说明这是内部结点
            //先处理左子树
            codePrefix.push_back(false);
            encode(node->relatedNodes.children.left, codePrefix);
            codePrefix.erase(codePrefix.end() - 1);
            codePrefix.push_back(true);
            encode(node->relatedNodes.children.right, codePrefix);
            codePrefix.erase(codePrefix.end() - 1);
        }
    }

    void test(Node_t *linkedList)
    {
        std::vector<bool> code;
        code.clear();
        encode(linkedList, code);
    }
}

[Python&DS]- Python实现Huffman
本文主要介绍Huffman编码、Huffman树、和如何借助Python实现Huffman编码树对文件进行压缩和解...
200行C++代码的Huffman编码实现
好吧，其实这个说是C语言写的更合适，因为只是最后遍历Huffman编码树的时候用到了C++标准库的vector。是...
技术图文：如何通过 LINQ 查找集合中的重复数据？
背景在前几天介绍的如何利用C#实现Huffman编码？的图文中有以下代码。该代码实现了统计字符串 str...
Huffman编码源代码
构建Huffman树： 1.将给定的n个权值看作n棵只有结点无左右孩子的二叉树，组合成一个集合HT。 2.从集合H...
huffman编码
huffman编码简介参考这篇文章 python实现开头二叉树类定义装饰器用于计时定义huffman类...
java实现huffman编码
接下来写个排序函数,就用快排吧然后是构建Huffman树的函数: 然后是对huffman树进行编码接下来是打印...
哈夫曼编码（Huffman编码）
Huffman编码又称霍夫曼编码，是一种编码方式，哈夫曼编码是可变[字长]编码(VLC)的一种。Huffman于1...
哈夫曼(Huffman)编码python代码实现
首先看定义哈夫曼编码(Huffman Coding)，又称霍夫曼编码，是一种编码方式，哈夫曼编码是可变字长编码(...
huffman树及编码的实现
最近学到Huffman编码，于是想要实现出来看看，查阅了一些资料，就开始动手了。首先整理一下思路，Huffman编...
C/C++实现文件压缩与解压！（源码+文档）附带教学
VC++ Huffman实现文件压缩与解压，压缩、解压缩小工具源代码，基于哈夫曼编码制作，将每个哈夫曼码值及其对...