哈夫曼编码实验报告.doc-道客多多

资源描述

1、1实验一哈夫曼编码一、实验目的1、掌握哈夫曼编码原理；2、熟练掌握哈夫曼树的生成方法；3、理解数据编码压缩和译码输出编码的实现。二、实验要求实现哈夫曼编码和译码的生成算法。三、实验内容先统计要压缩编码的文件中的字符字母出现的次数，按字符字母和空格出现的概率对其进行哈夫曼编码，然后读入要编码的文件，编码后存入另一个文件；接着再调出编码后的文件，并对其进行译码输出，最后存入另一个文件中。五、实验原理1、哈夫曼树的定义：假设有 n 个权值，试构造一颗有 n 个叶子节点的二叉树，每个叶子带权值为 wi，其中树带权路径最小的二叉树成为哈夫曼树或者最优二叉树；2、哈夫曼树的构造：weight 为输入的频

2、率数组，把其中的值赋给依次建立的 HT Node 对象中的 data 属性，即每一个 HT Node 对应一个输入的频率。然后根据 data 属性按从小到大顺序排序，每次从 data 取出两个最小和此次小的 HT Node，将他们的 data 相加，构造出新的 HTNode 作为他们的父节点，指针 parent，leftchild ，rightchild 赋相应值。在把这个新的节点插入最小堆。按此步骤可以构造构造出一棵哈夫曼树。通过已经构造出的哈夫曼树，自底向上，由频率节点开始向上寻找 parent,直到 parent为树的顶点为止。这样，根据每次向上搜索后，原节点为父节点的左孩子还是右孩子，

3、来记录 1 或 0，这样，每个频率都会有一个 01 编码与之唯一对应，并且任何编码没有前部分是同其他完整编码一样的。六、实验流程1 初始化，统计文本文件中各字符的个数作为权值,生成哈夫曼树；2 根据符号概率的大小按由大到小顺序对符号进行排序； 3 把概率最小的两个符号组成一个节点；4 重复步骤（2 ）（3 ），直到概率和为 1；5 从根节点开始到相应于每个符号的“ 树叶”，概率大的标 “0”，概率小的标“1”；6 从根节点开始，对符号进行编码；7 译码时流程逆向进行，从文件中读出哈夫曼树,并利用哈夫曼树将编码序列解码。七、实验程序#include#include#include#inclu

4、de2using namespace std;typedef struct /节点结构char data; /记录字符值long int weight; /记录字符权重unsigned int parent,lchild,rchild;HTNode,*HuffmanTree; /动态分配数组存储哈夫曼树typedef char * *HuffmanCode; /动态分配数组存储哈夫曼编码表void Select(HuffmanTree s2=0;int n1=30000,n2=30000;for(int k=1;kweighti;for( i=1;i “;cout a;char ch;whil

5、e(ch=fin.get()!=*)a.push_back(ch);5cout a;for(char c;finc;)a.push_back(c); int count=0;for(int k=0;kn; printf(“n“);HuffmanTree HT; /哈夫曼树 HTHuffmanCode HC; /哈夫曼编码表 HCHuffmanCoding(HT,HC,n); /进行哈夫曼编码printHuffmanCoding(HT,HC,n); /显示编码的字符printf(“n“);code_file(HT,HC,n); /显示要编码的字符串，并把编码值显示出来Decoding(HT,HC

6、,n); /译码并显示译码后的字符串printf(“nnn“);system(“pause“);7八、结果分析哈夫曼编码是动态变长编码，临时建立概率统计表和编码树。概率小的码比较长，概率小的码比较长。概率大的码短，这样把一篇文件编码后，就会压缩许多。从树的角度看，哈夫曼编码方式是尽量把短码都利用上。首先，把一阶节点全都用上，如果码字不够时，然后，再从某个节点伸出若干枝，引出二阶节点作为码字，以此类推，显然所得码长最短，再根据建立的概率统计表合理分布和放置，使其平均码长最短就可以得到最佳码。九、实验总结通过这次实验，我对二叉树和哈希曼树有了更好的认识。在实验过程中，我掌握了哈曼树的构造方法，学会了如何将理论知识传换成实际应用。同时，在解决程序中遇到的一些问题的同时，我也对调试技巧有了更好的掌握，分析问题的能力也略有提高。在实验中，我遇到了许多难点，比如：统计字符的权值，就需要我们有扎实的基础，需要有灵活的头脑，只有不断的练习，不断的训练，我们才能处理各种问题。在以后的学习中，我要不断的努力，多联系，多思考，我相信我能有所进步的。

展开阅读全文