实验一哈夫曼编码
一、实验目的
1、掌握哈夫曼编码原理;2、熟练掌握哈夫曼树的生成方法;3、理解数据编码压缩和译码输出编码的实现。
二、实验要求
实现哈夫曼编码和译码的生成算法。
三、实验内容
先统计要压缩编码的文件中的字符字母出现的次数,按字符字母和空格出现的概率对其进行哈夫曼编码,然后读入要编码的文件,编码后存入另一个文件;接着再调出编码后的文件,并对其进行译码输出,最后存入另一个文件中。
五、实验原理
1、哈夫曼树的定义:假设有
个权值,试构造一颗有
个叶子节点的二叉树,每个叶子带权值为
wi,其中树带权路径最小的二叉树成为哈夫曼树或者最优二叉树;
2、哈夫曼树的构造:
weight为输入的频率数组,把其中的值赋给依次建立的
HTNode对象中的data属性
即每一个HTNode对应一个输入的频率。然后根据data属性按从小到大顺序排序,
每次从
data取出两个最小和此次小的HTNode,将他们的data相加,构造出新的
HTNode作为
他们的父节点,指针pare
t,leftchild,rightchild赋相应值。在把这个新的节点插入最小堆。按此步
骤可以构造构造出一棵哈夫曼树。
通过已经构造出的哈夫曼树,自底向上,由频率节点开始向上寻找
pare
t直到pare
t
为树的顶点为止。这样,根据每次向上搜索后,原节点为父节点的左孩子还是右孩子,
来记
录1或0这样,每个频率都会有一个
01编码与之唯一对应,并且任何编码没有前部分是
同其他完整编码一样的。
六、实验流程
①初始化,统计文本文件中各字符的个数作为权值,生成哈夫曼树;
②根据符号概率的大小按由大到小顺序对符号进行排序;
③把概率最小的两个符号组成一个节点;
④重复步骤(2)(3),直到概率和为1;
⑤从根节点开始到相应于每个符号的树叶”概率大的标“0”概率小的标“1;
⑥从根节点开始,对符号进行编码;⑦译码时流程逆向进行,从文件中读出哈夫曼树
,并利用哈夫曼树将编码序列解码。
七、实验程序
i
cludeiostreami
cludefstreami
cludeioma
ipi
cludevector
1
fusi
g
amespacestdtypedefstruct节点结构
chardata
记录字符值
lo
gi
tweight
〃记录字符权重
u
sig
edi
tpare
tlchildrchild
HTNodeHuffma
Tree
动态分配数组存储哈夫曼树
typedefcharHuffma
Code
动态分配数组存储哈夫曼编码表
voidSelectHuffma
TreeHTi
tii
ts1i
ts2
在HT1t
且权值最小的两个结点,其序号分别为si和s2
中选择pare
t不为0
s10s20i
t
130000
230000fori
tk1kik
ifHTkpare
tr