标签:
1、 参考书《数据压缩导论(第4版)》 Page 66 2(a),4
说明:
-- 第2题的(a)请用表格的形式给出对应文件压缩前后的大小(单位用字节表示),格式如下所示:
图像文件名 压缩前 压缩后
Sena 64kb 56kb
Sinan 64kb 59kb
Omaha 64kb 57kb
4.一个信源从符号集A{a1,a2,a3,a4,a5}中选择字母,概率为p(a1)=0.15,p(a2)=0.04,p(a3)=0.26,p(a4)=0.05,p(a5)=0.50。
(a)计算这个信源的熵。
(b)求这个信源的霍夫曼码。
(c)求(b)中代码的平均长度及其冗余度。
解: (a)H=-Σp(xi)log2p(xi)
=-(0.15×log2 0.15+0.04×log2 0.04+0.26×log2 0.26
+0.05×log2 0.05+0.50×log2 0.50)
=1.818
(b)a1 001
a2 0000
a3 01
a4 0001
a5 1
(c)l=3×0.15+4×0.04+2×0.26+4×0.05+1×0.50
=1.83
r=l-H=1.83-1.818=0.012
3.为什么压缩领域中的编码方法总和二叉树联系在一起呢?
答:编码时,单个字母的码长不一定,则编码会符合“前缀编码”(短编码不会是长编码的前缀)。而这种编码形势又完全符合二叉树模型。所以编码方法和二叉树总联系在一起。
标签:
原文地址:http://www.cnblogs.com/makaihao/p/5914711.html