标签:
现有一段文言文,要通过二进制哈夫曼编码进行压缩。假设这段文言文只由4个汉字“之”“乎”“者”“也”组成,它们出现的次数分别为700、600、300、200。那么,“也”字的编码长度是( )。
哈弗曼编码的原理需要你自己研究再看看其思想。本题解如图:
汉字 概率 编码
之: 700 00
乎: 600 011
者: 300 0101
也: 200 0100
(编码数如图这个二叉树得到,左边为0,右边为1,每一个字符都从根节点数)
可以看出:出现次数越多的字符,编码越短;出现次数越少的字符,编码越长。这样就能让编码后的文件大小能够最短。
字符串 "alibaba" 的二进制哈夫曼编码有多少位 ?
标签:
原文地址:http://www.cnblogs.com/guxuanqing/p/5882930.html