哈夫曼树

时间：2020-06-29 22:37:44 阅读：47 评论：0 收藏：0 [点我收藏+]

标签：存在 lin 需要个数队列 lock 可变条件 sort

数论哈夫曼树

1.0 引子

A: 欸，你听说过“带权最优二叉树”嘛？就是“带权路径长度最短的二叉树“嘛？就是“路径上的分支个数称为路径长度”嘛？就是“叶子结点都有一定的权值”嘛？

B: 说人话

A: 《合并果子》..

1.1 二叉哈夫曼算法

也许算法并不叫这个名字，只是我觉得好记好懂就这么叫了..

二叉哈夫曼算法解决的问题与《合并果子》别无二致，但是为了严谨，还是重新叙述一遍二叉哈夫曼算法解决的问题：

有n个数；每一次合并操作代价为两个数字之和；每一次合并可以将两个数字合并为一个数字，其大小为原先两数字之和；试求最小合并代价

一个\(O(nlogn)\)的优先队列解法很快浮现了出来。二叉哈夫曼算法复杂度与该解法同级，但没有利用到优先队列这个数据结构。

一、开两个数组记为a[],和b[]。a[]数组初始化为升序的原数组，而b[]数组为空

二、每一次尝试从a[]和b[]队首中找最小的两个数

三、将其合并之后，放入b[]的队尾

技术图片

1） a[]的单调性保证：初始化时排序，之后不再发生插入操作

2） b[]的单调性保证：每一次合并的结果将会越来越大，而越靠后的合并结果将会插在b[]越靠后的位置上，单调性得到保证

a[]和b[]都有单调性保证，只要从两个队列队首抽一个较小值，即可得到全局最小值

1.2 k叉哈夫曼算法

解决了二叉哈夫曼算法，不禁联想到将情况扩展到更高维的情况：假如同时允许合并k个数字呢？

事实上情况并没有变得太过复杂，优先队列解法可以很轻松的转移过来，同理“k叉哈夫曼算法”诞生了。与二叉哈夫曼算法几乎没有区别，只是每一次取前k小即可。

但是，每一次合并将会减少(k-1)个数字，假如最后一次合并没能凑齐k个数字呢？贪心地考虑一下，越靠后的合并操作，牵扯到的数字越多，因此合并操作越靠后，越应当凑齐正好k个数字，不能浪费机会。由于算法很明显是不能倒序进行的，因此我们只需要事先给数列添加一些人畜无害的"0"调整个数，便能保证最后一次合并可以凑齐k个数字整

虽然具体放"0"的个数很简单，做题的时候顺手推一下就能推出来，但是还是总结了以下公式:

\[(k-(n\mod (k-1)))\mod (k-1) \]

例题：hdu 5884 Sort

一道裸的哈夫曼算法