码迷,mamicode.com
首页 > 其他好文 > 详细

哈夫曼树Huffman

时间:2018-07-31 22:08:13      阅读:166      评论:0      收藏:0      [点我收藏+]

标签:return   最小   names   tor   std   \n   不能   重复   多少   

哈夫曼树处理这样的一种问题:

给出一棵n个叶子的k叉树,每个叶子有一个权值wi,要求最小化∑wi*di 

di表示,第i个叶子节点到根节点的距离。(一般是边数)

 

处理方法比较固定。

贪心的思路:我们让权值较大的叶子节点 的深度越小越好。

建立一个小根堆。

1.插入n个叶子的权值。

2.每次取出最小的k个,ans+=这些权值和。

3.合并出一个父亲节点,权值就是这k个点的权值和。(通常这一步不用真正实现,只是助于理解)

4.把这个新的父亲节点权值放进小根堆里面。

5.重复2~4操作,直到堆中只有一个节点(就是根节点)

 

但是这样是有问题的。

发现,我们每取出一次,合并一次,就是相当于把取出来的这些叶子深度+1,

最后一次合并的所有节点,就是根节点的儿子,他们的深度最浅。就是1

而可能出现,最后一次,堆中有2~k-1个节点,不能使最浅的一层放满。

这样肯定是不优的,因为我们可以把较深的一个节点放在根节点的儿子位置上。(因为这一层还没有放满)使得答案更优。

 

我们这样处理这个问题:

往堆里面不断加入权值为0的及节点。直到满足(tot-1)%(k-1)==0 tot是初始堆中节点个数。

这样,每次都可以恰好取出k个,并且0值的点会先取出来,相当于这里是空位,他们不会影响最后的值。

并且,这样保证了最浅的一层尽可能的放满,就一定是最优解了。

相当于把空位留给了更深的 位置。

 

例题:

1.合并果子

Description:

n堆果子,合并两堆果子,花费两堆果子的重量之和的力气。问合成一堆最少用多少力气?

Solution:

浅显的解释就是贪心了,因为要合并固定的n-1次,必然每次选择最小的两个合并。

本质上其实是一棵n节点的2叉哈夫曼树。叶子节点的深度米就是这个原始堆被合并的次数。

 

2.荷马史诗

Description:

荷马史诗

Solution:

我们利用tire树的结构来考虑,为了保证没有前缀包含关系,最后建出的trie必然是有n个叶子节点。

每个叶子节点到根节点的路径长度就是单词长度,并且这个长度要乘上出现的次数wi

恰好就是Huffman的模型!!

一切就很裸了。

但是还要求一个最长的单词最短,,

那么,就在权值相同的节点中,选择之前已经合并过的次数最小的点合并,也就是那些当前深度最浅的点。

这样,把深度“平均”了一下,就是最优的情况了。

另外,新合并出来的点的合并次数,即深度,就是最大的所选点的合并次数。

代码:

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=100000+10;
int n,k,tot;
ll w[N];
ll ans,mx;
struct node{
    ll val,mer;
    bool friend operator <(node a,node b){
        if(a.val==b.val) return a.mer>b.mer;
        return a.val>b.val;
    }
};
priority_queue<node>q;

int main()
{
    scanf("%d%d",&n,&k);
    for(int i=1;i<=n;i++){
        scanf("%lld",&w[i]);
        node nn;nn.val=w[i],nn.mer=0;
        q.push(nn);
    }
    tot=n;
    while((tot-1)%(k-1)){
        node nn;nn.val=0;nn.mer=0;
        q.push(nn);tot++;
    }
    while(q.size()>1){
        ll sum=0;
        ll big=0;
        for(int i=1;i<=k;i++){
            node bb=q.top();q.pop();
            sum+=bb.val;
            big=max(big,bb.mer);
        }
        mx=max(mx,big+1);
        ans+=sum;
        node kk;kk.val=sum;kk.mer=big+1;
        q.push(kk);
    }
    printf("%lld\n%lld",ans,mx);
    return 0;
}

 

哈夫曼树Huffman

标签:return   最小   names   tor   std   \n   不能   重复   多少   

原文地址:https://www.cnblogs.com/Miracevin/p/9397423.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!