标签:
这篇文章主要用来记录我对《算法导论》 贪心算法一章中的“活动选择问题”的动态规划求解和贪心算法求解 的思路和理解。
主要涉及到以下几个方面的内容:
①什么是活动选择问题---粗略提下,详细请参考《算法导论》
②活动选择问题的DP(Dynamic programming)求解--DP求解问题的思路
③活动选择问题的贪心算法求解
④为什么这个问题可以用贪心算法求解?
⑤动态规划与贪心算法的一些区别与联系
⑥活动选择问题的DP求解的JAVA语言实现以及时间复杂度分析
⑦活动选择问题的Greedy算法JAVA实现和时间复杂度分析
⑧一些有用的参考资料
①活动选择问题
给定N个活动,以及它们的开始时间和结束时间,求N个活动中,最大兼容的活动个数。比如:
活动 i: 1 2 3 4.....
开始时间 si: 1 3 0 5....
结束时间 fi: 4 5 6 7.....
活动1的开始时间s(1)=1,结束时间f(1)=4,它与活动2是不兼容的。因为,活动1还没有结束,活动2就开始了(s(2) < f(1))。
活动2 与 活动4 是兼容的。因为,活动2的进行区间是[3,5) 而活动4的进行区间是[5,7)
目标是:在N个活动中,找出最大兼容的活动个数。
②活动选择问题的DP(Dynamic programming)求解
1)建模
活动 i 用 a(i)来表示,开始时间用 s(i)表示,结束时间用 f(i)表示,所有活动的集合为S
定义一个合适的子问题空间,设 S(i,j) 是与 a(i) 和 a(j)兼容的活动集合。S(i,j)={a(k), a(k) belongs to S: f(i)<=s(k)<f(k)<=s(j)}
2)问题一般化(不是很理解)
这里第一个活动和最后一个活动有点特殊。为了完整表示问题,构造两个虚拟的活动: a(0) 和 a(n+1)
其中,s(0)=f(0)=0,s(n+1)=f(n+1)=Integer.MAX_VALUE
于是,S=S(0,n+1),从N个活动中找出最大兼容的活动,就转化成了求解 S(0,n+1)集合中包含的最多元素个数
3)子问题分析
假设所有的活动都按结束时间递增排序。子问题空间就是 从S(i,j)中选择最大兼容活动子集,即max{S(i,j)}
max{S(i,j)}表示与 a(i) a(j) 兼容的最大活动集合。称为为S(i,j)的解
假设 a(k)是 S(i,j)的解包含的一个活动。S(i,j)就分解为 max{S(i,k)} + max{S(k,j)}+1
从这里可以看到,将原问题分解成了两个子问题。原问题就是:求解与活动 a(i) a(j) 兼容的最大活动个数,即max{S(i,j)}
而子问题则是:max{S(i,k)} 和 max{S(k,j)}
设A(i,j)就是S(i,j)的解。那么,A(i,j)=A(i,k) U A(k,j) U {a(k)}
A(0,n+1)就是我们所求的整个问题的最优解。
4)子问题的 选择个数 分析
设c[i,j]为S(i,j)中最大兼容子集中的活动数,S(i,j)为空集时,c[i,j]=0,这是显而易见的。因为S(i,j)中都没有活动嘛,更别谈什么兼容活动了呀。
若 i>=j,c[i,j]=0。这个也很好理解,因为它不符合常识。因为,我们假设活动是以结束时间来递增排序的,在S(i,j)中,是f(i)<s(j)的。那 i 就不会大于 j
毕竟一个活动它不可能 即在 某个活动之前结束,又在该活动之后开始。哈哈。。。。。
前面提到 :假设 a(k)是 S(i,j)的解包含的一个活动。S(i,j)就分解为 max{S(i,k)} + max{S(k,j)}+1
这意味着,求S(i,j)的最优解,就需要知道 S(i,k) 和 S(k,j) 的最优解。那关键是怎么知道 S(i,k) 和 S(k,j) 的最优解呢?
答案是:一个 一个 地尝试。k 的取值范围是 (i,j),遍历(i,j)内所有的值,计算 S(i,k) 和 S(k,j)的解。就可以找到S(i,j)的最优解了。
因此,当S(i,j)不为空时,c[i,j] = max{c[i,k] + c[k,j] + 1} 其中, k belongs to (i,j) a(k) belongs to S(i,j)
下面,就是DP中的状态转移方程(递归表达式),根据它,就可以写代码实现了。
从上面分析可以看出:原问题分解成了两个子问题,要解决原问题,一共有 j-i+1中选择,然后一 一遍历求出所有的选择。这就是动态规划的特点,先分析最优子问题,然后再做选择。
③活动选择问题的贪心算法求解
所谓贪心算法,就是每次在做选择时,总是先选择具有相同特征的那个解,即“贪心”解。在这里,“贪心”的那个解则是: 结束时间最早的那个活动
具体步骤是怎样的呢?
第一步:先对活动按照结束时间进行排序。因为我们总是优先选择结束时间最早的活动的嘛。排序之后,方便选择嘛。。。
第二步:按照贪心原则 选中一个活动,然后排除 所有与该活动 有冲突的活动。
第三步:继续选择下一个活动。其实,第二步与第三步合起来就是:每次都选结束时间最早的活动,但是后面选择的活动不能与前面选择的活动有冲突。
从这里可以看出,贪心算法是在原问题上先做贪心选择,然后得到一个子问题,再求解子问题。(求解子问题的过程,就是一个不断贪心选择的过程)
④为什么这个问题可以用贪心算法求解?
看了贪心算法之后,就会有疑问?凭什么这样选就能得到最优解啊?或者说,这样做到底对不对?
别急嘛,我们可以用数学来证明这样做是正确的。而且从这个证明过程中,可以窥出动态规划与贪心算法的区别。
对于活动选择问题而言:当可用贪心算法解时,贪心的效率要比动态规划高。为什么要高呢?后面再详细讲。
这个证明具体可参考《算法导论》上的证明。它的大致证明过程就是:
当选择了贪心解时(结束时间最小的活动),也是将原问题划分成了两个子问题,但是其中一个子问题是空的,而我们只需要考虑另一个非空的子问题就可以了。
具体而言就是:假设 a(m) 是 S(i,j)中具有最早结束时间的那个活动,那按照我们的贪心选择,我们肯定会选择a(m)的嘛。选了a(m)之后,就将问题分解成了两个子问题:S(i,m) 和 S(m,j)。前面提到,活动是按结束时间排序了的,而现在a(m)又是最早结束的活动,因为,S(i,m)就是个空集,而我们只需要考虑S(m,j)
但是,这里有个重大的疑问还未解决---凭什么说 a(m) 就是 S(i,j)的最优解中的活动呢?或者说凭什么 活动m 就是最大兼容活动集合中的活动?
这里就用到经常用来证明贪心算法正确性的一个技巧---剪枝。关于这个技巧,可参考一篇博文:漫谈算法(一)如何证明贪心算法是最优
对于活动选择问题,咱就来简要证明下吧。。。其实还是《算法导论》中讲的证明,只不过我又复述一遍罢了。
慢着,我们要证明的是啥?再说一遍:凭什么说 a(m) 就是 S(i,j)的最优解中的活动呢?,我们证明的就是:a(m)是S(i,j)的最优解中的元素,即a(m)是S(i,j)最大兼容活动子集中的活动。
设A(i,j)是S(i,j)的最大兼容活动子集---也就是说,在所有与 活动a(i) 和 活动a(j) 相兼容的活动中,A(i,j)含有的活动个数最多。
将A(i,j)中的活动按结束时间递增排序。设a(k)是A(i,j)中的第一个活动。若a(k)=a(m),那没话说了。a(m)就是a(k)嘛,那a(m)肯定在A(i,j)中噻
若a(k) != a(m),这说明A(i,j)中的第一个元素(活动)不是a(m)。那我们可以运用剪枝思想,剪掉A(i,j)中的第一个活动a(k),再把活动a(m)贴到A(i,j)里面去。
这样,A(i,j)中的活动个数还是没有变化---少了个a(k),加了个a(m)啊
那么,可能你就会问了,凭什么能把 a(m)贴到 A(i,j)里面去啊?????我们可以这样想想:a(k)是A(i,j)中的第一个活动,那为什么a(k)可以在A(i,j)中呢?
废话!上面带下划线且加粗的的都说了假设 a(k)是A(i,j)中的第一个活动了啊!!
其实,这不是本质 ,本质就是:a(k)是与 a(i) 和 a(j)兼容的活动啊,而且没有和A(i,j)中的其他活动冲突啊!因为,S(i,j)的解 就是求与 a(i) 和 a(j)兼容的一组活动啊,而A(i,j)就是这样的一组活动且它是最大的(活动个数最多),能够放在A(i,j)中的活动,它一定是与a(i) 和 a(j) 兼容的。
那么,再回到a(m),a(m)同样也具有 ”本质“ 中提到的两个性质:?a(m)是与a(i) 和 a(j) 兼容的活动 ?a(m)没有与A(i,j)中其他活动冲突。
下面来说明下为什么 a(m)没有与A(i,j)中其他活动冲突?因为a(k)是没有与A(i,j)中的其他活动冲突的,而a(m)又是S(i,j)中结束时间最早的活动
故:,完成时间:f(m)<f(k) ,a(m)都比a(k)更早完成,而a(k)都没有与A(i,j)中的其他活动冲突,那a(m)就更不可能与A(i,j)中的其他活动冲突了。
终于完成了证明。好累。
⑤动态规划与贪心算法的一些区别与联系
这里只针对活动选择问题作一下比较。其他的我也不懂。
a)动态规划是先分析子问题,再做选择。而贪心算法则是先做贪心选择,做完选择后,生成了子问题,然后再去求解子问题。
b)从 a) 中可以看出,动态规划是自底向上解决问题,而贪心算法则是自顶向下解决问题。
c)动态规划每一步可能会产生多个子问题,而贪心算法每一步只会产生一个子问题。(比如这里的贪心算法产生了“二个”子问题,但是其中一个是空的。)
⑥活动选择问题的DP求解的JAVA语言实现以及时间复杂度分析
1 /** 2 * //算法导论中活动选择问题动态规划求解 3 * @param s 活动的开始时间 4 * @param f 活动的结束时间 5 * @param n 活动数目 6 * @return 最大兼容的活动个数 7 */ 8 public static int maxCompatiableActivity(int[] s, int[] f, int n){ 9 int[][] c = new int[n + 2][n + 2]; 10 11 for(int j = 0; j <= n+1; j++) 12 for(int i = n+1; i >= j; i--) 13 c[i][j] = 0;//if i>=j S(i,j)是空集合 14 15 int maxTemp = 0; 16 for(int j = 1; j <= n+1; j++) 17 { 18 for(int i = 0; i < j; i++)//i < j 19 { 20 for(int k = i+1; k < j; k++)// i< k <j 21 { 22 if(s[k] >= f[i] && f[k] <= s[j])//S(i,j)不空 23 { 24 if(c[i][k] + c[k][j] + 1 > maxTemp) 25 maxTemp = c[i][k] + c[k][j] + 1; 26 } 27 }//inner for 28 c[i][j] = maxTemp; 29 maxTemp = 0; 30 }//media for 31 }//outer for 32 return c[0][n+1]; 33 }
DP时间复杂度与问题的个数以及每个问题的选择数 有关。
比如这里的 S(i,j)一共大约有N^2个, 因为 1=<j<=N, 1=<i<j ,这里求和大约是 (N^2)/2(对于S(i,j) i>j没有实际意义嘛),每个S(i,j)一共有 j-i+1种 选择
故时间复杂度为O(N^3)
⑦活动选择问题的Greedy算法JAVA实现和时间复杂度分析
贪心算法即可以用递归实现,也可以用非递归实现。
1 //贪心算法的递归解 2 public static ArrayList<Integer> greedyActivitySelection(int[] s, int[] f, int i, int n, ArrayList<Integer> activities){ 3 //初始调用时 i = 0, 所以a(1)是必选的(注意:活动编号已经按结束时间排序) 4 int m = i + 1; 5 6 //s[m] < f[i] 意味着活动 a(m) 与 a(i)冲突了 7 while(m <= n && s[m] < f[i]) 8 m++;//选择下一个活动 9 10 if(m <= n){ 11 activities.add(m); 12 greedyActivitySelection(s, f, m, n, activities); 13 } 14 return activities; 15 } 16 17 //贪心算法的非递归解, assume f[] has been sorted and actId 0/n+1 is virtually added 18 public static ArrayList<Integer> greedyActivitySelection2(int[] s, int[] f, int n, ArrayList<Integer> acitivities){ 19 //所有真正的活动(不包括 活动0和 活动n+1)中,结束时间最早的那个活动一定是最大兼容活动集合中的 活动. 20 int m = 1; 21 acitivities.add(m); 22 23 for(int actId = 2; actId <= n; actId++){ 24 if(s[actId] >= f[m])//actId的开始时间在 m 号活动之后.--actId 与 m 没有冲突 25 { 26 m = actId; 27 acitivities.add(m); 28 } 29 } 30 return acitivities; 31 }
贪心算法的时间复杂度为O(N),why?你可以看代码啊。只有一个循环啊。每个活动只会遍历一次啊。
这里从理论上来分析下:因为对于贪心算法而言,每次只有一种选择即贪心选择,而DP中每个问题S(i,j)中 j-i+1种选择。
贪心算法做出一次贪心选择后,即选中某个活动后,活动个数减少1,即问题规模减少1。
⑧参考资料
https://www.zhihu.com/question/23995189
《背包九讲》
http://www.cnblogs.com/hapjin/p/5572483.html
附完整代码:
import java.util.ArrayList; public class ActivitySelection { /** * //算法导论中活动选择问题动态规划求解 * @param s 活动的开始时间 * @param f 活动的结束时间 * @param n 活动数目 * @return 最大兼容的活动个数 */ public static int maxCompatiableActivity(int[] s, int[] f, int n){ int[][] c = new int[n + 2][n + 2]; for(int j = 0; j <= n+1; j++) for(int i = n+1; i >= j; i--) c[i][j] = 0;//if i>=j S(i,j)是空集合 int maxTemp = 0; for(int j = 1; j <= n+1; j++) { for(int i = 0; i < j; i++)//i < j { for(int k = i+1; k < j; k++)// i< k <j { if(s[k] >= f[i] && f[k] <= s[j])//S(i,j)不空 { if(c[i][k] + c[k][j] + 1 > maxTemp) maxTemp = c[i][k] + c[k][j] + 1; } }//inner for c[i][j] = maxTemp; maxTemp = 0; }//media for }//outer for return c[0][n+1]; } //贪心算法的递归解 public static ArrayList<Integer> greedyActivitySelection(int[] s, int[] f, int i, int n, ArrayList<Integer> activities){ //初始调用时 i = 0, 所以a(1)是必选的(注意:活动编号已经按结束时间排序) int m = i + 1; //s[m] < f[i] 意味着活动 a(m) 与 a(i)冲突了 while(m <= n && s[m] < f[i]) m++;//选择下一个活动 if(m <= n){ activities.add(m); greedyActivitySelection(s, f, m, n, activities); } return activities; } //贪心算法的非递归解, assume f[] has been sorted and actId 0/n+1 is virtually added public static ArrayList<Integer> greedyActivitySelection2(int[] s, int[] f, int n, ArrayList<Integer> acitivities){ //所有真正的活动(不包括 活动0和 活动n+1)中,结束时间最早的那个活动一定是最大兼容活动集合中的 活动. int m = 1; acitivities.add(m); for(int actId = 2; actId <= n; actId++){ if(s[actId] >= f[m])//actId的开始时间在 m 号活动之后.--actId 与 m 没有冲突 { m = actId; acitivities.add(m); } } return acitivities; } //for test purpose public static void main(String[] args) { //添加了 a(0) 和 a(n+1)活动. 其中s(0)=f(0)=0, s(n+1)=f(n+1)=Integer.MAX_VALUE int[] s = {0,1,3,0,5,3,5,6,8,8,2,12,Integer.MAX_VALUE};//start time int[] f = {0,4,5,6,7,8,9,10,11,12,13,14,Integer.MAX_VALUE};//finish time int n = 11;//活动的个数 int result = maxCompatiableActivity(s, f, n); System.out.println("最大兼容活动个数: " + result); ArrayList<Integer> acts = new ArrayList<Integer>(); greedyActivitySelection(s, f, 0, n, acts); for (Integer activityId : acts) System.out.print(activityId + " "); System.out.println(); ArrayList<Integer> acts2 = new ArrayList<Integer>(); greedyActivitySelection2(s, f, n, acts2); for (Integer activityId : acts2) System.out.print(activityId + " "); } }
标签:
原文地址:http://www.cnblogs.com/hapjin/p/5573419.html