今天学习了算法导论上的归并排序算法,并且完成了在纸上写出伪代码,以前就学过归并但是理解的不够透彻,以
前还一直困惑:为什么明明归并排序比快排的时间复杂度更稳定,为什么库函数不用归并而用快排,现在知道原因了,因为归并排序必须开额外的空间,而且空间开销还比较大,下面介绍算法:
首先,归并排序用到了分治的思想,把大数据分成若干个小数据,然后再分别对小数据进行处理,最后把小数据
合并成大数据。
其次,归并排序用到了一个最重要的特点,就是把两组已经排序的数据合并成一组有序数据,并且该过程的时间复
杂度为O(n)。
有序序列,那么,我们就可以在O(n)的时间内排好序,可是,问题是,A[0~n/2]和A[n/2+1,n-1]并不是有序序列,于是我们就要将他们都变成有序序列,如何变呢?我们再分别对A[0~n/2]和A[n/2+1,n-1]进行排序即可,对于A[0~n/2]来说,我们运用和以上相同的方法,把他分成A[0~n/2/2]和A[n/2+1,n/2],然后如果这两个数组均为有序序列的话,那么就可以把它们合并起来,然后在返回到上一层了,那么如何才能判断他们为有序呢?当只有一个元素的时候这个元素便是有序的,所以,只需要递归到元素个数为1,然后再返回合并即可。最后,算法便出来了,对于一个数组A[n]来说,我们要对他进行排序,首先,我们假设A[0~n/2]和A[n/2+1,n-1]为
下面是对以下下代码中的merge()(合并)函数正确性的证明:
1.当第一次循环迭代的时候,i = L, A[L, i-1]为空,是有序的序列(空也算有序序列),并且含有i-L=0个LA[n1],RA[n2]的最小的数,这时c1 = c2 = 0, LA[c1]和RA[c2]均为彼此数组中的最小的元素。
2.假设第i次迭代的时候LA[c1] <= RA[c2], 这时LA[c1]便是还没有被复制到A中的最小的元素,此时A中含有i-L个最小的元素,当执行A[i] = LA[c1]时,A中便含有i-L+1个最小的元素,然后增加c1和i进行下一次迭代,如果第一次时LA[c1] > RA[c2],执行相似的过程。
3.循环结束后,i = r+1, 此时A中含有i-L = r-L+1个最小的元素,恰好是l~r所有的元素,并且已排好序,证毕。
//insertion_sort #include <iostream> using namespace std; const int inf = (1<<28); void print(int* A, int n) { for (int i = 0; i < n; i++) { cout << A[i] << " "; } cout << endl; } void merge(int *A, int l, int m, int r) { int n1 = m-l+1, n2 = r-m; int lA[(const int)(n1+1)], rA[(const int)(n2+1)]; for (int i = 0; i < n1; i++) { lA[i] = A[i+l]; } for (int i = 0; i < n2; i++) { rA[i] = A[m+1+i]; } lA[n1] = rA[n2] = inf; int c1 = 0, c2 = 0; for (int i = l; i <= r; i++) { if (lA[c1] <= rA[c2]) { A[i] = lA[c1++]; } else { A[i] = rA[c2++]; } } } void merge_sort(int *A, int l, int r) { if (l < r) { int m = (l + r) / 2; merge_sort(A, l, m); merge_sort(A, m+1, r); merge(A, l, m, r); } } int main() { int A[10] = {43,2,53,1,8,29,52,4,8,10}; cout << "before sorted: "; print(A, 10); merge_sort(A, 0, 10); cout << "after sorted: "; print(A, 10); return 0; }
原文地址:http://blog.csdn.net/myhelperisme/article/details/42049955