标签:
虽然排序算法是一个简单的问题,但绝对是笔试面试的基础考点,重重之重。来个排序问题都没回答出来,留给面试官的印象也就那样了。
排序主要分为:
比较排序:快速排序、堆排序、归并排序、插入排序、希尔排序、选择排序、冒泡排序
非比较排序:基数排序、计数排序、桶排序
性能比较点:
时间复杂度:一般而言,好的性能是O(nlgn),且坏的性能是O(n^2)。对于一个排序理想的性能是O(n)
稳定性:是否能让原本有相等键值的纪录维持相对次序。
一、插入排序
《算法导论》的第2章介绍了插入排序及其算法分析。
核心:有序序列+直接插入
描述:维持一个有序区,将无序区的第一个元素直接插入到有序区,形成新的有序序列,最终实现排序。最优、平均、最差时间复杂度为θ(n^2)。
算法步骤为:
1、 从第一个元素开始,该元素可以认为已经被排序
2、 取出下一个元素,在已经排序的元素序列中从后向前扫描
3、 如果该元素(已排序)大于新元素,将该元素移到下一位置
4、 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置
5、 将新元素插入到该位置后
6、 重复步骤2~5
上图:
伪代码为:
- INSERTION-SORT(A)
- for j <- 2 to length[A]
- do key <- A[j]
- Insert A[j] into the sorted sequence A[1..j-1]
- i <- j-1
- while i>0 and A[i]>key
- do A[i+1] <- A[i]
- i <- i-1
- A[i+1] <- key
实现:
- #include<assert.h>
- #include<iostream>
- #include<algorithm>
- #include<iterator>
- usingnamespace std;
- voidinsert_sort(int *a,int len){
- assert(a!=NULL && len>0);
- int key=0,i=0;
- for(int pos=1;pos<len;++pos){
- key = a[pos];
- i = pos-1;
- while(i>=0 && a[i]>key){
- a[i+1]=a[i];
- i--;
- }
- a[i+1] = key;
- }
- }
- int main(){
- int seq[]={3,7,8,5,2,1,9,5,4};
- int length=sizeof(seq)/sizeof(int);
- copy(seq,seq+length,ostream_iterator<int>(cout,""));
- cout<<endl;
- insert_sort(seq,length);
- copy(seq,seq+length,ostream_iterator<int>(cout,""));
- cout<<endl;
- return 0;
- }
结果:
Eg. 请写出链表的插入排序程序 (copy过来的)
- template<typenameT>
- structlist_node{
- struct list_node<T> *next;
- T value;
- };
- template<typenameT>
- struct _list{
- struct list_node<T> *head;
- int size;
- };
- template<typenameT>
- voidSortLink(struct _list<T> * link) {
- struct list_node<T>*pHead,*pRear,*p,*tp;
- if (!link) return;
- for(pHead=link->head,pRear=0;pHead;pHead=pHead->next) {
- for(tp=pHead,p=pHead->next;p;tp=p,p=p->next)
- if (pHead->value>=p->value)
- tp->next=p->next,p->next=pHead,pHead=p,p=tp;
- if (!pRear) link->head=pHead;
- else pRear->next=pHead;
- pRear=pHead;
- }
- }
二、二分查找排序
二分查找排序是插入排序的一个变种。改进点:对有序区从末尾一个一个直接比较,改为效率更高的二分查找。在速率上有一定的提升。二分插入排序元素移动次数与直接插入排序相同,最佳情况O(nlgn),最差和平均情况O(n^2)
实现:
- voidbinary_insert_sort(int *a,int len){
- assert(a!=NULL && len>0);
- int begin=0,end=0,middle=0;
- int key=0,i=0;
- for(int pos=1;pos<len;++pos){
- key = a[pos];
- begin=0;
- end=pos-1;
- while(begin<=end){
- middle = (begin+end)/2;
- if(a[middle]>key)
- end=middle-1;
- else
- begin=middle+1;
- }
-
- i=pos-1;
- while(i>=begin){
- a[i+1]=a[i];
- --i;
- }
- a[begin] = key;
- }
- }
三、希尔排序
Shell sort,递减增量排序算法,因DL.Shell于1959年提出而得名,是插入排序的一种更高效的改进版本。
核心:增量分组+插入排序+增量递减
描述:希尔排序是非稳定排序算法,希尔排序的时间复杂度与增量序列的选取有关,希尔增量时间复杂度为O(n^2)。
步骤:
1、先取一个小于n的整数d1作为第一个增量,把文件的全部记录分组。所有距离为d1的倍数的记录放在同一个组中,在各组内进行直接插入排序。
2、取第二个增量d2<d1重复上述的分组和排序,
3、直至所取的增量dt=1(dt<dt-l<…<d2<d1),即所有记录放在同一组中进行直接插入排序为止。
上图:
伪代码
- input: an array a of length n with array elements numbered 0 to n − 1
- inc ← round(n/2)
- while inc > 0 do:
- for i = inc .. n − 1 do:
- temp ← a[i]
- j ← i
- while j ≥ inc and a[j − inc]> temp do:
- a[j] ← a[j − inc]
- j ← j − inc
- a[j] ← temp
- inc ← round(inc / 2)
实现:
- #include <assert.h>
- #include <iostream>
- #include <algorithm>
- #include <iterator>
- using namespace std;
- void shell_sort(int *a,int len){
- assert(a!=NULL && len>0);
- int key=0;
- for(int gap=len/2;gap>0;gap/=2){
- for(int i=gap;i<len;++i){
- key=a[i];
- int j=i-gap;
- while(j>=0 && a[j]>key){
- a[j+gap]=a[j];
- j-=gap;
- }
- a[j+gap]=key;
- }
- }
- int main(){
- int seq[]={3,7,8,5,2,1,9,5,4};
- int length=sizeof(seq)/sizeof(int);
- copy(seq,seq+length,ostream_iterator<int>(cout," "));
- cout<<endl;
- cout<<"begin: "<<endl;
- shell_sort(seq,length);
- cout<<"end: "<<endl;
- copy(seq,seq+length,ostream_iterator<int>(cout," "));
- cout<<endl;
- return 0;
- }
结果
四、选择排序
Selection sort是一种简单直观的排序算法。
核心:有序区+选无序区的极值
描述:将无序区的最值放在有序区的末尾,以此对序列进行排序最好、平均和最坏运行时间为θ(n^2)。
算法步骤为:(此处为递减序列,递增则选无序区的最大值)
1、初始状态:无序区为R[1..n],有序区为空。
2、第i趟排序开始时,当前有序区和无序区分别为R[1..i-1]和R[i…n]。该趟排序从当前无序区中选出关键字最小的记录R[k],将它与无序区的第1个记录R交换,使R[1..i]和R分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区。
3、前n-1趟结束,数组有序化了
上图:
伪代码为:
- SELECTION-SORT(A)
- for j = 1 to Length(A)
- i = j
- key = A(i)
- for i to Lenth(A)
- if key>A(i)
- key = A(i)
- k = i
- A(k) = A(j)
- A(j) = key
实现:
- #include <assert.h>
- #include <iostream>
- #include <algorithm>
- #include <iterator>
- using namespace std;
- void select_sort(int *a,int len){
- assert(a!=NULL && len>0);
- int max=0,pos=0;
- for(int i=0;i<len;++i){
- max=a[i];
- pos=i;
- for(int j=i;j<len;++j){
- if(a[j]>max){
- pos=j;
- max=a[j];
- }
- }
- swap(a[i],a[pos]);
- }
- }
- int main(){
- int seq[]={3,7,8,5,2,1,9,5,4};
- int length=sizeof(seq)/sizeof(int);
- copy(seq,seq+length,ostream_iterator<int>(cout," "));
- cout<<endl;
- cout<<"begin: "<<endl;
- select_sort(seq,length);
- cout<<"end: "<<endl;
- copy(seq,seq+length,ostream_iterator<int>(cout," "));
- cout<<endl;
- return 0;
- }
结果:
五、归并排序
《算法导论》的第2章介绍了归并排序及其算法分析,并引入了分治算法策略,divide-and-conquer。
核心:分治
描述:指的是将两个已经排序的串行合并成一个串行的操作。最坏情况下运行时间为θ(n^2),但是平均性能相当好,期望的运行时间为θ(nlgn)。
算法步骤为:
1、 Divide: 把长度为n的输入序列分成两个长度为n/2的子序列
2、 Conquer: 对这两个子序列分别采用归并排序
3、 Combine: 将两个排序好的子序列合并成一个最终的排序序列。
上图:
伪代码为:
- MERGE(A,p,q,r)
- N1←q-p+1
- N2←r-q
- Creat arrays L[1……n1+1] and R[1….n2+1]
- For i←1 to n1
- Do l[i]←A[p+i-1]
- For j←1 to n2
- Do R[j]←A[q+j]
- L[n1+1]←∞
- R[n2+1]←∞
- i←1
- j←1
- for k←p to r
- do if Li]<=R[j]
- then A[k]←l[j]
- i←i+1
- else A[k]←R[j]
- j←j+1
-
- NERGE_SORT(A,p,r)
- If p<r
- Then q←[(p+r)/2]
- MERGE_SORT(A,p,q)
- MERGE_SORT(A,p+1,q)
- MERGE_SORT(A,p,q,r)
实现
- #include<assert.h>
- #include<iostream>
- #include<algorithm>
- #include<iterator>
- usingnamespace std;
- voidcombine_array(int *a,int b,int m,int e,int *temp){
- assert(a!=NULL && b>=0 &&m>=0 && e>=0 && temp!=NULL);
- int i=b,j=m+1,pos=0;
- while(i<=m && j<=e){
- if(a[i]<=a[j])
- temp[pos++]=a[i++];
- else
- temp[pos++]=a[j++];
- }
- while(i<=m)
- temp[pos++]=a[i++];
- while(j<=m)
- temp[pos++]=a[j++];
- for(i=0;i<pos;++i){
- a[b+i]=temp[i];
- }
- }
- voidmerge_sort(int *a,int begin,int end,int *temp){
- assert(a!=NULL && begin>=0&& end>=0 && temp!=NULL);
- if(begin<end){
- int middle = (begin+end)/2;
- merge_sort(a,begin,middle,temp);
- merge_sort(a,middle+1,end,temp);
- combine_array(a,begin,middle,end,temp);
- }
- }
- int main(){
- int seq[]={3,7,8,5,2,1,9,5};
- int length=sizeof(seq)/sizeof(int);
- int *t = new int(length);
- copy(seq,seq+length,ostream_iterator<int>(cout,""));
- cout<<endl;
- cout<<"begin: "<<endl;
- merge_sort(seq,0,length-1,t);
- cout<<"end: "<<endl;
- copy(seq,seq+length,ostream_iterator<int>(cout,""));
- cout<<endl;
- delete t;
- return 0;
- }
结果:
六、冒泡排序
Bubble sort是一种简单的排序算法。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。
核心:比大小
描述:冒泡排序是与插入排序拥有相等的执行时间。最优O(n),平均、最初O(n^2)。
步骤
1、比较相邻的元素。如果第一个比第二个大,就交换他们两个。
2、对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。
3、针对所有的元素重复以上的步骤,除了最后一个。持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。
上图
伪代码
- function bubblesort (A : list[0..n-1]) {
- var inti, j;
- for i fromn-1 downto 0 {
- for j from 0 to i {
- if(A[j] > A[j+1])
- swap(A[j], A[j+1])
- }
- }
- }
实现
- #include<assert.h>
- #include<iostream>
- #include<algorithm>
- #include<iterator>
- usingnamespace std;
- voidbubble_sort(int *a,int len){
- assert(a!=NULL && len>0);
- for(int i=0;i<=len-1;++i){
- for(int j=0;j<=len-1-i;++j)
- if(a[j]>a[j+1])
- swap(a[j],a[j+1]);
- }
- }
- int main(){
- int seq[]={3,7,8,5,2,1,9,5,4};
- int length=sizeof(seq)/sizeof(int);
- copy(seq,seq+length,ostream_iterator<int>(cout,""));
- cout<<endl;
- cout<<"begin: "<<endl;
- bubble_sort(seq,length);
- cout<<"end: "<<endl;
- copy(seq,seq+length,ostream_iterator<int>(cout,""));
- cout<<endl;
- return 0;
- }
结果
七、快速排序
算法导论的第七章介绍了快速排序及其算法分析。
核心:分治+递归
描述:快速排序采用的是分治算法思想,分而治之,各个击破。最坏情况下运行时间为θ(n^2),但是平均性能相当好,期望的运行时间为θ(nlgn)。
算法步骤为:
1、pivot:从数列中挑出一个元素作为基准
2、partition:重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。
3、recursive:把两个子序列递归排序
上图:
伪代码为:
- function quicksort(q)
- var list less,pivotList, greater
- if length(q) ≤ 1 {
- return q
- } else {
- select a pivot value pivotfrom q
- for each x inq except the pivot element
- if x < pivot thenadd x to less
- if x ≥ pivot thenadd x to greater
- add pivot topivotList
- returnconcatenate(quicksort(less), pivotList, quicksort(greater))
- }
实现:快排的基准值可以以多种方式获得。取首元素,末尾元素,或者干脆来个随机取值。
维基的百科的实现非常经典,代码如下
- struct Range{
- explicit Range(int s=0,int e=0):start(s),end(e){}
- int start,end;
- };
- void quicksort(int n,int arr[]){
- if(n<=0) return;
- stack<Range> st;
- st.push(Range(0,n-1));
- while(!st.empty()){
- Range range = st.top();
- st.pop();
- int pivot = arr[range.end];
- int pos = range.start-1;
- for(int i=range.start;i<range.end;++i){
- if(arr[i]<pivot){
- std::swap(arr[i],arr[++pos]);
- }
- }
- std::swap(arr[++pos],arr[range.end]);
- if(pos-1>range.start){
- st.push(Range(range.start,pos-1));
- }
- if(pos+1<range.end){
- st.push(Range(pos+1,range.end));
- }
- }
- }
自己的实现代码,加了个判断,相等就不交换:
- #include<assert.h>
- #include<iostream>
- #include<algorithm>
- #include<iterator>
- usingnamespace std;
- voidquick_sort(int *a,int len){
- assert(a);
- int pivot=0,low=0,pos=0;
- if(len>1){
- pivot = a[len-1];
- for(pos=0,low=0;pos<len-1;++pos){
- if(a[pos]<pivot){
- if(a[pos]==a[low]){
- ++low;
- continue;
- }
- swap(a[pos],a[low++]);
- }
- }
- swap(a[low],a[len-1]);
- quick_sort(a,low);
- quick_sort(a+low+1,len-low-1);
- }
- }
-
- int main(){
- int seq[]={3,7,8,5,2,1,9,5,4};
- int length=sizeof(seq)/sizeof(int);
- copy(seq,seq+length,ostream_iterator<int>(cout,""));
- cout<<endl;
- quick_sort(seq,length);
- copy(seq,seq+length,ostream_iterator<int>(cout,""));
- cout<<endl;
- return 0;
- }
运行结果:
八、堆排序
《算法导论》的第6章引入了堆、最大堆、最小堆的概念,由此引入了堆排序。Heap sort是利用数据结构堆所设计的一种排序算法。堆的性质是即子结点的键值或索引总是小于(或者大于)它的父节点。
核心:最大(小)堆+建立堆+堆调整
堆节点的性质:父节点i的左子节点在位置 (2*i+1);父节点i的右子节点在位置 (2*i+2);子节点i的父节点在位置 floor((i-1)/2);
描述,最优、平均和最差时间复杂度O(nlgn)
最大堆调整(Max_Heapify):将堆的末端子节点作调整,使得子节点永远小于父节点
从图中可以看出,在节点i=2时,不满足最大堆的要求,需要进行调整,选择节点2的左右孩子中最大一个进行交换,然后检查交换后的节点i=4是否满足最大堆的要求,从图看出不满足,接着进行调整,直到没有交换为止。
递归形式:
- voidadjust_max_heap_recursive(int *datas,int length,int i){
- int left,right,largest;
- int temp;
- left = LEFT(i);
- right = RIGHT(i);
-
- if(left<=length && datas[left]> datas[i])
- largest = left;
- else
- largest = i;
- if(right <= length &&datas[right] > datas[largest])
- largest = right;
-
- if(largest != i){
- temp = datas[i];
- datas[i] = datas[largest];
- datas[largest] = temp;
-
- adjust_max_heap(datas,length,largest);
- }
- }
非递归形式:
- voidadjust_max_heap(int *datas,int length,int i){
- int left,right,largest;
- int temp;
- while(1){
- left = LEFT(i);
- right = RIGHT(i);
-
- if(left <= length &&datas[left] > datas[i])
- largest = left;
- else
- largest = i;
- if(right <= length &&datas[right] > datas[largest])
- largest = right;
-
- if(largest != i){
- temp = datas[i];
- datas[i] = datas[largest];
- datas[largest] = temp;
- i = largest;
- continue;
- }
- else
- break;
- }
- }
创建最大堆(Build_Max_Heap):将堆所有数据重新排序,从最后一个非叶子节点(n/2)开始调整。
- voidbuild_max_heap(int *datas,int length)
- {
- int i;
-
- for(i=length/2;i>0;i--)
- adjust_max_heap(datas,length,i);
- }
堆排序(HeapSort):第一个数据的根节点与最后一个节点交换,堆长度减1,并做最大堆调整的递归运算
(1)创建最大堆,数组第一个元素最大,执行后结果下图:
(2)进行循环,从length(a)到2,并不断的调整最大堆,给出一个简单过程如下:
排序函数:
- voidheap_sort(int *datas,int length){
- int i,temp;
-
- build_max_heap(datas,length);
- i=length;
-
- while(i>1){
- temp = datas[i];
- datas[i] = datas[1];
- datas[1] =temp;
- i--;
-
- adjust_max_heap(datas,i,1);
- }
- }
结果
- #include<iostream>
- usingnamespace std;
- void sift(intd[], int ind, int len){
-
- int i = ind;
-
- int c = i * 2 + 1;
- while(c < len)
-
-
- if(c + 1 < len && d[c] <d[c + 1])
- c++;
-
- if(d[i] > d[c]) break;
- else{
-
- int t = d[c];
- d[c] = d[i];
- d[i] = t;
-
-
- i = c;
- c = 2 * i + 1;
- }
- }
- return;
- }
-
- voidheap_sort(int d[], int n){
-
- for(int i = (n - 2) / 2; i >= 0; i--)
- sift(d, i, n);
- for(int j = 0; j < n; j++){
-
- int t = d[0];
- d[0] = d[n - j - 1];
- d[n - j - 1] = t;
-
- sift(d, 0, n - j - 1);
- }
- }
- int main(){
- int a[] = {4,1,3,16,9,10,14,8,7};
- heap_sort(a, sizeof(a) / sizeof(*a));
- for(int i = 0; i < sizeof(a) /sizeof(*a); i++){
- cout << a[i] << ‘ ‘;
- }
- cout << endl;
- return 0;
- }
排序总结
标签:
原文地址:http://www.cnblogs.com/xiaodi914/p/5800806.html