很多人对排序分类不是很清楚,其实我也不清楚,但是我可以发表一下自己的见解。排序算法分为两类,内部排序和外部排序。内部排序一般指的就是数据在内存里面的排序算法,数据量一般比较少。最大不多于2G,毕竟这就把用户进程地址全部占用了,其实根本不可能,卡死得。外部排序一般指的是数据在文件里面存放着,不排除数据库里面存放着。内部和外部的排序联系就是在这里了。大名鼎鼎的归并排序。
外部排序先把数据分成可以加载到内存的一些数据段,每一个数据段先排序,最后呢,利用归并排序排好再次存放到文件当中。归并排序可以有很多路,作为研究文章一般都是最典型的二路排序,再多的话就需要和需求相关了。数据量很不幸一般都不知道,所以用的是单链表节点。可以看看二路归并的实现了。
#include <stdio.h> #include <malloc.h> #include <memory.h> /************************************************************************ @ 链表节点 @ data -- 节点数据 @ next -- 下一个节点指针 ************************************************************************/ typedef struct node { int data; struct node* next; }node; /************************************************************************ @ 链表插入节点 ************************************************************************/ int node_insert(struct node* the_node,int data) { //找最后节点 struct node *cur_node=the_node; while (cur_node->next != NULL) { cur_node=cur_node->next; } //创建新节点 struct node* new_node=(struct node*)malloc(sizeof(struct node)*1); new_node->data=data; new_node->next=NULL; //添加新节点 cur_node->next=new_node; return 0; } /************************************************************************ @ 释放链表 ************************************************************************/ int node_free(struct node* the_node) { struct node* cur_node=NULL; while(the_node != NULL) { cur_node=the_node; the_node=the_node->next; free(cur_node); cur_node=NULL; } return 0; } /************************************************************************ @ 链表归并 ************************************************************************/ int list_merge(struct node* first,struct node* second,struct node** result) { //记录操作节点 struct node** cur_result=result; //选择小的 while(first != NULL && second != NULL) { if (first->data < second->data) { *cur_result=first; cur_result=&((*cur_result)->next); first=first->next; } else { *cur_result=second; cur_result=&((*cur_result)->next); second=second->next; } } //处理剩余 if (first != NULL) { *cur_result=first; } //处理剩余 if (second != NULL) { *cur_result=second; } return 0; } /************************************************************************ @ 主函数 -- 程序入口点 ************************************************************************/ int main() { //创建第一个链表 struct node* first=(struct node*)malloc(sizeof(struct node)*1); first->data=1; first->next=NULL; for (int i=2;i<10;i++) { node_insert(first,i); } //创建第二个链表 struct node* second=(struct node*)malloc(sizeof(struct node)*1); second->data=2; second->next=NULL; for (int i=14;i<100;i++) { node_insert(second,i); } //归并排序 struct node* result=NULL; list_merge(first,second,&result); //输出结果 struct node* out_result=result; while (out_result != NULL ) { printf("%d ___ ",out_result->data); out_result=out_result->next; } //释放链表 node_free(result); result=NULL; first=NULL; second=NULL; return 0; }
有图为证
1.二路归并最核心的就是merge里面的while循环了。比较大小。
2.再次就是剩余数据的处理,照样是while循环,我们不知道有多少个数据留下毕竟。
3.其他的就是单链表数据结构的典型构建了。
原文地址:http://blog.csdn.net/yonshi/article/details/40536337