其实在之前的TCP之中,我们编程实现了多进程,多线程机制下的TCP服务器,但是对于这种的TCP服务器而言,存在太大的资源局限性。所以我们可以是用I/0模型中的多路复用I/O模型来进行编程。
他的具体思想就是:当前进程可以处理多个相应时间,记录多个描述符,然后控制轮询时间态,当有响应产生的时候我们就去保存当前响应文件描述符,对他进行连接处理/数据传输就OK了。在一个进程进行多个响应时间的答复情况下,可以大大的节约我们系统所消耗的资源。
对这个进行操作的函数就是select():
他的函数原型如下:
首先我们不看select函数本身,我们先去看一下select下面的几个FD函数:
FD = fd,其实很简单,就是我们的文件描述符操作函数。
关于fd_set*类型的变量:其实就是一个对某种类型时间行为的文件描述符集合,称为描述词组。
FD_CLR(inr fd,fd_set* set);用来清除描述词组set中相关fd 的位
FD_ISSET(int fd,fd_set *set);用来测试描述词组set中相关fd 的位是否为真
FD_SET(int fd,fd_set*set);用来设置描述词组set中相关fd的位
FD_ZERO(fd_set *set);用来清除描述词组set的全部位。
然后我们来看一下select函数:
参数nfds是需要监视的最大的文件描述符值+1;
rdset,wrset,exset分别对应于需要检测的可读文件描述符的集合,可写文件描述符的集合及异
常文件描述符的集合。
struct timeval结构用于描述一段时间长度,如果在这个时间内,需要监视的描述符没有事件
发生则函数返回,返回值为0。
参数timeout为结构timeval,用来设置select()的等待时间,其结构定义如下:
如果参数timeout设为:
NULL:则表示select()没有timeout,select将一直被阻塞,直到某个文件描述符上发生了
事件。
0:仅检测描述符集合的状态,然后立即返回,并不等待外部事件的发生。
特定的时间值:如果在指定的时间段里没有事件发生,select将超时返回。
函数返回值:
执行成功则返回文件描述词状态已改变的个数
如果返回0代表在描述词状态改变前已超过timeout时间,没有返回;
当有错误发生时则返回-1,错误原因存于errno,此时参数readfds,writefds,exceptfds和
timeout的值变成不可预测。错误值可能为:
EBADF 文件描述词为无效的或该文件已关闭。
EINTR 此调用被信号所中断。
EINVAL 参数n 为负值。
ENOMEM 核心内存不足。
理解select模型的关键在于理解fd_set,为说明方便,取fd_set长度为1字节,fd_set中的每一bit
可以对应一个文件描述符fd。则1字节长的fd_set最大可以对应8个fd。
(1)执行fd_set set; FD_ZERO(&set);则set用位表示是0000,0000。
(2)若fd=5,执行FD_SET(fd,&set);后set变为0001,0000(第5位置为1)
(3)若再加入fd=2,fd=1,则set变为0001,0011
(4)执行select(6,&set,0,0,0)阻塞等待
(5)若fd=1,fd=2上都发生可读事件,则select返回,此时set变为0000,0011。注意:没有事件
发生的fd=5被清空。
基于上面的讨论,可以轻松得出select模型的特点:
(1)可监控的文件描述符个数取决与sizeof(fd_set)的值。我这边服务 器上sizeof(fd_set)=
512,每bit表示一个文件描述符,则我服务器上支持的最大文件描述符是512*8=4096。据说
可调,另有说虽然可调,但调整上限受于编译内核时的变量值。本人对调整fd_set的大小不
太感兴趣,参考http://www.cppblog.com /CppExplore/archive/2008/03/21/45061.html中的模
型2(1)可以有效突破select可监控的文件描述符上 限。
(2)将fd加入select监控集的同时,还要再使用一个数据结构array保存放到select监控集
中的fd,一是用于再select 返回后,array作为源数据和fd_set进行FD_ISSET判断。二是select
返回后会把以前加入的但并无事件发生的fd清空,则每次开始 select前都要重新从array取得fd
逐一加入(FD_ZERO最先),扫描array的同时取得fd最大值maxfd,用于select的第一个参数。
(3)可见select模型必须在select前循环array(加fd,取maxfd),select返回后循环array
(FD_ISSET判断是否有时间发生)。
对于利用select函数所编写的服务器端而言:
TCP服务端所产生的所有sock套接字描述符(文件描述符),其实都可以归纳到可读文件描述符集合中。
当我们检测到listen()的sock套接字就建立连接accept(),如果确认到是普通,也就是我们accept()所产生的文件描述符时,就确定这个是一条对于客户端/服务端的连接链路。然后我们就利用相关的函数操作进行信息传输,
timeout代表当次所进行的询问等待时间,需要注意的是就是每一次循环都必须重新设置timeout。
每一次循环开始都要对描述词组进行初始化,要不然当timeout耗尽而没有产生响应的话,会改变描述词组的值,从而产生错误。
select缺点:
(1)每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大
(2)同时每次调用select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大
(3)select支持的文件描述符数量太小了,默认是1024。
下面是I/O多路复用的代码:
服务器端:
#include<stdio.h> #include<sys/types.h> #include<sys/socket.h> #include<stdlib.h> #include<netinet/in.h> #include<arpa/inet.h> #include<unistd.h> #include<error.h> #include<assert.h> #define _BACKLOG_ 5 int fds[64]; //文件描述符集合 //命令行参数出错 static void usage(const char *proc) { printf("usage : %s [ip][port]\n",proc); } //服务器端TCP的链接绑定监听状态。 static int startup(char *ip,int port) { assert(ip); int sock = socket(AF_INET,SOCK_STREAM,0); if(sock < 0) { perror("socket"); exit(1); } int set = 1; if(setsockopt(sock, SOL_SOCKET, SO_REUSEADDR, &set, sizeof(set)) < 0) { perror("setsockopt"); exit(4); } struct sockaddr_in local; local.sin_family = AF_INET; local.sin_port = htons(port); local.sin_addr.s_addr = inet_addr(ip); if(bind(sock,(struct sockaddr*)&local,sizeof(local)) < 0) { perror("bind"); exit(2); } if(listen(sock,_BACKLOG_) < 0) { perror("listen"); exit(3); } return sock; } int main(int argc,char *argv[]) { //判断命令参数行. if(argc != 3) { usage(argv[0]); exit(1); } int port = atoi(argv[2]); char *ip = argv[1]; int listen_sock = startup(ip,port); int done = 0; int new_sock = -1; struct sockaddr_in client; socklen_t len = sizeof(client); int max_fd; //selet函数的第一个记录参数/ //读写事件文件描述符 fd_set reads; fd_set writes; int i = 0; int fds_num = sizeof(fds)/sizeof(fds[0]); //对文件描述符集合进行初始化 for(;i < fds_num;++i) { fds[i] = -1; } //当前存在listen文件描述符。 fds[0] = listen_sock; max_fd = fds[0]; //初次调用select函数设置max_fd的值; while(!done) { //初始化读写文件描述符 FD_ZERO(&reads); FD_ZERO(&writes); //将listen_sock设置为reads,因为时在等待请求相应,相当与当前的读取操作。 FD_SET(listen_sock,&reads); //设置多路复用中的轮寻时间表。 struct timeval timeout = {5,0}; //没次读取添加事件到reads中。; for(i = 1;i < fds_num; ++i) { if(fds[i] >0) { FD_SET(fds[i],&reads); if(fds[i] > max_fd) { max_fd = fds[i]; } } } switch(select(max_fd+1, &reads,&writes,NULL,NULL)) { case 0 ://timeout { printf("select timeout"); break; } case -1: { //error perror("select"); break; } default: { //返回改变了的文件描述. i = 0; //遍历所有的文件描述符集合。 for(;i<fds_num;++i) { //确认是否时监听时间,是的话就绪要accept; if(fds[i] == listen_sock && FD_ISSET(fds[i],&reads)) { new_sock = accept(listen_sock,(struct sockaddr*)&client,&len); if(new_sock <0) { perror("accept"); continue; } printf("get a new connet...%d\n",new_sock); for(i = 0;i< fds_num;++i) { if(fds[i] == -1) { fds[i] = new_sock; break; } } if(i == fds_num) { close(new_sock); } } else if(fds[i] > 0 && FD_ISSET(fds[i],&reads)) //正常事件,但是是非监听时间,也就代表时新建立的new_sock。 { char buf[1024]; ssize_t s = read(fds[i],buf,sizeof(buf) -1); if(s > 0) { buf[s] = ‘\0‘; // printf("client : %s\n",buf); printf("client : %s",buf); write(fds[i],buf,sizeof(s)+1); } else if(s == 0) { printf("client quit...\n"); close(fds[i]); fds[i] = -1; } else{} } else{} } } break; } } return 0; }
客户端:
#include<stdio.h> #include<unistd.h> #include<string.h> #include<error.h> #include<sys/types.h> #include<sys/socket.h> #include<arpa/inet.h> #define _PORT_ 8111 void process_conn_client(int s) { ssize_t size = 0; char buffer[1024]; while(1) { size = read(0,buffer,1024); if(size > 0) { write(s,buffer,size); size = read(s,buffer,1024); buffer[size] = ‘\0‘; printf("server:%s",buffer); //write(1,buffer,size); } } } int main() { int s; struct sockaddr_in server_sock; s = socket(AF_INET,SOCK_STREAM,0); if(s < 0) { printf("sock error"); return 1; } bzero(&server_sock,sizeof(server_sock)); server_sock.sin_family = AF_INET; server_sock.sin_addr.s_addr = htonl(INADDR_ANY); server_sock.sin_port = htons(_PORT_); connect(s,(struct sockaddr *)&server_sock,sizeof(server_sock)); process_conn_client(s); close(s); return 0; }
运行结果;
本文出自 “剩蛋君” 博客,请务必保留此出处http://memory73.blog.51cto.com/10530560/1783014
原文地址:http://memory73.blog.51cto.com/10530560/1783014