Linux进程间通信——使用流套接字
前面说到的进程间的通信,所通信的进程都是在同一台计算机上的,而使用 socket进行通信的进程可以是同一台计算机的进程,也是可以是通过网络连接起来的不同计算机上的进程。通常我们使用socket进行网络编程,这里将 会简单地讲述如何使用socket进行简单的网络编程。
一、什么是socket
socket,即套接字是一种通信机制,凭借这种机制,客户/服务器(即要进 行通信的进程)系统的开发工作既可以在本地单机上进行,也可以跨网络进行。也就是说它可以让不在同一台计算机但通过网络连接计算机上的进程进行通信。也因 为这样,套接字明确地将客户端和服务器区分开来。
二、套接字的属性
套接字的特性由3个属性确定,它们分别是:域、类型和协议。
1、套接字的域
它指定套接字通信中使用的网络介质,最常见的套接字域是AF_INET,它指 的是Internet网络。当客户使用套接字进行跨网络的连接时,它就需要用到服务器计算机的IP地址和端口来指定一台联网机器上的某个特定服务,所以在 使用socket作为通信的终点,服务器应用程序必须在开始通信之前绑定一个端口,服务器在指定的端口等待客户的连接。另一个域AF_UNIX表示 UNIX文件系统,它就是文件输入/输出,而它的地址就是文件名。
2、套接字类型
因特网提供了两种通信机制:流(stream)和数据报(datagram),因而套接字的类型也就分为流套接字和数据报套接字。这里主要讲流套接字。
流套接字由类型SOCK_STREAM指定,它们是在AF_INET域中通过 TCP/IP连接实现,同时也是AF_UNIX中常用的套接字类型。流套接字提供的是一个有序、可靠、双向字节流的连接,因此发送的数据可以确保不会丢 失、重复或乱序到达,而且它还有一定的出错后重新发送的机制。
与流套接字相对的是由类型SOCK_DGRAM指定的数据报套接字,它不需要 建立连接和维持一个连接,它们在AF_INET中通常是通过UDP/IP协议实现的。它对可以发送的数据的长度有限制,数据报作为一个单独的网络消息被传 输,它可能会丢失、复制或错乱到达,UDP不是一个可靠的协议,但是它的速度比较高,因为它并一需要总是要建立和维持一个连接。
3、套接字协议
只要底层的传输机制允许不止一个协议来提供要求的套接字类型,我们就可以为套接字选择一个特定的协议。通常只需要使用默认值。
三、套接字地址
每个套接字都有其自己的地址格式,对于AF_UNIX域套接字来说,它的地址由结构sockaddr_un来描述,该结构定义在头文件sys/un.h中,它的定义如下:
struct sockaddr_un{
sa_family_t sun_family;//AF_UNIX,它是一个短整型
char sum_path[];//路径名
};
对于AF_INET域套接字来说,它的地址结构由sockaddr_in来描述,它至少包括以下几个成员:
struct sockaddr_in{
short int sin_family;//AF_INET
unsigned short int sin_port;//端口号
struct in_addr sin_addr;//IP地址
};
而in_addr被定义为:
struct in_addr{
unsigned long int s_addr;
};
四、基于流套接字的客户/服务器的工作流程
使用socket进行进程通信的进程采用的客户/服务器系统是如何工作的呢?
1、服务器端
首先服务器应用程序用系统调用socket来创建一个套接安,它是系统分配给该服务器进程的类似文件描述符的资源,它不能与其他的进程共享。
接下来,服务器进程会给套接字起个名字,我们使用系统调用bind来给套接字命名。然后服务器进程就开始等待客户连接到这个套接字。
然后,系统调用listen来创建一个队列并将其用于存放来自客户的进入连接。
最后,服务器通过系统调用accept来接受客户的连接。它会创建一个与原有的命名套接不同的新套接字,这个套接字只用于与这个特定客户端进行通信,而命名套接字(即原先的套接字)则被保留下来继续处理来自其他客户的连接。
2、客户端
基于socket的客户端比服务器端简单,同样,客户应用程序首先调用socket来创建一个未命名的套接字,然后将服务器的命名套接字作为一个地址来调用connect与服务器建立连接。
一旦连接建立,我们就可以像使用底层的文件描述符那样用套接字来实现双向数据的通信。
五、流式socket的接口及作用
socket的接口函数声明在头文件sys/types.h和sys/socket.h中。
1、创建套接字——socket系统调用
该函数用来创建一个套接字,并返回一个描述符,该描述符可以用来访问该套接字,它的原型如下:
int socket(int domain, int type, int protocol);
函数中的三个参数分别对应前面所说的三个套接字属性。protocol参数设置为0表示使用默认协议。
2、命名(绑定)套接字——bind系统调用
该函数把通过socket调用创建的套接字命名,从而让它可以被其他进程使用。对于AF_UNIX,调用该函数后套接字就会关联到一个文件系统路径名,对于AF_INET,则会关联到一个IP端口号。函数原型如下:
int bind( int socket, const struct sockaddr *address, size_t address_len);
成功时返回0,失败时返回-1;
3、创建套接字队列(监听)——listen系统调用
该函数用来创建一个队列来保存未处理的请求。成功时返回0,失败时返回-1,其原型如下:
int listen(int socket, int backlog);
backlog用于指定队列的长度,等待处理的进入连接的个数最多不能超过这个数字,否则往后的连接将被拒绝,导致客户的连接请求失败。调用后,程序一直会监听这个IP端口,如果有连接请求,就把它加入到这个队列中。
4、接受连接——accept系统调用
该系统调用用来等待客户建立对该套接字的连接。accept系统调用只有当客 户程序试图连接到由socket参数指定的套接字上时才返回,也就是说,如果套接字队列中没有未处理的连接,accept将阻塞直到有客户建立连接为止。 accept函数将创建一个新套接字来与该客户进行通信,并且返回新套接字的描述符,新套接字的类型和服务器监听套接字类型是一样的。它的原型如下:
int accept(int socket, struct sockaddr *address, size_t *address_len);
address为连接客户端的地址,参数address_len指定客户结构的长度,如果客户地址的长度超过这个值,它将会截断。
5、请求连接——connect系统调用
该系统调用用来让客户程序通过在一个未命名套接字和服务器监听套接字之间建立连接的方法来连接到服务器。它的原型如下:
int connect(int socket, const struct sockaddr *address, size_t address_len);
参数socket指定的套接字连接到参数addres指定的服务器套接字。成功时返回0,失败时返回-1.
6、关闭socket——close系统调用
该系统调用用来终止服务器和客户上的套接字连接,我们应该总是在连接的两端(服务器和客户)关闭套接字。
六、进程使用流式socket进行通信
下面用多个客户程序和一个服务器程序来展示进程间如何利用套接字进行通信。
sockserver.c是一个服务器程序,它首先创建套接字,然后绑定一个 端口再监听套接字,忽略子进程的停止消息等,然后它进入循环,一直循环检查是否有客户连接到服务器,如果有,则调用fork创建一个子进程来处理请求。利 用read系统调用来读取客户端发来的信息,利用write系统调用来向客户端发送信息。这个服务器的工作非常简单,就是把客户发过来的字符+1,再发送 回给客户。
sockclient.c是一个客户程序,它同样要先创建套接,然后连接到指定IP端口服务器,如果连接成功,就用write来发送信息给服务器,再用read获取服务器处理后的信息,再输出。
服务器sockserver.c的源代码如下:
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <signal.h>
#include <stdio.h>
#include <stdlib.h>
int main()
{
int server_sockfd = -1;
int client_sockfd = -1;
int client_len = 0;
struct sockaddr_in server_addr;
struct sockaddr_in client_addr;
//创建流套接字
server_sockfd = socket(AF_INET, SOCK_STREAM, 0);
//设置服务器接收的连接地址和监听的端口
server_addr.sin_family = AF_INET;//指定网络套接字
server_addr.sin_addr.s_addr = htonl(INADDR_ANY);//接受所有IP地址的连接
server_addr.sin_port = htons(9736);//绑定到9736端口
//绑定(命名)套接字
bind(server_sockfd, (struct sockaddr*)&server_addr, sizeof(server_addr));
//创建套接字队列,监听套接字
listen(server_sockfd, 5);
//忽略子进程停止或退出信号
signal(SIGCHLD, SIG_IGN);
while(1)
{
char ch = ‘\0‘;
client_len = sizeof(client_addr);
printf("Server waiting\n");
//接受连接,创建新的套接字
client_sockfd = accept(server_sockfd, (struct sockaddr*)&client_addr, &client_len);
if(fork() == 0)
{
//子进程中,读取客户端发过来的信息,处理信息,再发送给客户端
read(client_sockfd, &ch, 1);
sleep(5);
ch++;
write(client_sockfd, &ch, 1);
close(client_sockfd);
exit(0);
}
else
{
//父进程中,关闭套接字
close(client_sockfd);
}
}
}
客户sockclient.c的源代码如下:
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <stdio.h>
#include <stdlib.h>
int main()
{
int sockfd = -1;
int len = 0;
struct sockaddr_in address;
int result;
char ch = ‘A‘;
//创建流套接字
sockfd = socket(AF_INET, SOCK_STREAM, 0);
//设置要连接的服务器的信息
address.sin_family = AF_INET;//使用网络套接字
address.sin_addr.s_addr = inet_addr("127.0.0.1");//服务器地址
address.sin_port = htons(9736);//服务器所监听的端口
len = sizeof(address);
//连接到服务器
result = connect(sockfd, (struct sockaddr*)&address, len);
if(result == -1)
{
perror("ops:client\n");
exit(1);
}
//发送请求给服务器
write(sockfd, &ch, 1);
//从服务器获取数据
read(sockfd, &ch, 1);
printf("char form server = %c\n", ch);
close(sockfd);
exit(0);
}
运行结果如下:
在本例子中,我们启动了一个服务器程序和三个客户程序,从运行的结果来看,客 户端发送给服务器程序的所有请求都得到了处理,即把A变成了B。对于服务器和客户程序之间使用的read和write系统调用跟使用命名管道时阻塞的 read、write系统调用一样。例如客户程序调用read时,如果服务器程序没有向指定的客户程序的socket中写入信息,则read调用会一直阻 塞。
七、流式套接字给我印象
给我的感觉是流式套接字很像命名管道,但是它却可以使不在同一台计算机而通过网络连接的不同计算机上的进程进行通信,功能真是非常的强大。
Linux进程间通信——使用数据报套接字
前一篇文章,Linux进程间通信——使用流套接字介绍了一些有关socket(套接字)的一些基本内容,并讲解了流套接字的使用,这篇文章将会给大家讲讲,数据报套接字的使用。
一、简单回顾——什么是数据报套接字
socket,即套接字是一种通信机制,凭借这种机制,客户/服务器(即要进 行通信的进程)系统的开发工作既可以在本地单机上进行,也可以跨网络进行。也就是说它可以让不在同一台计算机但通过网络连接计算机上的进程进行通信。也因 为这样,套接字明确地将客户端和服务器区分开来。
相对于流套接字,数据报套接字的使用更为简单,它是由类型 SOCK_DGRAM指定的,它不需要建立连接和维持一个连接,它们在AF_INET中通常是通过UDP/IP协议实现的。它对可以发送的数据的长度有限 制,数据报作为一个单独的网络消息被传输,它可能会丢失、复制或错乱到达,UDP不是一个可靠的协议,但是它的速度比较高,因为它并一需要总是要建立和维 持一个连接。
二、基于流套接字的客户/服务器的工作流程
使用数据报socket进行进程通信的进程采用的客户/服务器系统是如何工作的呢?
1、服务器端
与使用流套接字一样,首先服务器应用程序用系统调用socket来创建一个套接安,它是系统分配给该服务器进程的类似文件描述符的资源,它不能与其他的进程共享。
接下来,服务器进程会给套接字起个名字(监听),我们使用系统调用bind来给套接字命名。然后服务器进程就开始等待客户连接到这个套接字。
不同的是,然后系统调用recvfrom来接收来自客户程序发送过来的数据。服务器程序对数据进行相应的处理,再通过系统调用sendto把处理后的数据发送回客户程序。
与流套接字程序相比:
1、在流套接字中的程序中,接收数据是通过系统调用read,而发送数据是通过系统调用write来实现,而在数据报套接字程序中,这是通过recvfrom和sendto调用来实现的。
2、使用数据报套接字的服务器程序并不需要listen调用来创建一个队列来存储连接,也不需要accept调用来接收连接并创建一个新的socket描述符
2、客户端
基于数据报socket的客户端比服务器端简单,同样,客户应用程序首先调用socket来创建一个未命名的套接字,与服务器一样,客户也是通过sendto和recvfrom来向服务器发送数据和从服务器程序接收数据。
与流套接字程序相比:
使用数据报套接字的客户程序并不需要使用connect系统调用来连接服务器程序,它只要在需要时向服务器所监听的IP端口发送信息和接收从服务器发送回来的数据即可。
三、数据报socket的接口及作用
socket的接口函数声明在头文件sys/types.h和sys/socket.h中。
1、创建套接字——socket系统调用
该函数用来创建一个套接字,并返回一个描述符,该描述符可以用来访问该套接字,它的原型如下:
int socket(int domain, int type, int protocol);
函数中的三个参数分别对应前面所说的三个套接字属性。protocol参数设置为0表示使用默认协议。
2、命名(绑定)套接字——bind系统调用
该函数把通过socket调用创建的套接字命名,从而让它可以被其他进程使用。对于AF_UNIX,调用该函数后套接字就会关联到一个文件系统路径名,对于AF_INET,则会关联到一个IP端口号。函数原型如下:
int bind( int socket, const struct sockaddr *address, size_t address_len);
成功时返回0,失败时返回-1;
3、发送数据——sendto系统调用
该函数把缓冲区buffer中的信息给送给指定的IP端口的程序,原型如下:
int sendto(int sockfd, void *buffer, size_t len, int flags, struct sockaddr *to, socklen_t tolen);
buffer中储存着将要发送的数据,len是buffer的长度,而flags在应用中通常被设置为0,to是要发送数据到的程序的IP端口,tolen是to参数的长度。
成功时返回发送的数据的字节数,失败时返回-1.
4、接收数据——recvfrom系统调用
该函数把发送给程序的信息储存在缓冲区buffer中,并记录数据来源的程序IP端口,原型如下:
int recvfrom(int sockfd, void *buffer, size_t len,int flags, struct sockaddr *src_from, socklen_t *src_len);
buffer用于储存接收到的数据,len指定buffer的长度,而flags在应用中通常被设置0,src_from若不为空,则记录数据来源程序的IP端口,若src_len不为空,则其长度信息记录在src_len所指向的变量中。
注意:默认情况下,recvfrom是一个阻塞的调用,即直到它接收到数据才会返回。
5、关闭socket——close系统调用
该系统调用用来终止服务器和客户上的套接字连接,我们应该总是在连接的两端(服务器和客户)关闭套接字。
四、进程使用数据报socket进行通信
下面用多个客户程序实例和一个服务器程序来演示多个进程如何通过使用数据报socket来进行通信。
sockserver2.c是一个服务器程序,它接收客户程序发来的数据,并创建一个子进程来处理客户发送过来的数据,处理过程非常简单,就是把大写字母改为小写。然后把处理后的数据(大写字母对应的小写字母)发送回给客户端。
sockclient2.c是一个客户程序,它向服务器程序发送数据,并接收 服务器发送过来的处理后的数据(即小写字母),然后把接收到的数据输出到屏幕上。在运行客户程序时,你可以为它提供一个字符作为参数,此时客户程序将把些 字符作为要处理的数据发送给服务器,如果不提供一个参数,则默认发送字符A。
sockserver2.c的源代码如下:
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
int main()
{
int server_sockfd = -1;
int server_len = 0;
int client_len = 0;
char buffer[512];
int result = 0;
struct sockaddr_in server_addr;
struct sockaddr_in client_addr;
//创建数据报套接字
server_sockfd = socket(AF_INET, SOCK_DGRAM, 0);
//设置监听IP端口
server_addr.sin_family = AF_INET;
server_addr.sin_addr.s_addr = htonl(INADDR_ANY);
server_addr.sin_port = htons(9739);
server_len = sizeof(server_addr);
//绑定(命名)套接字
bind(server_sockfd, (struct sockaddr*)&server_addr, server_len);
//忽略子进程停止或退出信号
signal(SIGCHLD, SIG_IGN);
while(1)
{
//接收数据,用client_addr来储存数据来源程序的IP端口
result = recvfrom(server_sockfd, buffer, sizeof(buffer), 0,
(struct sockaddr*)&client_addr, &client_len);
if(fork() == 0)
{
//利用子进程来处理数据
buffer[0] += ‘a‘ - ‘A‘;
sleep(5);
//发送处理后的数据
sendto(server_sockfd, buffer, sizeof(buffer),0 ,
(struct sockaddr*)&client_addr, client_len);
printf("%c\n", buffer[0]);
//注意,一定要关闭子进程,否则程序运行会不正常
exit(0);
}
}
//关闭套接字
close(server_sockfd);
}
sockclient2.c的源代码如下:
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <stdlib.h>
#include <stdio.h>
int main(int agrc, char *argv[])
{
struct sockaddr_in server_addr;
int server_len = 0;
int sockfd = -1;
int result = 0;
char c = ‘A‘;
//取第一个参数的第一个字符
if(agrc > 1)
c = argv[1][0];
//创建数据报套接字
sockfd = socket(AF_INET, SOCK_DGRAM, 0);
//设置服务器IP端口
server_addr.sin_family = AF_INET;
server_addr.sin_addr.s_addr = inet_addr("127.0.0.1");
server_addr.sin_port = htons(9739);
server_len = sizeof(server_addr);
//向服务器发送数据
sendto(sockfd, &c, sizeof(char), 0,
(struct sockaddr*)&server_addr, server_len);
//接收服务器处理后发送过来的数据,由于不关心数据来源,所以把后两个参数设为0
recvfrom(sockfd, &c, sizeof(char), 0, 0, 0);
printf("char from server = %c\n", c);
//关闭套接字
close(sockfd);
exit(0);
}
运行结果如下:
先运行服务器程序,如下:
再运行三个客户端:如下:
在本例子中,我们启动了一个服务器程序和三个客户程序,从运行的结果来看,客户端发送给服务器程序的所有请求都得到了处理,即把大写字母变成了小写。recvfrom调用是阻塞的调用,即只有当接收到数据才会返回。
五、数据报套接字与流套接字的比较
1、从使用的便利和效率来讲
我们可以看到使用数据报套接字的确是比使用流套接字简单,而且快速。
因为使用流套接字的程序,客户程序需要调用connect来创建一个到服务器 程序的连接,并需要维持这个连接,服务器程序也需要调用listen来创建一个队列来保存未处理的请求,当有数据到达时,服务器也不需要调用accept 来接受连接并创建一个新socket描述符来处理请求。
再来看看使用数据报套接字的程序,服务器程序与客户程序所使用的系统调用大致 相同,服务器程序只比客户程序多使用了一个bind调用。基于数据报套接字的程序,只需要使用sendto调用来向指定IP端口的程序发送信息,使用 recvfrom调用从指向的IP端口接收信息即可。因为它并不需要建立一个连接,接受连接等,所以省去了很多的功夫。
2、从使用场合来讲
我们知道流套接字是基于TCP/IP协议的,它是一种安全的协议,提供的是一 个有序、可靠、双向字节流的连接,发送的数据可以确保不会丢失、重复或乱序到达,而且它还有一定的出错后重新发送的机制。所以它比较适合用来发送信息量大 的数据文件,或对数据完整性要求较高的文件,如压缩文件、视频文件等
而数据报套接字是基于UDP/IP协议实现的。它对可以发送的数据的长度有限 制,数据报作为一个单独的网络消息被传输,它可能会丢失、复制或错乱到达,UDP不是一个可靠的协议,但是它的速度比较高。所以它比较适合发送一些对实时 性要求较高,但是对安全性和完整性要求不太高的数据。如我们熟悉的聊天信息,即使有一点的丢失也不会造成理解上的大的问题。