Unix下可用的五种 I/O 模型

时间：2019-05-26 12:51:38 阅读：83 评论：0 收藏：0 [点我收藏+]

当TCP客户端同时处理两个输入时：标准输入和TCP套接字，当客户端fgets（在标准输入上）被阻塞并且服务器进程被终止时，我们遇到了问题。服务器TCP正确地将FIN发送到客户端TCP，但由于客户端进程被禁止从标准输入读取，所以它从没有看到EOF，直到它从套接字读取（可能更晚）。

如果一个或多个I / O条件准备好（即，输入准备好被读取，或者描述符能够获得更多输出），我们希望得到通知。此功能称为 I/O 多路复用，由select和poll函数以及前者的较新POSIX变体提供，称为pselect。

在以下场景中，I / O复用通常用于网络应用程序：

I / O复用不仅限于网络编程。许多重要的应用程序都需要这些技术。

我们首先检查Unix下可用的五种 I/O 模型的基本差异：

输入操作通常有两个不同的阶段：

最流行的I / O模型是阻塞I / O模型（我们在前面的部分中使用了所有示例）。默认情况下，所有套接字都是阻塞的。场景如下图所示：

技术图片

我们在这个例子中使用UDP而不是TCP，因为对于UDP，数据“准备好”读取的概念很简单：要么已经接收到整个数据报，要么没有接收到。使用TCP它会变得更复杂，因为插座的低水位标记等附加变量会起作用。

我们还将recvfrom系统调用称为区分我们的应用程序和内核，无论如何recvfrom实现（BSD getmsg上的系统调用和调用System V上的系统调用的函数）。通常会有一个从应用程序中运行到内核中运行的切换，之后会在一段时间后返回到应用程序。

在上图中，进程调用recvfrom和系统调用在数据报到达并复制到应用程序缓冲区之前不会返回，或者发生错误。最常见的错误是系统调用被信号中断。我们说过程从调用recvfrom到返回的整个时间都被阻止。当recvfrom成功返回时，我们的应用程序处理的数据包。

当一个套接字设置为非阻塞时，我们告诉内核“当我请求的I / O操作无法在不使进程进入休眠状态时完成时，不要让进程进入休眠状态，而是返回错误”。该图如下：

技术图片

当一个应用程序坐在循环中调用recvfrom这样的非阻塞描述符时，它被称为轮询。应用程序不断轮询内核以查看某些操作是否已准备就绪。这通常是浪费CPU时间，但偶尔会遇到此模型，通常在专用于一个功能的系统上。

通过I / O多路复用，我们在这两个系统调用之一中调用select或poll阻塞，而不是在实际的I / O系统调用中阻塞。该图是I / O复用模型的摘要：

技术图片

我们阻塞调用select，等待数据报套接字可读。当select返回套接字可读时，我们然后调用recvfrom将数据报复制到我们的应用程序缓冲区中。

另一个密切相关的I / O模型是使用阻塞I / O的多线程。该模型非常类似于上面描述的模型，除了不使用select阻塞多个文件描述符，程序使用多个线程（每个文件描述符一个），然后每个线程可以自由调用阻塞系统调用recvfrom。

该信号驱动I / O模型使用的信号，告诉内核与通知我们SIGIO信号时，描述符已准备就绪。该图如下：

技术图片

我们首先为信号驱动的I / O启用套接字，并使用sigaction系统调用安装信号处理程序。此系统调用的返回是立即的，我们的过程继续进行; 它没有被阻止。
当准备好读取数据报时，SIGIO将为我们的过程生成信号。我们可以：
- 通过调用从信号处理程序读取数据报recvfrom，然后通知主循环数据已准备好处理
- 通知主循环并让它读取数据报。

这个模型的优点是我们在等待数据报到达时不会被阻塞。主循环可以继续执行，只需等待信号处理程序通知数据已准备好处理或数据报已准备好被读取。

异步I / O由POSIX规范定义，并且已经协调了各种标准中出现的实时函数的各种差异，这些差异汇集在一起??形成当前的POSIX规范。

这些函数通过告诉内核启动操作并在整个操作（包括从内核到缓冲区的数据副本）完成时通知我们来工作。这个模型和信号驱动的I / O模型的主要区别在于，通过信号驱动的I / O，内核告诉我们何时可以启动I / O操作，但是使用异步I / O，内核告诉我们I / O操作完成时。请参见下图，例如：

技术图片

我们调用aio_read（POSIX异步I / O函数以aio_或开头lio_）并传递以下内核：
- 描述符，缓冲区指针，缓冲区大小（相同的三个参数read），
- 文件偏移量（类似于lseek），
- 以及如何在整个操作完成时通知我们。
此系统调用立即返回，并且在等待I / O完成时不会阻止我们的进程。
我们假设在这个例子中，我们要求内核在操作完成时生成一些信号。在将数据复制到我们的应用程序缓冲区之前，不会生成此信号，这与信号驱动的I / O模型不同。