Linux/Unix网络编程指南(Socket 编程)—(13)
作者:转载自:更新时间:2009-8-2

阻塞
阻塞,你也许早就听说了。"阻塞"是 "sleep" 的科技行话。你可能注意到前面运行的 listener 程序,他在那里不停地运行,等待数据包的到来。实际在运行的是 他调用 recvfrom(),然后没有数据,因此 recvfrom() 说"阻塞 (block)" 直到数据的到来。
很多函数都利用阻塞。accept() 阻塞,所有的 recv*() 函数阻塞。他们之所以能这样做是因为他们被允许这样做。当你第一次调用 socket() 建立套接口描述符的时候,内核就将他设置为阻塞。如果你不想套接口阻塞,你就要调用函数 fcntl():
  #include <unistd.h>
  #include <fcntl.h>
 .
 .
  sockfd = socket(AF_INET, SOCK_STREAM, 0);
  fcntl(sockfd, F_SETFL, O_NONBLOCK);
  .
  .
通过设置套接口为非阻塞,你能够有效地"询问"套接口以获得信息。如果你尝试着 从一个非阻塞的套接口读信息并且没有任何数据,他不会变成阻塞--他将返回 -1 并 将 errno 设置为 EWOULDBLOCK。
但是一般说来,这种轮询不是个好主意。如果你让你的程序在忙等状态查询套接口的数据, 你将浪费大量的 CPU 时间。更好的解决之道是用下一章讲的 select() 去查询 是否有数据要读进来。
--------------------------------------------------------------------------------
select()--多路同步 I/O
虽然这个函数有点奇怪,但是他很有用。假设这样的情况:你是个服务器,你一边在不停地 从连接上读数据,一边在侦听连接上的信息。
没问题,你可能会说,不就是一个 accept() 和两个 recv() 吗? 这么容易 吗,朋友? 如果你在调用 accept() 的时候阻塞呢? 你怎么能够同时接受 recv() 数据? "用非阻塞的套接口啊!" 不行!你不想耗尽所有的 CPU,不是吗? 那么,该如何是好?
select() 让你可以同时监视多个套接口。如果你想知道的话,那么他就会告诉你哪个套接口准备读,哪个又 准备好了写,哪个套接口又发生了例外 (exception)。
闲话少说,下面是 select():
   #include <sys/time.h>
   #include <sys/types.h>
   #include <unistd.h>
   int select(int numfds, fd_set *readfds, fd_set *writefds,
         fd_set *exceptfds, struct timeval *timeout);
这个函数监视一系列文件描述符,特别是 readfds、writefds 和 exceptfds。如果你想知道你是否能够从标准输入和套接口描述符 sockfd 读 入数据,你只要将文件描述符 0 和 sockfd 加入到集合 readfds 中。 参数 numfds 应该等于最高的文件描述符的值加1。在这个例子中,你应该设置该值 为 sockfd+1。因为他一定大于标准输入的文件描述符 (0)。
当函数 select() 返回的时候,readfds 的值修改为反映你选择的哪个文件 描述符可以读。你可以用下面讲到的宏 FD_ISSET() 来测试。
在我们继续下去之前,让我来讲讲如何对这些集合进行操作。每个集合类型都是 fd_set。 下面有一些宏来对这个类型进行操作:
FD_ZERO(fd_set *set) - clears a file descriptor set
FD_SET(int fd, fd_set *set) - adds fd to the set
FD_CLR(int fd, fd_set *set) - removes fd from the set
FD_ISSET(int fd, fd_set *set) - tests to see if fd is in the set
最后,是有点古怪的数据结构 struct timeval。有时你可不想永远等待别人发送数据过来。也许什么事情都没有发生的时候你也想每隔96秒在终端 上打印字符串 "Still Going..."。这个数据结构允许你设定一个时间,如果时间到了, 而 select() 还没有找到一个准备好的文件描述符,他将返回让你继续处理。
数据结构 struct timeval 是这样的:
  struct timeval {
    int tv_sec;   /* seconds */
    int tv_usec;  /* microseconds */
  };
只要将 tv_sec 设置为你要等待的秒数,将 tv_usec 设置为你要等待的微秒数就可以了。是的,是微秒而不是毫秒。1,000微秒等于1豪秒,1,000毫秒等于1秒。也就是说,1秒等于1,000,000微秒。为什么用符号 "usec" 呢? 字母 "u" 很象希腊字母 Mu, 而 Mu 表示 "微" 的意思。当然,函数返回的时候 timeout 可能是剩余的 时间,之所以是可能,是因为他依赖于你的 Unix 操作系统。
哈!我们现在有一个微秒级的定时器!不要计算了,标准的 Unix 系统的时间片是100毫秒,所以 无论你如何设置你的数据结构 struct timeval,你都要等待那么长的 时间。
还有一些有趣的事情:如果你设置数据结构 struct timeval 中的 数据为 0,select() 将立即超时,这样就可以有效地轮询集合中的 所有的文件描述符。如果你将参数 timeout 赋值为 NULL,那么将永远不会发生超时,即一直等到第一个文件描述符就绪。最后,如果你不是很关心等待多长时间,那么 就把他赋为 NULL 吧。
下面的代码演示了在标准输入上等待 2.5 秒:
   #include <sys/time.h>
   #include <sys/types.h>
   #include <unistd.h>
   #define STDIN 0 /* file descriptor for standard input */
   main()
   {
     struct timeval tv;
     fd_set readfds;
     tv.tv_sec = 2;
     tv.tv_usec = 500000;
     FD_ZERO(&readfds);
     FD_SET(STDIN, &readfds);
     /* don't care about writefds and exceptfds: */
     select(STDIN+1, &readfds, NULL, NULL, &tv);
     if (FD_ISSET(STDIN, &readfds))
       printf("A key was pressed!\n");
     else
       printf("Timed out.\n");
  }
如果你是在一个 line buffered 终端上,那么你敲的键应该是回车 (RETURN),否则无论如何 他都会超时。
现在,你可能回认为这就是在数据报套接口上等待数据的方式--你是对的:他可能是。 有些 Unix 系统可以按这种方式,而另外一些则不能。你在尝试以前可能要先看看本系统 的 man page 了。
最后一件关于 select() 的事情:如果你有一个正在侦听 (listen()) 的套接口,你可以通过将该套接口的文件描述符加入到 readfds 集合中来看 是否有新的连接。
这就是我关于函数 select() 要讲的所有的东西。