1 .\" This manpage is copyright (C) 2001 Paul Sheer.
3 .\" %%%LICENSE_START(VERBATIM)
4 .\" Permission is granted to make and distribute verbatim copies of this
5 .\" manual provided the copyright notice and this permission notice are
6 .\" preserved on all copies.
8 .\" Permission is granted to copy and distribute modified versions of this
9 .\" manual under the conditions for verbatim copying, provided that the
10 .\" entire resulting derived work is distributed under the terms of a
11 .\" permission notice identical to this one.
13 .\" Since the Linux kernel and libraries are constantly changing, this
14 .\" manual page may be incorrect or out-of-date. The author(s) assume no
15 .\" responsibility for errors or omissions, or for damages resulting from
16 .\" the use of the information contained herein. The author(s) may not
17 .\" have taken the same level of care in the production of this manual,
18 .\" which is licensed free of charge, as they might when working
21 .\" Formatted or processed versions of this manual, if unaccompanied by
22 .\" the source, must acknowledge the copyright and authors of this work.
25 .\" very minor changes, aeb
27 .\" Modified 5 June 2002, Michael Kerrisk <mtk.manpages@gmail.com>
28 .\" 2006-05-13, mtk, removed much material that is redundant with select.2
29 .\" various other changes
30 .\" 2008-01-26, mtk, substantial changes and rewrites
32 .\"*******************************************************************
34 .\" This file was generated with po4a. Translate the source file.
36 .\"*******************************************************************
38 .\" Translated 2002-02-21, NAKANO Takeo <nakano@apm.seikei.ac.jp>
39 .\" Updated 2002-09-23, Akihiro MOTOKI <amotoki@dd.iij4u.or.jp>
40 .\" Updated 2005-03-15, Akihiro MOTOKI <amotoki@dd.iij4u.or.jp>
41 .\" Updated 2006-07-21, Akihiro MOTOKI, LDP v2.36
42 .\" Updated 2009-02-13, Akihiro MOTOKI, LDP v3.18
44 .TH SELECT_TUT 2 2012\-08\-03 Linux "Linux Programmer's Manual"
46 select, pselect, FD_CLR, FD_ISSET, FD_SET, FD_ZERO \- 同期 I/O の多重化
49 /* POSIX.1\-2001 に従う場合 */
51 \fB#include <sys/select.h>\fP
55 \fB#include <sys/time.h>\fP
57 \fB#include <sys/types.h>\fP
59 \fB#include <unistd.h>\fP
61 \fBint select(int \fP\fInfds\fP\fB, fd_set *\fP\fIreadfds\fP\fB, fd_set *\fP\fIwritefds\fP\fB,\fP
62 \fB fd_set *\fP\fIexceptfds\fP\fB, struct timeval *\fP\fIutimeout\fP\fB);\fP
64 \fBvoid FD_CLR(int \fP\fIfd\fP\fB, fd_set *\fP\fIset\fP\fB);\fP
66 \fBint FD_ISSET(int \fP\fIfd\fP\fB, fd_set *\fP\fIset\fP\fB);\fP
68 \fBvoid FD_SET(int \fP\fIfd\fP\fB, fd_set *\fP\fIset\fP\fB);\fP
70 \fBvoid FD_ZERO(fd_set *\fP\fIset\fP\fB);\fP
72 \fB#include <sys/select.h>\fP
74 \fBint pselect(int \fP\fInfds\fP\fB, fd_set *\fP\fIreadfds\fP\fB, fd_set *\fP\fIwritefds\fP\fB,\fP
75 \fB fd_set *\fP\fIexceptfds\fP\fB, const struct timespec *\fP\fIntimeout\fP\fB,\fP
76 \fB const sigset_t *\fP\fIsigmask\fP\fB);\fP
80 glibc 向けの機能検査マクロの要件 (\fBfeature_test_macros\fP(7) 参照):
83 \fBpselect\fP(): _POSIX_C_SOURCE\ >=\ 200112L || _XOPEN_SOURCE\ >=\ 600
85 \fBselect\fP() (や \fBpselect\fP()) を使うと、効率的に複数のファイルディスクリプタを監視し、
86 そのファイルディスクリプタのいずれかが 「ready (準備ができた)」状態、つまり I/O (入出力) が可能になっているかや、
87 ファイルディスクリプタのいずれかが 「例外状態 (exceptional condition)」が発生したか、を調べることができる。
89 この関数の主要な引き数は、3種類のファイルディスクリプタの「集合」 \fIreadfds\fP, \fIwritefds\fP, \fIexceptfds\fP である。
90 各々の集合は \fBfd_set\fP として宣言され、その内容は \fBFD_CLR\fP(), \fBFD_ISSET\fP(), \fBFD_SET\fP(),
91 \fBFD_ZERO\fP() といったマクロによって操作できる。 新しく宣言された集合は、まず最初に \fBFD_ZERO\fP()
92 を使ってクリアすべきである。 \fBselect\fP() はこれらの集合の内容を、以降に述べる規則に従って修正する。 \fBselect\fP()
93 を呼んだ後、ファイルディスクリプタがまだ集合に存在しているかどうかは、 \fBFD_ISSET\fP() マクロによって調べることができる。
94 \fBFD_ISSET\fP() は指定されたディスクリプタが集合に存在していれば 0 以外の値を返し、 存在しなければ 0 を返す。
95 \fBFD_CLR\fP() は集合からのファイルディスクリプタの削除を行う。
99 この集合に含まれるいずれかのファイルディスクリプタで、 データの読み込みが可能になったかどうかを監視する。 \fBselect\fP()
100 から戻る時に、\fIreadfds\fP のうち、 直ちに読み込み可能なファイルディスクリプタ以外は 集合から削除される。
103 この集合に含まれるいずれかのファイルディスクリプタで、 データを書き込むスペースがあるかどうかを監視する。 \fBselect\fP()
104 から戻る時に、\fIwritefds\fP のうち、 直ちに書き込み可能なファイルディスクリプタ以外は 集合から削除される。
107 この集合に含まれるいずれかのファイルディスクリプタで、 「例外状態 (exceptional condition)」が発生したかどうかを監視する。
108 実際の動作では、普通に起こり得る例外状態は一つだけであり、 それは TCP ソケットで \fI帯域外 (out\-of\-band; OOB)\fP データが
109 読み込み可能な場合である。 OOB データの詳細については、 \fBrecv\fP(2), \fBsend\fP(2), \fBtcp\fP(7) を参照のこと。
110 (これ以外では、まれなことだが、 パケットモードの擬似端末 (pseudoterminals) で \fBselect\fP()
111 が例外状態を示すことがある。) \fBselect\fP() が返る時に、\fIexceptfds\fP のうち、
112 例外状態が発生したディスクリプタ以外は集合から削除される。
115 全ての集合に含まれるファイルディスクリプタのうち、 値が最大のものに 1 を足した整数である。
116 すなわち、ファイルディスクリプタを各集合に加える作業の途中で、 全てのファイルディスクリプタを見て最大値を求め、 それに 1 を加えて \fInfds\fP
120 (何も起こらなかった場合に) \fBselect\fP() が戻る前に待つ最大時間である。 この値に NULL を渡すと、 \fBselect\fP()
121 はファイルディスクリプタのいずれかが ready (準備ができた) 状態に なるまで待ち続けてずっと停止する。 \fIutimeout\fP は 0
122 秒にすることもでき、 この場合 \fBselect\fP() は直ちに返り、呼び出し時点のファイルディスクリプタの状態に 関する情報が返される。 構造体
123 \fIstruct timeval\fP は次のように定義されている:
128 time_t tv_sec; /* seconds */
129 long tv_usec; /* microseconds */
135 \fBpselect\fP() のこの引き数は \fIutimeout\fP と同じ意味を持つが、 \fIstruct timespec\fP
141 long tv_sec; /* seconds */
142 long tv_nsec; /* nanoseconds */
148 この引き数は、呼び出し側が \fBpselect\fP() 内部で停止している間に、カーネルが通知を許可すべきシグナル集合
149 (すなわち、呼び出したスレッドのシグナルマスクから削除すべきシグナル集合) を保持する (\fBsigaddset\fP(3) と
150 \fBsigprocmask\fP(2) を参照)。 この引き数は NULL にすることもでき、その場合はこの関数へ
151 入るとき・出るときにシグナルマスクを変更しない。 この場合、 \fBpselect\fP() は \fBselect\fP() と全く同じ動作となる。
152 .SS シグナルとデータイベントを組み合わせる
153 ファイルディスクリプタが I/O 可能な状態になるのと同時に シグナルも待ちたい場合には、 \fBpselect\fP() が便利である。
154 シグナルを受信するプログラムは、通常は、 シグナルハンドラをグローバルなフラグを立てるためだけに使う。 このグローバルなフラグは、
155 そのイベントをプログラムのメインループで 処理しなければならないことを示す。 シグナルを受けると \fBselect\fP() (や
156 \fBpselect\fP()) は \fIerrno\fP に \fBEINTR\fP をセットして戻ることになる。
157 シグナルがプログラムのメインループで処理されるためにはこの動作が不可欠で、 これがないと \fBselect\fP() は永遠に停止し続けることになる。
158 さて、メインループのどこかにこのグローバルフラグをチェックする 条件文があるとしよう。ここで少し考えてみないといけない。 「シグナルが条件文の後、しかし
159 \fBselect\fP() コールの前に到着したら どうなるのか?」 答えは「その \fBselect\fP()
160 は、たとえ解決待ちのイベントがあったとしても、 永遠に停止する」である。 この競合状態は \fBpselect\fP() コールによって解決できる。
161 このコールを使うと、 \fBpselect\fP() で受信したいシグナルの集合だけをシグナルマスクに設定することができる。
162 例えば、問題となっているイベントが子プロセスの終了の場合を考えよう。 メインループが始まる前に、 \fBSIGCHLD\fP を
163 \fBsigprocmask\fP(2) でブロックする。 \fBpselect\fP() コールでは \fBSIGCHLD\fP
164 を、もともとのシグナルマスクを使って有効にするのだ。 このプログラムは次のようになる。
167 static volatile sig_atomic_t got_SIGCHLD = 0;
170 child_sig_handler(int sig)
176 main(int argc, char *argv[])
178 sigset_t sigmask, empty_mask;
180 fd_set readfds, writefds, exceptfds;
183 sigemptyset(&sigmask);
184 sigaddset(&sigmask, SIGCHLD);
185 if (sigprocmask(SIG_BLOCK, &sigmask, NULL) == \-1) {
186 perror("sigprocmask");
191 sa.sa_handler = child_sig_handler;
192 sigemptyset(&sa.sa_mask);
193 if (sigaction(SIGCHLD, &sa, NULL) == \-1) {
198 sigemptyset(&empty_mask);
200 for (;;) { /* main loop */
201 /* Initialize readfds, writefds, and exceptfds
202 before the pselect() call. (Code omitted.) */
204 r = pselect(nfds, &readfds, &writefds, &exceptfds,
206 if (r == \-1 && errno != EINTR) {
213 /* Handle signalled event here; e.g., wait() for all
214 terminated children. (Code omitted.) */
217 /* main body of program */
222 実際のところ \fBselect\fP() の大事な点は何なのか? ディスクリプタは好きなときに読み書きできるんじゃないの? \fBselect\fP()
223 の重要なところは、複数のディスクリプタを同時に監視でき、 なんの動きもなければプロセスを適切にスリープ状態に移行するところにあるのだ。 UNIX
224 プログラマは、 複数のファイルディスクリプタの入出力を同時に扱わねばならず、 しかもデータの流れは間欠的である、という状況によく出会う。 単に
225 \fBread\fP(2) や \fBwrite\fP(2) コールのシーケンスを作るだけでは、それらのコールのどれかが
226 ファイルディスクリプタからのデータを待ってブロックしており、 別のファイルディスクリプタには I/O が可能なのに使えない、
227 ということになってしまうだろう。 \fBselect\fP() を使うとこの状況に効果的に対処できる。
229 \fBselect\fP() を使おうとした多くの人は、理解しにくい挙動に出くわし、結果的に
230 できたものは移植性がないか、よくてもギリギリのものになってしまう。 例えば、上記のプログラムは、 集合に含まれるファイルディスクリプタを非停止
231 (nonblocking) モード にしなくても、どこにもブロックが生じないよう注意して書かれている。 微妙な間違いによって、 \fBselect\fP()
232 を使う利点は簡単に失われてしまう。 そこで、 \fBselect\fP() コールを使うときに注意すべき重要事項を列挙しておくことにする。
235 \fBselect\fP() を使うときは、タイムアウトは設定すべきでない。 処理するデータが無いときには、
236 あなたのプログラムには何もすることは無いはずである。 タイムアウトに依存したコードは通常移植性がなく、 デバッグも難しくなる。
239 上述したように、 効率的なプログラムを書くには \fInfds\fP の値を適切に計算して与えなければならない。
242 \fBselect\fP() コールの終了後に結果をチェックして、 適切に対応するつもりのないファイルディスクリプタは、 どの集合にも加えてはならない。
246 \fBselect\fP() から返った後には、全ての集合の全てのファイルディスクリプタについて 読み書き可能な状態になっているかをチェックすべきである。
249 \fBread\fP(2), \fBrecv\fP(2), \fBwrite\fP(2), \fBsend\fP(2)
250 といった関数は、こちらが要求した全データを読み書きする必要は\fIない\fP。 もし全データを読み書きするなら、それはトラフィックの負荷が小さく、
251 ストリームが速い場合だろう。この条件は常に満たされるとは限らない。 これらの関数が頑張っても 1 バイトしか送受信できないような場合も
255 処理するデータ量が小さいことがはっきりとわかっている場合を除いて、 一度に 1 バイトずつ読み書きするようなことはしてはならない。
256 バッファの許すかぎりのデータをまとめて読み書きしないと、 非常に効率が悪い。下記の例ではバッファは 1024 バイトにしているが、
260 .\" Nonetheless, you should still cope with these errors for completeness.
261 \fBread\fP(2), \fBrecv\fP(2), \fBwrite\fP(2), \fBsend\fP(2) などの関数や \fBselect\fP() コールは、
262 \fIerrno\fP を \fBEINTR や EAGAIN\fP (\fBEWOULDBLOCK\fP) にして \-1 を返すことがある。
263 このような結果に対して適切に対応してやらなければならない (上記の例ではしていない)。 書いているプログラムがシグナルを受ける予定がなければ、
264 \fBEINTR\fP が返されることはあまり考えられない。 書いているプログラムで非ブロック I/O をセットしていない場合は、 \fBEAGAIN\fP
268 決して、引き数に長さ 0 のバッファを指定して \fBread\fP(2), \fBrecv\fP(2), \fBwrite\fP(2), \fBsend\fP(2)
272 \fBread\fP(2), \fBrecv\fP(2), \fBwrite\fP(2), \fBsend\fP(2) が \fB7.\fP に示した以外のエラーで失敗した場合や、
273 入力系の関数の一つがファイル末尾を表す 0 を返した場合は、 そのディスクリプタをもう一度 select に渡しては\fIならない\fP。
274 下記の例では、そのディスクリプタをただちにクローズし、 そこには \-1 をセットして、 それが集合に含まれ続けるのを許さないようにしている。
277 タイムアウトの値は \fBselect\fP() を呼ぶたびに初期化すべきである。 OS によっては timeout
278 構造体が変更される場合があるからである。 但し、 \fBpselect\fP() は自分の timeout 構造体を変更することはない。
281 .\" "I have heard" does not fill me with confidence, and doesn't
282 .\" belong in a man page, so I've commented this point out.
285 .\" I have heard that the Windows socket layer does not cope with OOB data
287 .\" It also does not cope with
289 .\" calls when no file descriptors are set at all.
290 .\" Having no file descriptors set is a useful
291 .\" way to sleep the process with subsecond precision by using the timeout.
292 .\" (See further on.)
293 \fBselect\fP() はファイルディスクリプタ集合を変更するので、 \fBselect\fP()
294 がループの中で使用されている場合には、呼び出しを行う前に毎回 ディスクリプタ集合を初期化し直さなければならない。
295 .SS "usleep エミュレーション"
296 \fBusleep\fP(3) 関数を持たないシステムでは、 有限のタイムアウトを指定し、ファイルディスクリプタを全くセットせずに \fBselect\fP()
297 を呼び出すことで、これを代用できる。 以下のようにする。
302 tv.tv_usec = 200000; /* 0.2 seconds */
303 select(0, NULL, NULL, NULL, &tv);
306 但し、これが動くと保証されているのは UNIX システムに限られる。
308 成功すると、 \fBselect\fP() はファイルディスクリプタ集合に残っている ファイルディスクリプタの総数を返す。
310 \fBselect\fP() がタイムアウトすると、返り値は 0 になる。 その時、ファイルディスクリプタ集合はすべて空である
313 返り値が \-1 の場合はエラーを意味し、 \fIerrno\fP が適切にセットされる。エラーが起こった場合、 返された集合の内容や構造体 \fIstruct
314 timeout\fP の内容は 未定義となっており、使用すべきではない。 しかし \fBpselect\fP() は決して \fIntimeout\fP
317 一般的に言って、ソケットをサポートする全てのオペレーティングシステムは \fBselect\fP() もサポートしている。 \fBselect\fP()
318 を使うと、プログラマがスレッド、フォーク、IPC、シグナル、メモリ共有、 等々を使ってもっと複雑な方法で解決しようとする多くの問題が、
319 移植性がありかつ効率的な方法で解決できる。
321 \fBpoll\fP(2) システムコールは \fBselect\fP() と同じ機能を持っており、 まばらなファイルディスクリプタ集合を監視する場合に
322 いくらか効率がよい。 現在では広く利用可能であるが、以前は \fBselect\fP() より移植性の面で劣っていた。
324 Linux 独自の \fBepoll\fP(7) API は、多数のファイルディスクリプタを監視する場合に \fBselect\fP(2) や
325 \fBpoll\fP(2) よりも効率的なインタフェースを提供している。
327 \fBselect\fP() の本当に便利な点を示す、よい例を紹介する。 以下のリストは、ある TCP ポートから別のポートへ転送を行う TCP
334 #include <sys/time.h>
335 #include <sys/types.h>
338 #include <sys/socket.h>
339 #include <netinet/in.h>
340 #include <arpa/inet.h>
343 static int forward_port;
346 #define max(x,y) ((x) > (y) ? (x) : (y))
349 listen_socket(int listen_port)
351 struct sockaddr_in a;
355 if ((s = socket(AF_INET, SOCK_STREAM, 0)) == \-1) {
360 if (setsockopt(s, SOL_SOCKET, SO_REUSEADDR,
361 &yes, sizeof(yes)) == \-1) {
362 perror("setsockopt");
366 memset(&a, 0, sizeof(a));
367 a.sin_port = htons(listen_port);
368 a.sin_family = AF_INET;
369 if (bind(s, (struct sockaddr *) &a, sizeof(a)) == \-1) {
374 printf("accepting connections on port %d\en", listen_port);
380 connect_socket(int connect_port, char *address)
382 struct sockaddr_in a;
385 if ((s = socket(AF_INET, SOCK_STREAM, 0)) == \-1) {
391 memset(&a, 0, sizeof(a));
392 a.sin_port = htons(connect_port);
393 a.sin_family = AF_INET;
395 if (!inet_aton(address, (struct in_addr *) &a.sin_addr.s_addr)) {
396 perror("bad IP address format");
401 if (connect(s, (struct sockaddr *) &a, sizeof(a)) == \-1) {
403 shutdown(s, SHUT_RDWR);
410 #define SHUT_FD1 do { \e
412 shutdown(fd1, SHUT_RDWR); \e
418 #define SHUT_FD2 do { \e
420 shutdown(fd2, SHUT_RDWR); \e
426 #define BUF_SIZE 1024
429 main(int argc, char *argv[])
432 int fd1 = \-1, fd2 = \-1;
433 char buf1[BUF_SIZE], buf2[BUF_SIZE];
434 int buf1_avail, buf1_written;
435 int buf2_avail, buf2_written;
438 fprintf(stderr, "Usage\en\etfwd <listen\-port> "
439 "<forward\-to\-port> <forward\-to\-ip\-address>\en");
443 signal(SIGPIPE, SIG_IGN);
445 forward_port = atoi(argv[2]);
447 h = listen_socket(atoi(argv[1]));
460 if (fd1 > 0 && buf1_avail < BUF_SIZE) {
462 nfds = max(nfds, fd1);
464 if (fd2 > 0 && buf2_avail < BUF_SIZE) {
466 nfds = max(nfds, fd2);
468 if (fd1 > 0 && buf2_avail \- buf2_written > 0) {
470 nfds = max(nfds, fd1);
472 if (fd2 > 0 && buf1_avail \- buf1_written > 0) {
474 nfds = max(nfds, fd2);
478 nfds = max(nfds, fd1);
482 nfds = max(nfds, fd2);
485 r = select(nfds + 1, &rd, &wr, &er, NULL);
487 if (r == \-1 && errno == EINTR)
495 if (FD_ISSET(h, &rd)) {
497 struct sockaddr_in client_address;
499 memset(&client_address, 0, l = sizeof(client_address));
500 r = accept(h, (struct sockaddr *) &client_address, &l);
506 buf1_avail = buf1_written = 0;
507 buf2_avail = buf2_written = 0;
509 fd2 = connect_socket(forward_port, argv[3]);
513 printf("connect from %s\en",
514 inet_ntoa(client_address.sin_addr));
518 /* NB: read oob data before normal reads */
521 if (FD_ISSET(fd1, &er)) {
524 r = recv(fd1, &c, 1, MSG_OOB);
528 send(fd2, &c, 1, MSG_OOB);
531 if (FD_ISSET(fd2, &er)) {
534 r = recv(fd2, &c, 1, MSG_OOB);
538 send(fd1, &c, 1, MSG_OOB);
541 if (FD_ISSET(fd1, &rd)) {
542 r = read(fd1, buf1 + buf1_avail,
543 BUF_SIZE \- buf1_avail);
550 if (FD_ISSET(fd2, &rd)) {
551 r = read(fd2, buf2 + buf2_avail,
552 BUF_SIZE \- buf2_avail);
559 if (FD_ISSET(fd1, &wr)) {
560 r = write(fd1, buf2 + buf2_written,
561 buf2_avail \- buf2_written);
568 if (FD_ISSET(fd2, &wr)) {
569 r = write(fd2, buf1 + buf1_written,
570 buf1_avail \- buf1_written);
577 /* check if write data has caught read data */
579 if (buf1_written == buf1_avail)
580 buf1_written = buf1_avail = 0;
581 if (buf2_written == buf2_avail)
582 buf2_written = buf2_avail = 0;
584 /* one side has closed the connection, keep
585 writing to the other side until empty */
587 if (fd1 < 0 && buf1_avail \- buf1_written == 0)
589 if (fd2 < 0 && buf2_avail \- buf2_written == 0)
596 上記のプログラムは、ほとんどの種類の TCP 接続をフォワードする。 \fBtelnet\fP サーバによって中継される OOB シグナルデータも扱える。
597 このプログラムは、データフローを双方向に同時に送るという、 ややこしい問題も処理できる。 \fBfork\fP(2)
598 コールを使って、各ストリームごとに専用のスレッドを用いるほうが効率的だ、 という人もいるかもしれない。しかし、これは考えているよりずっとややこしい。
599 あるいは、 \fBfcntl\fP(2) を使って非ブロック I/O をセットすれば良い、というアイデアもあるだろう。
600 これにも実際には問題があり、タイムアウトが非効率的に起こってしまう。
602 このプログラムは一度にひとつ以上の同時接続を扱うことはできないが、 その様に拡張するのは簡単で、バッファのリンクリストを (接続ごとにひとつずつ)
603 使えばよい。 現時点のものでは、新しい接続がくると古い接続は落ちてしまう。
606 .\" This man page was written by Paul Sheer.
607 \fBaccept\fP(2), \fBconnect\fP(2), \fBioctl\fP(2), \fBpoll\fP(2), \fBread\fP(2),
608 \fBrecv\fP(2), \fBselect\fP(2), \fBsend\fP(2), \fBsigprocmask\fP(2), \fBwrite\fP(2),
609 \fBsigaddset\fP(3), \fBsigdelset\fP(3), \fBsigemptyset\fP(3), \fBsigfillset\fP(3),
610 \fBsigismember\fP(3), \fBepoll\fP(7)
612 この man ページは Linux \fIman\-pages\fP プロジェクトのリリース 3.53 の一部
613 である。プロジェクトの説明とバグ報告に関する情報は
614 http://www.kernel.org/doc/man\-pages/ に書かれている。