1 .\" Copyright (c) 1992 Drew Eckhardt <drew@cs.colorado.edu>, March 28, 1992
2 .\" and Copyright (c) Michael Kerrisk, 2001, 2002, 2005, 2013
4 .\" %%%LICENSE_START(GPL_NOVERSION_ONELINE)
5 .\" May be distributed under the GNU General Public License.
8 .\" Modified by Michael Haardt <michael@moria.de>
9 .\" Modified 24 Jul 1993 by Rik Faith <faith@cs.unc.edu>
10 .\" Modified 21 Aug 1994 by Michael Chastain <mec@shell.portal.com>:
11 .\" New man page (copied from 'fork.2').
12 .\" Modified 10 June 1995 by Andries Brouwer <aeb@cwi.nl>
13 .\" Modified 25 April 1998 by Xavier Leroy <Xavier.Leroy@inria.fr>
14 .\" Modified 26 Jun 2001 by Michael Kerrisk
15 .\" Mostly upgraded to 2.4.x
16 .\" Added prototype for sys_clone() plus description
17 .\" Added CLONE_THREAD with a brief description of thread groups
18 .\" Added CLONE_PARENT and revised entire page remove ambiguity
19 .\" between "calling process" and "parent process"
20 .\" Added CLONE_PTRACE and CLONE_VFORK
21 .\" Added EPERM and EINVAL error codes
22 .\" Renamed "__clone" to "clone" (which is the prototype in <sched.h>)
23 .\" various other minor tidy ups and clarifications.
24 .\" Modified 26 Jun 2001 by Michael Kerrisk <mtk.manpages@gmail.com>
25 .\" Updated notes for 2.4.7+ behavior of CLONE_THREAD
26 .\" Modified 15 Oct 2002 by Michael Kerrisk <mtk.manpages@gmail.com>
27 .\" Added description for CLONE_NEWNS, which was added in 2.4.19
28 .\" Slightly rephrased, aeb.
29 .\" Modified 1 Feb 2003 - added CLONE_SIGHAND restriction, aeb.
30 .\" Modified 1 Jan 2004 - various updates, aeb
31 .\" Modified 2004-09-10 - added CLONE_PARENT_SETTID etc. - aeb.
32 .\" 2005-04-12, mtk, noted the PID caching behavior of NPTL's getpid()
33 .\" wrapper under BUGS.
34 .\" 2005-05-10, mtk, added CLONE_SYSVSEM, CLONE_UNTRACED, CLONE_STOPPED.
35 .\" 2005-05-17, mtk, Substantially enhanced discussion of CLONE_THREAD.
36 .\" 2008-11-18, mtk, order CLONE_* flags alphabetically
37 .\" 2008-11-18, mtk, document CLONE_NEWPID
38 .\" 2008-11-19, mtk, document CLONE_NEWUTS
39 .\" 2008-11-19, mtk, document CLONE_NEWIPC
40 .\" 2008-11-19, Jens Axboe, mtk, document CLONE_IO
42 .\" FIXME Document CLONE_NEWUSER, which is new in 2.6.23
43 .\" (also supported for unshare()?)
45 .\"*******************************************************************
47 .\" This file was generated with po4a. Translate the source file.
49 .\"*******************************************************************
50 .TH CLONE 2 2013\-01\-01 Linux "Linux Programmer's Manual"
52 clone, __clone2 \- 子プロセスを作成する
55 .\" Actually _BSD_SOURCE || _SVID_SOURCE
56 .\" FIXME See http://sources.redhat.com/bugzilla/show_bug.cgi?id=4749
57 \fB#define _GNU_SOURCE\fP /* feature_test_macros(7) 参照 */
58 \fB#include <sched.h>\fP
60 \fBint clone(int (*\fP\fIfn\fP\fB)(void *), void *\fP\fIchild_stack\fP\fB,\fP
61 \fB int \fP\fIflags\fP\fB, void *\fP\fIarg\fP\fB, ... \fP
62 \fB /* pid_t *\fP\fIptid\fP\fB, struct user_desc *\fP\fItls\fP\fB, pid_t *\fP\fIctid\fP\fB */ );\fP
65 \fBclone\fP() は \fBfork\fP(2) と同じような方法で新しいプロセスを作成する。 \fBclone\fP()
66 には、ライブラリ関数とその下層にあたる \fBclone\fP() システムコールが存在する。以下の説明では、システムコールの方を \fBsys_clone\fP
67 と表すこととする。 \fBsys_clone\fP に関する説明はこのマニュアルの最後の方にある。
69 \fBfork\fP(2) とは異なり、これらのコールでは、子プロセス (child process) と呼び出し元のプロセスとが、メモリ空間、
70 ファイルディスクリプタのテーブル、シグナル・ハンドラのテーブルなどの 実行コンテキストの一部を共有できる。
71 (このマニュアルにおける「呼び出し元のプロセス」は、通常は 「親プロセス」と一致する。但し、後述の \fBCLONE_PARENT\fP の項も参照のこと)
73 \fBclone\fP() の主要な使用法はスレッド (threads) を実装することである:
74 一つのプログラムの中の複数のスレッドは共有されたメモリ空間で 同時に実行される。
76 When the child process is created with \fBclone\fP(), it executes the function
77 \fIfn\fP(\fIarg\fP). (This differs from \fBfork\fP(2), where execution continues in
78 the child from the point of the \fBfork\fP(2) call.) The \fIfn\fP argument is a
79 pointer to a function that is called by the child process at the beginning
80 of its execution. The \fIarg\fP argument is passed to the \fIfn\fP function.
82 \fIfn\fP(\fIarg\fP) 関数が終了すると、子プロセスは終了する。 \fIfn\fP によって返された整数が子プロセスの終了コードとなる。 子プロセスは、
83 \fBexit\fP(2) を呼んで明示的に終了することもあるし、致命的なシグナルを受信した 場合に終了することもある。
85 \fIchild_stack\fP 引き数は、子プロセスによって使用されるスタックの位置を指定する。
86 子プロセスと呼び出し元のプロセスはメモリを共有することがあるため、 子プロセスは呼び出し元のプロセスと同じスタックで実行することができない。
87 このため、呼び出し元のプロセスは子プロセスのスタックのためのメモリ空間を 用意して、この空間へのポインタを \fBclone\fP()
88 へ渡さなければならない。 (HP PA プロセッサ以外の) Linux が動作する全てのプロセッサでは、 スタックは下方 (アドレスが小さい方向)
89 へと伸びる。このため、普通は \fIchild_stack\fP は子プロセスのスタックのために用意したメモリ空間の一番大きい アドレスを指すようにする。
91 \fIflags\fP の下位 1 バイトは子プロセスが死んだ場合に親プロセスへと送られる \fI終了シグナル (termination signal)\fP
92 の番号を指定する。このシグナルとして \fBSIGCHLD\fP 以外が指定された場合、親プロセスは、 \fBwait\fP(2)
93 で子プロセスを待つ際に、オプションとして \fB__WALL\fP または \fB__WCLONE\fP を指定しなければならない。
94 どのシグナルも指定されなかった場合、子プロセスが終了した時に親プロセス にシグナルは送られない。
96 \fIflags\fP には、以下の定数のうち 0個以上をビット毎の論理和 (bitwise\-or)
97 をとったものを指定できる。これらの定数は呼び出し元のプロセスと 子プロセスの間で何を共有するかを指定する:
99 \fBCLONE_CHILD_CLEARTID\fP (Linux 2.5.49 以降)
100 子プロセスが終了したときに子プロセスのメモリ内の \fIctid\fP が指す場所にある子プロセスのスレッド ID を消去し、 そのアドレスで futex を
101 wake (起床) させる。 このアドレスは \fBset_tid_address\fP(2) システムコールで変更することができる。
102 この機能はスレッドライブラリで使用される。
104 \fBCLONE_CHILD_SETTID\fP (Linux 2.5.49 以降)
105 子プロセスのメモリ内の \fIctid\fP が指す場所に子プロセスのスレッド ID を格納する。
107 \fBCLONE_FILES\fP (since Linux 2.0)
108 \fBCLONE_FILES\fP が設定された場合、呼び出し元のプロセスと子プロセスはファイルディスクリプタの テーブルを共有する。
109 呼び出し元プロセスとその子プロセスの一方が作成した ファイルディスクリプタは、もう一方においても有効である。
110 同じように、一方のプロセスがファイルディスクリプタを閉じたり、 (\fBfcntl\fP(2) \fBF_SETFD\fP 操作を使って)
111 ディスクリプタに関連するフラグを変更したりすると、 もう一方のプロセスにも影響する。
113 \fBCLONE_FILES\fP が設定されていない場合、子プロセスは、 \fBclone\fP()
114 が実行された時点で、呼び出し元のプロセスがオープンしている全ての ファイルディスクリプタのコピーを継承する
115 (子プロセスの複製されたファイルディスクリプタは、 対応する呼び出し元のプロセスのファイルディスクリプタと 同じファイル記述 (\fBopen\fP(2)
116 参照) を参照する)。 これ以降に、呼び出し元のプロセスと子プロセスの一方が ファイルディスクリプタの操作 (ファイルディスクリプタの
117 オープン・クローズや、ファイルディスクリプタ・フラグの変更) を行っても、もう一方のプロセスには影響を与えない。
119 \fBCLONE_FS\fP (since Linux 2.0)
120 \fBCLONE_FS\fP が設定された場合、呼び出し元のプロセスと子プロセスが同じファイル・システム
121 情報を共有する。ファイル・システム情報は、ファイル・システムのルート (root)、 カレント・ワーキング・ディレクトリ (current
122 working directory) や umask などである。 呼び出し元のプロセスや子プロセスのどちらか一方によって \fBchroot\fP(2),
123 \fBchdir\fP(2), \fBumask\fP(2) が呼び出されると、もう一方のプロセスにも影響が及ぶ。
125 \fBCLONE_FS\fP が設定されていない場合、子プロセスは、 \fBclone\fP()
126 が実行された時点での、呼び出し元のプロセスのファイル・システム情報のコピーを 使用する。 これ以降は、呼び出し元のプロセスと子プロセスの一方が
127 \fBchroot\fP(2), \fBchdir\fP(2), \fBumask\fP(2) を呼び出しても、もう一方のプロセスには影響を与えない。
129 \fBCLONE_IO\fP (Linux 2.6.25 以降)
130 \fBCLONE_IO\fP が設定された場合、新しいプロセスは呼び出し元のプロセスと I/O コンテキストを共有する。
131 このフラグが設定されていない場合には、 (\fBfork\fP(2) の場合と同様) 新しいプロセスは自分専用の I/O コンテキストを持つ。
133 .\" The following based on text from Jens Axboe
134 .\" the anticipatory and CFQ scheduler
136 I/O コンテキストは、ディスクスケジュールの I/O スコープである (言い換えると、I/O コンテキストは I/O スケジューラがプロセス I/O
137 の スケジューリングをモデル化するのに使用される)。 複数のプロセスが同じ I/O コンテキストを共有する場合、 これらのプロセスは I/O
138 スケジューラからは一つとして扱われる。 結果として、これらのプロセスはディスクアクセスの時間を共有するようになる。 いくつかの I/O
139 スケジューラでは、 二つのプロセスが I/O コンテキストを共有している場合、 これらのプロセスはディスクアクセスを交互に行うことができる。
140 同じプロセスの複数のスレッドが I/O を実行している場合 (例えば \fBaio_read\fP(3))、 \fBCLONE_IO\fP を利用することで I/O
143 カーネルの設定が \fBCONFIG_BLOCK\fP オプション付きでない場合、 このフラグは何の意味も持たない。
145 \fBCLONE_NEWIPC\fP (Linux 2.6.19 以降)
146 \fBCLONE_NEWIPC\fP が設定された場合、新しい IPC 名前空間 (namespace) でプロセスを作成する。
147 このフラグが設定されていない場合、 (\fBfork\fP(2) の場合と同様) 呼び出し元のプロセスと同じ IPC 名前空間でプロセスが 作成される。
148 このフラグは、コンテナの実装での使用を意図して用意されたものである。
150 .\" commit 7eafd7c74c3f2e67c27621b987b28397110d643f
151 .\" https://lwn.net/Articles/312232/
152 An IPC namespace provides an isolated view of System V IPC objects (see
153 \fBsvipc\fP(7)) and (since Linux 2.6.30) POSIX message queues (see
154 \fBmq_overview\fP(7)). The common characteristic of these IPC mechanisms is
155 that IPC objects are identified by mechanisms other than filesystem
158 Objects created in an IPC namespace are visible to all other processes that
159 are members of that namespace, but are not visible to processes in other IPC
162 IPC 名前空間が破棄される時 (すなわち、その名前空間のメンバーの最後のプロセスが終了する時)、 その名前空間の全ての IPC
165 このフラグを使用するためには、 カーネルでオプション \fBCONFIG_SYSVIPC\fP と \fBCONFIG_IPC_NS\fP を有効になっていること、
166 プロセスが特権 (\fBCAP_SYS_ADMIN\fP) を持っていることが必要である。 このフラグは \fBCLONE_SYSVSEM\fP
169 \fBCLONE_NEWNET\fP (Linux 2.6.24 以降)
170 .\" FIXME Check when the implementation was completed
171 (このフラグの実装は、Linux 2.6.29 あたりまでに完成した。)
173 \fBCLONE_NEWNET\fP が設定された場合、新しいネットワーク名前空間 (network namaspace) でプロセスを作成する。
174 このフラグが設定されていない場合、 (\fBfork\fP(2) の場合と同様) 呼び出し元のプロセスと同じネットワーク名前空間でプロセスが 作成される。
175 このフラグは、コンテナの実装での使用を意図して用意されたものである。
177 .\" FIXME Add pointer to veth(4) page when it is eventually completed
178 ネットワーク名前空間は、分離されたネットワークスタックを提供するものである (ネットワークスタックとは、 ネットワークデバイスインタフェース、IPv4
179 や IPv6 プロトコルスタック、 \fI/proc/net\fP、 \fI/sys/class/net\fP ディレクトリツリー、ソケットなどである)。
180 物理ネットワークデバイスが所属できるネットワーク名前空間は一つだけである。 仮想ネットワークデバイス ("veth") のペアにより パイプ風の抽象化
181 (abstraction) が実現されており、 これを使うことで、ネットワーク名前空間間のトンネルを作成したり、
182 別の名前空間の物理ネットワークデバイスへのブリッジを作成したり することができる。
184 ネットワーク名前空間が解放される時 (すなわち、その名前空間の最後のプロセスが終了する時)、 物理ネットワークデバイスは初期ネットワーク名前空間
185 (initial network namespace) に戻される (親プロセスのネットワーク名前空間に戻される訳ではない)。
187 このフラグを使用するためには、 カーネルでオプション \fBCONFIG_NET_NS\fP を有効になっていること、 プロセスが特権
188 (\fBCAP_SYS_ADMIN\fP) を持っていることが必要である。
190 \fBCLONE_NEWNS\fP (Linux 2.4.19 以降)
191 子プロセスを新しいマウント名前空間 (mount namespace) で開始する。
193 各プロセスはある一つのマウント名前空間中に存在する。プロセスの \fI名前空間 (namespace)\fP
194 は、そのプロセスから見えるファイル階層を表すデータ (mount の集合) である。 \fBCLONE_NEWNS\fP フラグがセットされずに
195 \fBfork\fP(2) か \fBclone\fP() が呼ばれると、子プロセスは親プロセスと同じマウント名前空間に作成される。 システムコール
196 \fBmount\fP(2)、 \fBumount\fP(2) が呼ばれると呼び出し元のプロセスのマウント名前空間が変更され、この結果
197 呼び出し元のプロセスと同じ名前空間にいるプロセスはすべて影響を受けるが、 異なるマウント名前空間にいるプロセスは影響を受けない。
199 \fBCLONE_NEWNS\fP フラグがセットされて \fBclone\fP() が呼ばれると、clone で作成された子プロセスは新しいマウント名前空間で
200 開始される。新しい名前空間は親プロセスの名前空間のコピーで初期化される。
202 特権プロセス (\fBCAP_SYS_ADMIN\fP ケーパビリティを持つプロセス) のみが \fBCLONE_NEWNS\fP フラグを指定することができる。
203 一つの \fBclone\fP() 呼び出しで、 \fBCLONE_NEWNS\fP と \fBCLONE_FS\fP の両方を指定することはできない。
205 \fBCLONE_NEWPID\fP (Linux 2.6.24 以降)
206 .\" This explanation draws a lot of details from
207 .\" http://lwn.net/Articles/259217/
208 .\" Authors: Pavel Emelyanov <xemul@openvz.org>
209 .\" and Kir Kolyshkin <kir@openvz.org>
211 .\" The primary kernel commit is 30e49c263e36341b60b735cbef5ca37912549264
212 .\" Author: Pavel Emelyanov <xemul@openvz.org>
213 \fBCLONE_NEWPID\fP が設定された場合、新しい PID 名前空間でプロセスを作成する。 このフラグが設定されていない場合、
214 (\fBfork\fP(2) の場合と同様) 呼び出し元のプロセスと同じ PID 名前空間で プロセスが作成される。
215 このフラグは、コンテナの実装での使用を意図して用意されたものである。
217 PID 名前空間は、PID に関して分離された環境を提供するものである。 新しい名前空間における PID は 1 から始まり
218 (これはスタンドアロンのシステムと似たような感じ)、 \fBfork\fP(2), \fBvfork\fP(2), \fBclone\fP()
219 を呼び出すと、その名前空間で一意な PID を持ったプロセスが作成される。
221 新しい名前空間で作成される最初のプロセス (つまり、 \fBCLONE_NEWPID\fP フラグを使って作成されたプロセス) の PID は 1 であり、
222 このプロセスはその名前空間における "init" プロセスとなる。 この名前空間において孤児 (orphaned) となった子プロセスについては、
223 \fBinit\fP(8) ではなくこのプロセスが親プロセスとなる。 昔ながらの \fBinit\fP プロセスとは違い、PID 名前空間の "init"
224 プロセスは終了 (terminated) する ことができ、その場合には、この名前空間の全てのプロセスが終了される。
226 PID 名前空間間には階層構造が形成される。 新しい PID 名前空間が作成されると、その名前空間のプロセスは、 新しい名前空間を作成したプロセスの
227 PID 名前空間で見える。 同様に、親の PID 名前空間自体が別の PID 名前空間の子供の場合には、 子供の PID 名前空間と親の PID
228 名前空間のプロセスはどれも 親の親の PID 名前空間でも見えることになる。 反対に、「子供」の PID 名前空間のプロセスには、
229 親の名前空間のプロセスは見えない。 名前空間に階層構造が存在するということは、個々のプロセスは 複数の PID を持つということを意味している。
230 そのプロセスが見える名前空間一つにつき PID が一つあり、 それぞれの PID は対応する名前空間において一意である。 (\fBgetpid\fP(2)
231 を呼び出すと、常にそのプロセスが存在している名前空間における PID が返される。)
233 .\" mount -t proc proc /proc
234 新しい名前空間の作成後には、 子プロセスにおいて、 \fBps\fP(1) といったツールが正しく動作するように、 自身の root ディレクトリを変更し、
235 \fI/proc\fP に新しい procfs インスタンスをマウントするのがよいだろう。 (\fBflags\fP に \fBCLONE_NEWNS\fP
236 も指定されていた場合には、root ディレクトリを変更する必要はなく、 いきなり新しい procfs インスタンスを \fI/proc\fP
239 このフラグを使用するためには、 カーネルでオプション \fBCONFIG_PID_NS\fP を有効になっていること、 プロセスが特権
240 (\fBCAP_SYS_ADMIN\fP) を持っていることが必要である。 このフラグは \fBCLONE_THREAD\fP と組み合わせて使うことはできない。
242 \fBCLONE_NEWUTS\fP (Linux 2.6.19 以降)
243 \fBCLONE_NEWUTS\fP が設定された場合、新しい UTS 名前空間でプロセスを作成する。 新しい UTS
244 名前空間の識別子の初期値は、呼び出し元のプロセスの UTS 名前空間の識別子を複製したものとなる。 このフラグが設定されていない場合、
245 (\fBfork\fP(2) の場合と同様) 呼び出し元のプロセスと同じ UTS 名前空間で プロセスが作成される。
246 このフラグは、コンテナの実装での使用を意図して用意されたものである。
248 UTS 名前空間は、 \fBuname\fP(2) が返す識別子の集合である。 識別子としてはドメイン名とホスト名があり、 それぞれ
249 \fBsetdomainname\fP(2), \fBsethostname\fP(2) で修正することができる。 ある UTS
250 名前空間における識別子の変更は同じ名前空間の他のすべての プロセスに見えるが、別の UTS 名前空間のプロセスには見えない。
252 このフラグを使用するためには、 カーネルでオプション \fBCONFIG_UTS_NS\fP を有効になっていること、 プロセスが特権
253 (\fBCAP_SYS_ADMIN\fP) を持っていることが必要である。
255 \fBCLONE_PARENT\fP (Linux 2.3.12 以降)
256 \fBCLONE_PARENT\fP が設定された場合、新しい子供の (\fBgetppid\fP(2) で返される)
257 親プロセスは呼び出し元のプロセスの親プロセスと同じになる。
259 \fBCLONE_PARENT\fP が設定されていない場合、 (\fBfork\fP(2) と同様に) 呼び出し元のプロセスがその子供の親になる。
261 子供が終了した時にシグナルが送られるのは \fBgetppid\fP(2) が返す親プロセスである点に注意すること。このため \fBCLONE_PARENT\fP
262 が設定された場合、呼び出し元のプロセスではなく呼び出し元のプロセスの 親プロセスにシグナルが送られる。
264 \fBCLONE_PARENT_SETTID\fP (Linux 2.5.49 以降)
265 親プロセスと子プロセスのメモリ内の \fIptid\fP が指す領域に子プロセスのスレッド ID を格納する。 (Linux 2.5.32\-2.5.48
266 では、 同じことをする \fBCLONE_SETTID\fP というフラグが存在した。)
268 \fBCLONE_PID\fP (廃止予定)
269 \fBCLONE_PID\fP が設定された場合、子プロセスは呼び出し元のプロセスと同じプロセス ID
270 で作成される。これはシステムをハッキングするのには便利だが、 それ以外にはあまり使われない。 Linux 2.3.21 以降では、
271 システムのブートプロセス (PID 0) だけがこのフラグを指定できる。 Linux 2.5.16 で削除された。
273 \fBCLONE_PTRACE\fP (Linux 2.2 以降)
274 \fBCLONE_PTRACE\fP が指定され、かつ呼び出し元のプロセスが追跡 (trace) されていた場合、子プロセスも 同様に追跡される。
275 (\fBptrace\fP(2) を参照のこと)
277 \fBCLONE_SETTLS\fP (Linux 2.5.32 以降)
278 \fInewtls\fP 引き数は、新しい TLS (Thread Local Storage) ディスクリプタである。
279 (\fBset_thread_area\fP(2) を参照のこと)
281 \fBCLONE_SIGHAND\fP (Linux 2.0 以降)
282 \fBCLONE_SIGHAND\fP が設定された場合、呼び出し元のプロセスと子プロセスは同じシグナル・ハン
283 ドラのテーブルを共有する。呼び出し元のプロセスまたは子プロセスのどちらかが \fBsigaction\fP(2)
284 を呼び出してシグナルに対応する動作を変更した場合、 もう一方のプロセスのシグナル動作も変更される。 但し、呼び出し元のプロセスと子プロセスは、
285 プロセス毎に、シグナル・マスク (signal mask) と処理待ちシグナルの集合 を持っている。このため、あるプロセスは、
286 \fBsigprocmask\fP(2) を使用して、もう一方のプロセスに影響を与えずに シグナルを禁止 (block) したり許可 (unblock)
289 \fBCLONE_SIGHAND\fP が設定されていない場合、子プロセスは \fBclone\fP()
290 が実行された時点での、呼び出し元のプロセスのシグナル・ハンドラの コピーを継承する。これ以降は、一方のプロセスが \fBsigaction\fP(2)
291 を呼び出しても、もう一方のプロセスには影響を与えない。
293 Linux 2.6.0\-test6 以降では、 \fBCLONE_SIGHAND\fP を指定する場合、 \fBCLONE_VM\fP も \fIflags\fP
296 \fBCLONE_STOPPED\fP (Linux 2.6.0\-test2 以降)
297 \fBCLONE_STOPPED\fP が設定されると、子プロセスは最初 (\fBSIGSTOP\fP シグナルを送られたかのように) 停止した状態となる。
298 子プロセスを再開させるには \fBSIGCONT\fP シグナルを送信しなければならない。
300 .\" glibc 2.8 removed this defn from bits/sched.h
301 このフラグは Linux 2.6.25 以降では\fI非推奨\fPであり、
302 Linux 2.6.38 で完全に\fI削除\fPされた。
304 \fBCLONE_SYSVSEM\fP (Linux 2.5.10 以降)
305 \fBCLONE_SYSVSEM\fP がセットされると、子プロセスと呼び出し元プロセスは一つの System V セマフォのアンドゥ値リスト
306 (\fBsemop\fP(2) 参照) を共有する。このフラグがセットされていなければ、 子プロセスは独自のアンドゥリストを持つ
309 \fBCLONE_THREAD\fP (Linux 2.4.0\-test8以降)
310 \fBCLONE_THREAD\fP が設定された場合、子プロセスは呼び出し元のプロセスと同じスレッド・グループに 置かれる。 \fBCLONE_THREAD\fP
311 についての以降の議論を読みやすくするため、 「スレッド」という用語はスレッド・グループの中のプロセスを 参照するのに使うこととする。
313 スレッド・グループは、 スレッド集合で一つの PID を共有するという POSIX スレッドの概念をサポートするために Linux 2.4
314 に加えられた機能であった。 内部的には、この共有 PID はいわゆるそのスレッドグループの スレッド・グループ識別子 (TGID) である。 Linux
315 2.4 以降では、 \fBgetpid\fP(2) の呼び出しではそのプロセスのスレッド・グループ ID を返す。
317 あるグループに属するスレッドは (システム全体で) 一意なスレッド ID (TID) で区別できる。新しいスレッドの TID は \fBclone\fP()
318 の呼び出し元へ関数の結果として返され、 スレッドは自分自身の TID を \fBgettid\fP(2) で取得できる。
320 \fBCLONE_THREAD\fP を指定せずに \fBclone\fP() の呼び出しが行われると、 生成されたスレッドはそのスレッドの TID と同じ値の
321 TGID を持つ 新しいスレッド・グループに置かれる。このスレッドは 新しいスレッド・グループの「リーダー」である。
323 \fBCLONE_THREAD\fP を指定して作成された新しいスレッドは、 (\fBCLONE_PARENT\fP の場合と同様に) \fBclone\fP()
324 を呼び出し元と同じ親プロセスを持つ。 そのため、 \fBgetppid\fP(2) を呼ぶと、一つのスレッド・グループに属すスレッドは全て同じ値を返す。
325 \fBCLONE_THREAD\fP で作られたスレッドが終了した際に、 そのスレッドを \fBclone\fP() を使って生成したスレッドには
326 \fBSIGCHLD\fP (もしくは他の終了シグナル) は送信されない。 また、 \fBwait\fP(2)
327 を使って終了したスレッドの状態を取得することもできない (そのようなスレッドは \fIdetached\fP (分離された) といわれる)。
329 スレッド・グループに属す全てのスレッドが終了した後、 そのスレッド・グループの親プロセスに \fBSIGCHLD\fP (もしくは他の終了シグナル)
332 スレッド・グループに属すいずれかのスレッドが \fBexecve\fP(2) を実行すると、スレッド・グループ・リーダー以外の全てのスレッドは
333 終了され、新しいプロセスがそのスレッド・グループ・リーダーの下で 実行される。
335 スレッド・グループに属すスレッドの一つが \fBfork\fP(2) を使って子プロセスを作成した場合、 スレッド・グループのどのスレッドであっても
336 その子供を \fBwait\fP(2) できる。
338 Linux 2.5.35 以降では、 \fBCLONE_THREAD\fP を指定する場合、 \fIflags\fP に \fBCLONE_SIGHAND\fP
341 \fBkill\fP(2) を使ってスレッド・グループ全体 (つまり TGID) にシグナルを送ることもできれば、 \fBtgkill\fP(2)
342 を使って特定のスレッド (つまり TID) にシグナルを送ることもできる。
344 シグナルの配送と処理はプロセス全体に影響する: ハンドラを設定していないシグナルがあるスレッドに配送されると、
345 そのシグナルはスレッド・グループの全メンバーに影響を及ぼす (終了したり、停止したり、動作を継続したり、無視されたりする)。
347 各々のスレッドは独自のシグナルマスクを持っており、 \fBsigprocmask\fP(2) で設定できる。 だが、処理待ちのシグナルには、
348 \fBkill\fP(2) で送信されるプロセス全体に対するもの (つまり、スレッド・グループの どのメンバーにも配送できるもの) と、
349 \fBtgkill\fP(2) で送信される個々のスレッドに対するものがありえる。 \fBsigpending\fP(2)
350 を呼び出すと、プロセス全体に対する処理待ちシグナルと呼び出し元の スレッドに対する処理待ちシグナルを結合したシグナル集合が返される。
352 \fBkill\fP(2) を使ってスレッド・グループにシグナルが送られた場合で、 そのスレッド・グループがそのシグナルに対するシグナル・ハンドラが
353 登録されていたときには、シグナル・ハンドラはスレッド・グループの メンバーのうち、ただ一つのスレッドでだけ起動される。ハンドラが
354 起動されるスレッドは、そのシグナルを禁止 (block) していない メンバーの中から一つだけが勝手に (arbitrarily) 選ばれる。
355 スレッド・グループに属す複数のスレッドが \fBsigwaitinfo\fP(2) を使って同じシグナルを待っている場合、
356 これらのスレッドの中から一つをカーネルが勝手に選択し、 そのスレッドが \fBkill (2)\fP を使って送信されたシグナルを受信する。
358 \fBCLONE_UNTRACED\fP (Linux 2.5.46 以降)
359 \fBCLONE_UNTRACED\fP が指定されると、 trace を行っているプロセスは この子プロセスに \fBCLONE_PTRACE\fP
362 \fBCLONE_VFORK\fP (Linux 2.2 以降)
363 \fBCLONE_VFORK\fP が設定された場合、 (\fBvfork\fP(2) と同様に) 子プロセスが \fBexecve\fP(2) または
364 \fB_exit\fP(2) によって仮想メモリを解放するまで、呼び出し元のプロセスの実行は停止される。
366 \fBCLONE_VFORK\fP が設定されていない場合、 \fBclone\fP() 呼び出し後は、呼び出し元のプロセスと子プロセスの
367 両方がスケジュール対象となり、アプリケーションはこれらのプロセスの 実行順序に依存しないようにすべきである。
369 \fBCLONE_VM\fP (Linux 2.0 以降)
370 \fBCLONE_VM\fP が設定された場合、呼び出し元のプロセスと子プロセスは同じメモリ空間で
371 実行される。特に、呼び出し元のプロセスや子プロセスの一方がメモリに 書き込んだ内容はもう一方のプロセスからも見ることができる。さらに、
372 子プロセスや呼び出し元のプロセスの一方が \fBmmap\fP(2) や \fBmunmap\fP(2) を使ってメモリをマップしたりアンマップした場合、
375 \fBCLONE_VM\fP が設定されていない場合、子プロセスは \fBclone\fP() が実行された時点での、親プロセスのメモリ空間をコピーした
376 別のメモリ空間で実行される。 一方のプロセスが行ったメモリへの書き込みや ファイルのマップ/アンマップは、 \fBfork\fP(2)
377 の場合と同様、もう一方のプロセスには影響しない。
379 The \fBsys_clone\fP system call corresponds more closely to \fBfork\fP(2) in that
380 execution in the child continues from the point of the call. As such, the
381 \fIfn\fP and \fIarg\fP arguments of the \fBclone\fP() wrapper function are omitted.
382 Furthermore, the argument order changes. The raw system call interface is
387 \fBlong clone(unsigned long \fP\fIflags\fP\fB, void *\fP\fIchild_stack\fP\fB,\fP
388 \fB void *\fP\fIptid\fP\fB, void *\fP\fIctid\fP\fB,\fP
389 \fB struct pt_regs *\fP\fIregs\fP\fB);\fP
393 \fBsys_clone\fP のもう一つの違いは、 \fIchild_stack\fP 引き数がゼロでも良いことである。この場合には、どちらかのプロセスが
394 スタックを変更した時に、書き込み時コピー (copy\-on\-write) 方式により
395 子プロセスがスタック・ページの独立したコピーを得られることが保証される。 この場合、正常に動作させるためには、 \fBCLONE_VM\fP
397 .SS "Linux 2.4 and earlier"
398 Linux 2.4 以前では、 \fBclone\fP() は引き数 \fIptid\fP, \fItls\fP, \fIctid\fP を取らない。
400 .\" gettid(2) returns current->pid;
401 .\" getpid(2) returns current->tgid;
402 成功した場合、呼び出し元の実行スレッドには子プロセスのスレッドID が返される。 失敗した場合、 呼び出し元のコンテキストには \-1
403 が返され、子プロセスは 作成されず、 \fIerrno\fP が適切に設定される。
410 \fBCLONE_SIGHAND\fP が指定されていたが、 \fBCLONE_VM\fP が指定されていなかった。 (Linux 2.6.0\-test6 以降)
416 .\" .B CLONE_DETACHED
420 .\" (Since Linux 2.6.0-test6.)
421 \fBCLONE_THREAD\fP が指定されていたが、 \fBCLONE_SIGHAND\fP が指定されていなかった。 (Linux 2.5.35 以降)
424 \fBCLONE_FS\fP と \fBCLONE_NEWNS\fP の両方が \fIflags\fP に指定された。
427 \fBCLONE_NEWIPC\fP と \fBCLONE_SYSVSEM\fP の両方が \fIflags\fP に指定された。
430 \fBCLONE_NEWPID\fP と \fBCLONE_THREAD\fP の両方が \fIflags\fP に指定された。
433 \fIchild_stack\fP にゼロを指定した場合に \fBclone\fP() が返す。
436 \fIflags\fP に \fBCLONE_NEWIPC\fP が指定されたが、カーネルでオプション \fBCONFIG_SYSVIPC\fP と
437 \fBCONFIG_IPC_NS\fP が有効になっていなかった。
440 \fIflags\fP に \fBCLONE_NEWNET\fP が指定されたが、カーネルでオプション \fBCONFIG_NET_NS\fP が有効になっていなかった。
443 \fIflags\fP に \fBCLONE_NEWPID\fP が指定されたが、カーネルでオプション \fBCONFIG_PID_NS\fP が有効になっていなかった。
446 \fIflags\fP に \fBCLONE_NEWUTS\fP が指定されたが、カーネルでオプション \fBCONFIG_UTS\fP が有効になっていなかった。
449 子プロセスのために確保すべきタスク構造体や、呼び出し元のコンテキストの 一部をコピーするのに必要なメモリを十分に割り当てることができない。
452 非特権プロセス (\fBCAP_SYS_ADMIN\fP を持たないプロセス) が \fBCLONE_NEWIPC\fP, \fBCLONE_NEWNET\fP,
453 \fBCLONE_NEWNS\fP, \fBCLONE_NEWPID\fP, \fBCLONE_NEWUTS\fP を指定した。
456 PID が 0 以外のプロセスによって \fBCLONE_PID\fP が指定された。
458 libc5 には \fBclone\fP() はない。glibc2 では \fBclone\fP() が提供されており、このマニュアルページに記載の通りである。
460 \fBclone\fP() と \fBsys_clone\fP コールは Linux 特有であり、移植を考慮したプログラムでは使用すべき ではない。
462 カーネル 2.4.x 系列では、一般的には \fBCLONE_THREAD\fP フラグを指定しても新しいスレッドの親を
463 呼び出し元プロセスの親と同じにはしない。 しかし、バージョン 2.4.7〜2.4.18 のカーネルでは、 (カーネル 2.6 と同じように)
464 CLONE_THREAD フラグを指定すると、 暗黙のうちに CLONE_PARENT フラグを指定したことになる。
466 \fBCLONE_DETACHED\fP というフラグが、2.5.32 で導入されて以来しばらくの間存在した。
467 このフラグは親プロセスが子プロセス終了のシグナルを必要としないことを 表すものである。 2.6.2 で、 CLONE_DETATCHED を
468 CLONE_THREAD と一緒に指定する必要はなくなった。 このフラグはまだ定義されているが、何の効果もない。
470 i386 上では、 \fBclone\fP() は vsyscall 経由ではなく、直接 \fIint $0x80\fP 経由で呼び出すべきである。
472 ia64 では、別のシステムコールが使用される:
475 \fBint __clone2(int (*\fP\fIfn\fP\fB)(void *), \fP
476 \fB void *\fP\fIchild_stack_base\fP\fB, size_t \fP\fIstack_size\fP\fB,\fP
477 \fB int \fP\fIflags\fP\fB, void *\fP\fIarg\fP\fB, ... \fP
478 \fB /* pid_t *\fP\fIptid\fP\fB, struct user_desc *\fP\fItls\fP\fB, pid_t *\fP\fIctid\fP\fB */ );\fP
481 \fB__clone2\fP() システムコールは \fBclone\fP() と同じように動作するが、以下の点が異なる:
482 \fIchild_stack_base\fP は子プロセスのスタックエリアの最小のアドレスを指し、 \fIstack_size\fP は
483 \fIchild_stack_base\fP が指し示すスタックエリアの大きさを示す。
485 NPTL スレッド・ライブラリを含んでいる GNU C ライブラリのいくつかのバージョン には、 \fBgetpid\fP(2)
486 のラッパー関数が含まれており、このラッパー関数は PID をキャッシュする。 このキャッシュ処理が正しく動作するためには glibc の
487 \fBclone\fP() のラッパー関数での助けが必要だが、現状の実装では、 ある状況下においてキャッシュが最新とならない可能性がある。 特に、
488 \fBclone\fP() の呼び出し直後にシグナルが子プロセスに配送された場合に、 そのシグナルに対するハンドラ内で \fBgetpid\fP(2)
489 を呼び出すと、それまでに clone のラッパー関数が子プロセスの PID キャッシュを 更新する機会が得られていなければ、呼び出し元プロセス
490 ("親プロセス") の PID が 返される可能性がある。 (この議論では、子プロセスが \fBCLONE_THREAD\fP
491 を使って作成された場合のことは無視している。 子プロセスが \fBCLONE_THREAD\fP を作って作成された場合には、
492 呼び出し元と子プロセスは同じスレッド・グループに属すので、 \fBgetpid\fP(2) は子プロセスと \fBclone\fP()
493 を呼び出したプロセスで同じ値を返すのが「正しい」。 キャッシュが最新とならない問題 (stale\-cache problem) は、 \fIflags\fP
494 に \fBCLONE_VM\fP が含まれている場合にも発生しない。) 本当の値を得るためには、次のようなコードを使う必要があるかもしれない。
501 mypid = syscall(SYS_getpid);
503 .\" See also the following bug reports
504 .\" https://bugzilla.redhat.com/show_bug.cgi?id=417521
505 .\" http://sourceware.org/bugzilla/show_bug.cgi?id=6910
507 .SS "Create a child that executes in a separate UTS namespace"
508 The following program demonstrates the use of \fBclone\fP() to create a child
509 process that executes in a separate UTS namespace. The child changes the
510 hostname in its UTS namespace. Both parent and child then display the
511 system hostname, making it possible to see that the hostname differs in the
512 UTS namespaces of the parent and child. For an example of the use of this
513 program, see \fBsetns\fP(2).
517 #include <sys/wait.h>
518 #include <sys/utsname.h>
525 #define errExit(msg) do { perror(msg); exit(EXIT_FAILURE); \e
528 static int /* Start function for cloned child */
533 /* Change hostname in UTS namespace of child */
535 if (sethostname(arg, strlen(arg)) == \-1)
536 errExit("sethostname");
538 /* Retrieve and display hostname */
540 if (uname(&uts) == \-1)
542 printf("uts.nodename in child: %s\en", uts.nodename);
544 /* Keep the namespace open for a while, by sleeping.
545 This allows some experimentation\-\-for example, another
546 process might join the namespace. */
550 return 0; /* Child terminates now */
553 #define STACK_SIZE (1024 * 1024) /* Stack size for cloned child */
556 main(int argc, char *argv[])
558 char *stack; /* Start of stack buffer */
559 char *stackTop; /* End of stack buffer */
564 fprintf(stderr, "Usage: %s <child\-hostname>\en", argv[0]);
568 /* Allocate stack for child */
570 stack = malloc(STACK_SIZE);
573 stackTop = stack + STACK_SIZE; /* Assume stack grows downward */
575 /* Create child that has its own UTS namespace;
576 child commences execution in childFunc() */
578 pid = clone(childFunc, stackTop, CLONE_NEWUTS | SIGCHLD, argv[1]);
581 printf("clone() returned %ld\en", (long) pid);
583 /* Parent falls through to here */
585 sleep(1); /* Give child time to change its hostname */
587 /* Display hostname in parent\(aqs UTS namespace. This will be
588 different from hostname in child\(aqs UTS namespace. */
590 if (uname(&uts) == \-1)
592 printf("uts.nodename in parent: %s\en", uts.nodename);
594 if (waitpid(pid, NULL, 0) == \-1) /* Wait for child */
596 printf("child has terminated\en");
602 \fBfork\fP(2), \fBfutex\fP(2), \fBgetpid\fP(2), \fBgettid\fP(2), \fBkcmp\fP(2),
603 \fBset_thread_area\fP(2), \fBset_tid_address\fP(2), \fBsetns\fP(2), \fBtkill\fP(2),
604 \fBunshare\fP(2), \fBwait\fP(2), \fBcapabilities\fP(7), \fBpthreads\fP(7)
606 この man ページは Linux \fIman\-pages\fP プロジェクトのリリース 3.50 の一部
607 である。プロジェクトの説明とバグ報告に関する情報は
608 http://www.kernel.org/doc/man\-pages/ に書かれている。