OSDN Git Service

f109b89ef385f886950100e79fe87859cb38585f
[linuxjm/LDP_man-pages.git] / original / man7 / socket.7
1 '\" t
2 .\" Don't change the first line, it tells man that we need tbl.
3 .\" This man page is Copyright (C) 1999 Andi Kleen <ak@muc.de>.
4 .\" and copyright (c) 1999 Matthew Wilcox.
5 .\" Permission is granted to distribute possibly modified copies
6 .\" of this page provided the header is included verbatim,
7 .\" and in case of nontrivial modification author and date
8 .\" of the modification is added to the header.
9 .\"
10 .\" 2002-10-30, Michael Kerrisk, <mtk.manpages@gmail.com>
11 .\"     Added description of SO_ACCEPTCONN
12 .\" 2004-05-20, aeb, added SO_RCVTIMEO/SO_SNDTIMEO text.
13 .\" Modified, 27 May 2004, Michael Kerrisk <mtk.manpages@gmail.com>
14 .\"     Added notes on capability requirements
15 .\"     A few small grammar fixes
16 .\" FIXME
17 .\" The following are not yet documented:
18 .\"     SO_PEERNAME
19 .\"     SO_TIMESTAMPNS
20 .\"     SO_MARK
21 .\"     SO_TIMESTAMPING
22 .\"     SO_PROTOCOL (2.6.32)
23 .\"     SO_DOMAIN (2.6.32)
24 .\"     SO_RXQ_OVFL (2.6.33)
25 .\"
26 .TH SOCKET 7 2008-12-03 Linux "Linux Programmer's Manual"
27 .SH NAME
28 socket \- Linux socket interface
29 .SH SYNOPSIS
30 .B #include <sys/socket.h>
31 .sp
32 .IB sockfd " = socket(int " socket_family ", int " socket_type ", int " protocol );
33 .SH DESCRIPTION
34 This manual page describes the Linux networking socket layer user
35 interface.
36 The BSD compatible sockets
37 are the uniform interface
38 between the user process and the network protocol stacks in the kernel.
39 The protocol modules are grouped into
40 .I protocol families
41 like
42 .BR AF_INET ", " AF_IPX ", " AF_PACKET
43 and
44 .I socket types
45 like
46 .B SOCK_STREAM
47 or
48 .BR SOCK_DGRAM .
49 See
50 .BR socket (2)
51 for more information on families and types.
52 .SS Socket Layer Functions
53 These functions are used by the user process to send or receive packets
54 and to do other socket operations.
55 For more information see their respective manual pages.
56
57 .BR socket (2)
58 creates a socket,
59 .BR connect (2)
60 connects a socket to a remote socket address,
61 the
62 .BR bind (2)
63 function binds a socket to a local socket address,
64 .BR listen (2)
65 tells the socket that new connections shall be accepted, and
66 .BR accept (2)
67 is used to get a new socket with a new incoming connection.
68 .BR socketpair (2)
69 returns two connected anonymous sockets (only implemented for a few
70 local families like
71 .BR AF_UNIX )
72 .PP
73 .BR send (2),
74 .BR sendto (2),
75 and
76 .BR sendmsg (2)
77 send data over a socket, and
78 .BR recv (2),
79 .BR recvfrom (2),
80 .BR recvmsg (2)
81 receive data from a socket.
82 .BR poll (2)
83 and
84 .BR select (2)
85 wait for arriving data or a readiness to send data.
86 In addition, the standard I/O operations like
87 .BR write (2),
88 .BR writev (2),
89 .BR sendfile (2),
90 .BR read (2),
91 and
92 .BR readv (2)
93 can be used to read and write data.
94 .PP
95 .BR getsockname (2)
96 returns the local socket address and
97 .BR getpeername (2)
98 returns the remote socket address.
99 .BR getsockopt (2)
100 and
101 .BR setsockopt (2)
102 are used to set or get socket layer or protocol options.
103 .BR ioctl (2)
104 can be used to set or read some other options.
105 .PP
106 .BR close (2)
107 is used to close a socket.
108 .BR shutdown (2)
109 closes parts of a full-duplex socket connection.
110 .PP
111 Seeking, or calling
112 .BR pread (2)
113 or
114 .BR pwrite (2)
115 with a nonzero position is not supported on sockets.
116 .PP
117 It is possible to do nonblocking I/O on sockets by setting the
118 .B O_NONBLOCK
119 flag on a socket file descriptor using
120 .BR fcntl (2).
121 Then all operations that would block will (usually)
122 return with
123 .B EAGAIN
124 (operation should be retried later);
125 .BR connect (2)
126 will return
127 .B EINPROGRESS
128 error.
129 The user can then wait for various events via
130 .BR poll (2)
131 or
132 .BR select (2).
133 .TS
134 tab(:) allbox;
135 c s s
136 l l l.
137 I/O events
138 Event:Poll flag:Occurrence
139 Read:POLLIN:T{
140 New data arrived.
141 T}
142 Read:POLLIN:T{
143 A connection setup has been completed
144 (for connection-oriented sockets)
145 T}
146 Read:POLLHUP:T{
147 A disconnection request has been initiated by the other end.
148 T}
149 Read:POLLHUP:T{
150 A connection is broken (only for connection-oriented protocols).
151 When the socket is written
152 .B SIGPIPE
153 is also sent.
154 T}
155 Write:POLLOUT:T{
156 Socket has enough send buffer space for writing new data.
157 T}
158 Read/Write:T{
159 POLLIN|
160 .br
161 POLLOUT
162 T}:T{
163 An outgoing
164 .BR connect (2)
165 finished.
166 T}
167 Read/Write:POLLERR:An asynchronous error occurred.
168 Read/Write:POLLHUP:The other end has shut down one direction.
169 Exception:POLLPRI:T{
170 Urgent data arrived.
171 .B SIGURG
172 is sent then.
173 T}
174 .\" FIXME . The following is not true currently:
175 .\" It is no I/O event when the connection
176 .\" is broken from the local end using
177 .\" .BR shutdown (2)
178 .\" or
179 .\" .BR close (2).
180 .TE
181
182 .PP
183 An alternative to
184 .BR poll (2)
185 and
186 .BR select (2)
187 is to let the kernel inform the application about events
188 via a
189 .B SIGIO
190 signal.
191 For that the
192 .B O_ASYNC
193 flag must be set on a socket file descriptor via
194 .BR fcntl (2)
195 and a valid signal handler for
196 .B SIGIO
197 must be installed via
198 .BR sigaction (2).
199 See the
200 .I Signals
201 discussion below.
202 .SS Socket Options
203 These socket options can be set by using
204 .BR setsockopt (2)
205 and read with
206 .BR getsockopt (2)
207 with the socket level set to
208 .B SOL_SOCKET
209 for all sockets:
210 .\" SO_ACCEPTCONN is in POSIX.1-2001, and its origin is explained in
211 .\" W R Stevens, UNPv1
212 .TP
213 .B SO_ACCEPTCONN
214 Returns a value indicating whether or not this socket has been marked
215 to accept connections with
216 .BR listen (2).
217 The value 0 indicates that this is not a listening socket,
218 the value 1 indicates that this is a listening socket.
219 Can only be read
220 with
221 .BR getsockopt (2).
222 .TP
223 .B SO_BINDTODEVICE
224 Bind this socket to a particular device like \(lqeth0\(rq,
225 as specified in the passed interface name.
226 If the
227 name is an empty string or the option length is zero, the socket device
228 binding is removed.
229 The passed option is a variable-length null-terminated
230 interface name string with the maximum size of
231 .BR IFNAMSIZ .
232 If a socket is bound to an interface,
233 only packets received from that particular interface are processed by the
234 socket.
235 Note that this only works for some socket types, particularly
236 .B AF_INET
237 sockets.
238 It is not supported for packet sockets (use normal
239 .BR bind (8)
240 there).
241 .TP
242 .B SO_BROADCAST
243 Set or get the broadcast flag.
244 When enabled, datagram sockets
245 receive packets sent to a broadcast address and they are allowed to send
246 packets to a broadcast address.
247 This option has no effect on stream-oriented sockets.
248 .TP
249 .B SO_BSDCOMPAT
250 Enable BSD bug-to-bug compatibility.
251 This is used by the UDP protocol module in Linux 2.0 and 2.2.
252 If enabled ICMP errors received for a UDP socket will not be passed
253 to the user program.
254 In later kernel versions, support for this option has been phased out:
255 Linux 2.4 silently ignores it, and Linux 2.6 generates a kernel warning
256 (printk()) if a program uses this option.
257 Linux 2.0 also enabled BSD bug-to-bug compatibility
258 options (random header changing, skipping of the broadcast flag) for raw
259 sockets with this option, but that was removed in Linux 2.2.
260 .TP
261 .B SO_DEBUG
262 Enable socket debugging.
263 Only allowed for processes with the
264 .B CAP_NET_ADMIN
265 capability or an effective user ID of 0.
266 .TP
267 .B SO_ERROR
268 Get and clear the pending socket error.
269 Only valid as a
270 .BR getsockopt (2).
271 Expects an integer.
272 .TP
273 .B SO_DONTROUTE
274 Don't send via a gateway, only send to directly connected hosts.
275 The same effect can be achieved by setting the
276 .B MSG_DONTROUTE
277 flag on a socket
278 .BR send (2)
279 operation.
280 Expects an integer boolean flag.
281 .TP
282 .B SO_KEEPALIVE
283 Enable sending of keep-alive messages on connection-oriented sockets.
284 Expects an integer boolean flag.
285 .TP
286 .B SO_LINGER
287 Sets or gets the
288 .B SO_LINGER
289 option.
290 The argument is a
291 .I linger
292 structure.
293 .sp
294 .in +4n
295 .nf
296 struct linger {
297     int l_onoff;    /* linger active */
298     int l_linger;   /* how many seconds to linger for */
299 };
300 .fi
301 .in
302 .IP
303 When enabled, a
304 .BR close (2)
305 or
306 .BR shutdown (2)
307 will not return until all queued messages for the socket have been
308 successfully sent or the linger timeout has been reached.
309 Otherwise,
310 the call returns immediately and the closing is done in the background.
311 When the socket is closed as part of
312 .BR exit (2),
313 it always lingers in the background.
314 .TP
315 .B SO_OOBINLINE
316 If this option is enabled,
317 out-of-band data is directly placed into the receive data stream.
318 Otherwise out-of-band data is only passed when the
319 .B MSG_OOB
320 flag is set during receiving.
321 .\" don't document it because it can do too much harm.
322 .\".B SO_NO_CHECK
323 .TP
324 .B SO_PASSCRED
325 Enable or disable the receiving of the
326 .B SCM_CREDENTIALS
327 control message.
328 For more information see
329 .BR unix (7).
330 .\" FIXME Document SO_PASSSEC, added in 2.6.18; there is some info
331 .\" in the 2.6.18 ChangeLog
332 .TP
333 .B SO_PEERCRED
334 Return the credentials of the foreign process connected to this socket.
335 This is only possible for connected
336 .B AF_UNIX
337 stream sockets and
338 .B AF_UNIX
339 stream and datagram socket pairs created using
340 .BR socketpair (2);
341 see
342 .BR unix (7).
343 The returned credentials are those that were in effect at the time
344 of the call to
345 .BR connect (2)
346 or
347 .BR socketpair (2).
348 Argument is a
349 .I ucred
350 structure.
351 Only valid as a
352 .BR getsockopt (2).
353 .TP
354 .B SO_PRIORITY
355 Set the protocol-defined priority for all packets to be sent on
356 this socket.
357 Linux uses this value to order the networking queues:
358 packets with a higher priority may be processed first depending
359 on the selected device queueing discipline.
360 For
361 .BR ip (7),
362 this also sets the IP type-of-service (TOS) field for outgoing packets.
363 Setting a priority outside the range 0 to 6 requires the
364 .B CAP_NET_ADMIN
365 capability.
366 .TP
367 .B SO_RCVBUF
368 Sets or gets the maximum socket receive buffer in bytes.
369 The kernel doubles this value (to allow space for bookkeeping overhead)
370 when it is set using
371 .\" Most (all?) other implementations do not do this -- MTK, Dec 05
372 .BR setsockopt (2),
373 and this doubled value is returned by
374 .BR getsockopt (2).
375 The default value is set by the
376 .I /proc/sys/net/core/rmem_default
377 file, and the maximum allowed value is set by the
378 .I /proc/sys/net/core/rmem_max
379 file.
380 The minimum (doubled) value for this option is 256.
381 .TP
382 .BR SO_RCVBUFFORCE " (since Linux 2.6.14)"
383 Using this socket option, a privileged
384 .RB ( CAP_NET_ADMIN )
385 process can perform the same task as
386 .BR SO_RCVBUF ,
387 but the
388 .I rmem_max
389 limit can be overridden.
390 .TP
391 .BR SO_RCVLOWAT " and " SO_SNDLOWAT
392 Specify the minimum number of bytes in the buffer until the socket layer
393 will pass the data to the protocol
394 .RB ( SO_SNDLOWAT )
395 or the user on receiving
396 .RB ( SO_RCVLOWAT ).
397 These two values are initialized to 1.
398 .B SO_SNDLOWAT
399 is not changeable on Linux
400 .RB ( setsockopt (2)
401 fails with the error
402 .BR ENOPROTOOPT ).
403 .B SO_RCVLOWAT
404 is changeable
405 only since Linux 2.4.
406 The
407 .BR select (2)
408 and
409 .BR poll (2)
410 system calls currently do not respect the
411 .B SO_RCVLOWAT
412 setting on Linux,
413 and mark a socket readable when even a single byte of data is available.
414 A subsequent read from the socket will block until
415 .B SO_RCVLOWAT
416 bytes are available.
417 .\" See http://marc.theaimsgroup.com/?l=linux-kernel&m=111049368106984&w=2
418 .\" Tested on kernel 2.6.14 -- mtk, 30 Nov 05
419 .TP
420 .BR SO_RCVTIMEO " and " SO_SNDTIMEO
421 .\" Not implemented in 2.0.
422 .\" Implemented in 2.1.11 for getsockopt: always return a zero struct.
423 .\" Implemented in 2.3.41 for setsockopt, and actually used.
424 Specify the receiving or sending timeouts until reporting an error.
425 The argument is a
426 .IR "struct timeval" .
427 If an input or output function blocks for this period of time, and
428 data has been sent or received, the return value of that function
429 will be the amount of data transferred; if no data has been transferred
430 and the timeout has been reached then \-1 is returned with
431 .I errno
432 set to
433 .B EAGAIN
434 or
435 .B EWOULDBLOCK
436 .\" in fact to EAGAIN
437 just as if the socket was specified to be nonblocking.
438 If the timeout is set to zero (the default)
439 then the operation will never timeout.
440 Timeouts only have effect for system calls that perform socket I/O (e.g.,
441 .BR read (2),
442 .BR recvmsg (2),
443 .BR send (2),
444 .BR sendmsg (2));
445 timeouts have no effect for
446 .BR select (2),
447 .BR poll (2),
448 .BR epoll_wait (2),
449 etc.
450 .TP
451 .B SO_REUSEADDR
452 Indicates that the rules used in validating addresses supplied in a
453 .BR bind (2)
454 call should allow reuse of local addresses.
455 For
456 .B AF_INET
457 sockets this
458 means that a socket may bind, except when there
459 is an active listening socket bound to the address.
460 When the listening socket is bound to
461 .B INADDR_ANY
462 with a specific port then it is not possible
463 to bind to this port for any local address.
464 Argument is an integer boolean flag.
465 .TP
466 .B SO_SNDBUF
467 Sets or gets the maximum socket send buffer in bytes.
468 The kernel doubles this value (to allow space for bookkeeping overhead)
469 when it is set using
470 .\" Most (all?) other implementations do not do this -- MTK, Dec 05
471 .BR setsockopt (2),
472 and this doubled value is returned by
473 .BR getsockopt (2).
474 The default value is set by the
475 .I /proc/sys/net/core/wmem_default
476 file and the maximum allowed value is set by the
477 .I /proc/sys/net/core/wmem_max
478 file.
479 The minimum (doubled) value for this option is 2048.
480 .TP
481 .BR SO_SNDBUFFORCE " (since Linux 2.6.14)"
482 Using this socket option, a privileged
483 .RB ( CAP_NET_ADMIN )
484 process can perform the same task as
485 .BR SO_SNDBUF ,
486 but the
487 .I wmem_max
488 limit can be overridden.
489 .TP
490 .B SO_TIMESTAMP
491 Enable or disable the receiving of the
492 .B SO_TIMESTAMP
493 control message.
494 The timestamp control message is sent with level
495 .B SOL_SOCKET
496 and the
497 .I cmsg_data
498 field is a
499 .I "struct timeval"
500 indicating the
501 reception time of the last packet passed to the user in this call.
502 See
503 .BR cmsg (3)
504 for details on control messages.
505 .TP
506 .B SO_TYPE
507 Gets the socket type as an integer (like
508 .BR SOCK_STREAM ).
509 Can only be read
510 with
511 .BR getsockopt (2).
512 .SS Signals
513 When writing onto a connection-oriented socket that has been shut down
514 (by the local or the remote end)
515 .B SIGPIPE
516 is sent to the writing process and
517 .B EPIPE
518 is returned.
519 The signal is not sent when the write call
520 specified the
521 .B MSG_NOSIGNAL
522 flag.
523 .PP
524 When requested with the
525 .B FIOSETOWN
526 .BR fcntl (2)
527 or
528 .B SIOCSPGRP
529 .BR ioctl (2),
530 .B SIGIO
531 is sent when an I/O event occurs.
532 It is possible to use
533 .BR poll (2)
534 or
535 .BR select (2)
536 in the signal handler to find out which socket the event occurred on.
537 An alternative (in Linux 2.2) is to set a real-time signal using the
538 .B F_SETSIG
539 .BR fcntl (2);
540 the handler of the real time signal will be called with
541 the file descriptor in the
542 .I si_fd
543 field of its
544 .IR siginfo_t .
545 See
546 .BR fcntl (2)
547 for more information.
548 .PP
549 Under some circumstances (e.g., multiple processes accessing a
550 single socket), the condition that caused the
551 .B SIGIO
552 may have already disappeared when the process reacts to the signal.
553 If this happens, the process should wait again because Linux
554 will resend the signal later.
555 .\" .SS Ancillary Messages
556 .SS /proc interfaces
557 The core socket networking parameters can be accessed
558 via files in the directory
559 .IR /proc/sys/net/core/ .
560 .TP
561 .I rmem_default
562 contains the default setting in bytes of the socket receive buffer.
563 .TP
564 .I rmem_max
565 contains the maximum socket receive buffer size in bytes which a user may
566 set by using the
567 .B SO_RCVBUF
568 socket option.
569 .TP
570 .I wmem_default
571 contains the default setting in bytes of the socket send buffer.
572 .TP
573 .I wmem_max
574 contains the maximum socket send buffer size in bytes which a user may
575 set by using the
576 .B SO_SNDBUF
577 socket option.
578 .TP
579 .IR message_cost " and " message_burst
580 configure the token bucket filter used to load limit warning messages
581 caused by external network events.
582 .TP
583 .I netdev_max_backlog
584 Maximum number of packets in the global input queue.
585 .TP
586 .I optmem_max
587 Maximum length of ancillary data and user control data like the iovecs
588 per socket.
589 .\" netdev_fastroute is not documented because it is experimental
590 .SS Ioctls
591 These operations can be accessed using
592 .BR ioctl (2):
593
594 .in +4n
595 .nf
596 .IB error " = ioctl(" ip_socket ", " ioctl_type ", " &value_result ");"
597 .fi
598 .in
599 .TP
600 .B SIOCGSTAMP
601 Return a
602 .I struct timeval
603 with the receive timestamp of the last packet passed to the user.
604 This is useful for accurate round trip time measurements.
605 See
606 .BR setitimer (2)
607 for a description of
608 .IR "struct timeval" .
609 .\"
610 This ioctl should only be used if the socket option
611 .B SO_TIMESTAMP
612 is not set on the socket.
613 Otherwise, it returns the timestamp of the
614 last packet that was received while
615 .B SO_TIMESTAMP
616 was not set, or it fails if no such packet has been received,
617 (i.e.,
618 .BR ioctl (2)
619 returns \-1 with
620 .I errno
621 set to
622 .BR ENOENT ).
623 .TP
624 .B SIOCSPGRP
625 Set the process or process group to send
626 .B SIGIO
627 or
628 .B SIGURG
629 signals
630 to when an
631 asynchronous I/O operation has finished or urgent data is available.
632 The argument is a pointer to a
633 .IR pid_t .
634 If the argument is positive, send the signals to that process.
635 If the
636 argument is negative, send the signals to the process group with the ID
637 of the absolute value of the argument.
638 The process may only choose itself or its own process group to receive
639 signals unless it has the
640 .B CAP_KILL
641 capability or an effective UID of 0.
642 .TP
643 .B FIOASYNC
644 Change the
645 .B O_ASYNC
646 flag to enable or disable asynchronous I/O mode of the socket.
647 Asynchronous I/O mode means that the
648 .B SIGIO
649 signal or the signal set with
650 .B F_SETSIG
651 is raised when a new I/O event occurs.
652 .IP
653 Argument is an integer boolean flag.
654 (This operation is synonymous with the use of
655 .BR fcntl (2)
656 to set the
657 .B O_ASYNC
658 flag.)
659 .\"
660 .TP
661 .B SIOCGPGRP
662 Get the current process or process group that receives
663 .B SIGIO
664 or
665 .B SIGURG
666 signals,
667 or 0
668 when none is set.
669 .PP
670 Valid
671 .BR fcntl (2)
672 operations:
673 .TP
674 .B FIOGETOWN
675 The same as the
676 .B SIOCGPGRP
677 .BR ioctl (2).
678 .TP
679 .B FIOSETOWN
680 The same as the
681 .B SIOCSPGRP
682 .BR ioctl (2).
683 .SH VERSIONS
684 .B SO_BINDTODEVICE
685 was introduced in Linux 2.0.30.
686 .B SO_PASSCRED
687 is new in Linux 2.2.
688 The
689 .I /proc
690 interfaces was introduced in Linux 2.2.
691 .B SO_RCVTIMEO
692 and
693 .B SO_SNDTIMEO
694 are supported since Linux 2.3.41.
695 Earlier, timeouts were fixed to
696 a protocol-specific setting, and could not be read or written.
697 .SH NOTES
698 Linux assumes that half of the send/receive buffer is used for internal
699 kernel structures; thus the values in the corresponding
700 .I /proc
701 files are twice what can be observed on the wire.
702
703 Linux will only allow port reuse with the
704 .B SO_REUSEADDR
705 option
706 when this option was set both in the previous program that performed a
707 .BR bind (2)
708 to the port and in the program that wants to reuse the port.
709 This differs from some implementations (e.g., FreeBSD)
710 where only the later program needs to set the
711 .B SO_REUSEADDR
712 option.
713 Typically this difference is invisible, since, for example, a server
714 program is designed to always set this option.
715 .SH BUGS
716 The
717 .B CONFIG_FILTER
718 socket options
719 .B SO_ATTACH_FILTER
720 and
721 .B SO_DETACH_FILTER
722 .\" FIXME Document SO_ATTACH_FILTER and SO_DETACH_FILTER
723 are not documented.
724 The suggested interface to use them is via the libpcap
725 library.
726 .\" .SH AUTHORS
727 .\" This man page was written by Andi Kleen.
728 .SH "SEE ALSO"
729 .BR getsockopt (2),
730 .BR setsockopt (2),
731 .BR socket (2),
732 .BR capabilities (7),
733 .BR ddp (7),
734 .BR ip (7),
735 .BR packet (7),
736 .BR tcp (7),
737 .BR udp (7),
738 .BR unix (7)