.\" Copyright (c) 1996 Eric S. Raymond <esr@thyrsus.com>
.\" and Andries Brouwer <aeb@cwi.nl>
.\"
+.\" %%%LICENSE_START(GPLv2+_DOC_ONEPARA)
.\" This is free documentation; you can redistribute it and/or
.\" modify it under the terms of the GNU General Public License as
.\" published by the Free Software Foundation; either version 2 of
.\" the License, or (at your option) any later version.
+.\" %%%LICENSE_END
.\"
.\" This is combined from many sources, including notes by aeb and
.\" research by esr. Portions derive from a writeup by Roman Czyborra.
.\" This file was generated with po4a. Translate the source file.
.\"
.\"*******************************************************************
-.TH CHARSETS 7 2008\-06\-03 Linux "Linux Programmer's Manual"
+.TH CHARSETS 7 2012\-08\-05 Linux "Linux Programmer's Manual"
.SH 名前
charsets \- プログラマの視点から見た文字セットと国際化
.SH 説明
16 ビット整数の列 (UTF\-16)(ある種の珍しい文字をエンコードする場合にだけ
2 つの 16 ビット整数が必要となる)か、
8 ビットバイトの列 (UTF\-8)として扱われる。
-Unicode についての情報は、<http://www.unicode.org> から得られる。
+Unicode についての情報は、
+.UR http://www.unicode.org
+.UE
+から得られる。
.LP
Linux は 8\-bit Unicode Transformation Form(UTF\-8) を用いて Unicode を
あらわす。 UTF\-8 は Unicode の可変長表現である。UTF\-8 は 7 ビットを
ISO\-8859\-1 文字セットを使うほとんどのユーザにとって、
この事実は、ASCII の範囲外を使った文字は
二つのバイトに符号化されるということを意味する。このことから
-(UTF\-8 を使うと、ISO\-8859\-1を使用している)元々のテキストファイルのサイズから
-1 〜 2 パーセント大きくなってしまうことになる。
+(UTF\-8 を使うと、ISO\-8859\-1を使用している)元々のテキストファイルの
+サイズから 1 〜 2 パーセント大きくなってしまうことになる。
ロシア語やギリシャ語を利用するユーザーにとっては、
これによって元のテキストは 2 倍の大きさになることになる。
なぜならこれらの言語はほとんどが ASCII の範囲外だからである。
.SH 関連項目
\fBconsole\fP(4), \fBconsole_codes\fP(4), \fBconsole_ioctl\fP(4), \fBascii\fP(7),
\fBiso_8859\-1\fP(7), \fBunicode\fP(7), \fButf\-8\fP(7)
+.SH この文書について
+この man ページは Linux \fIman\-pages\fP プロジェクトのリリース 3.50 の一部
+である。プロジェクトの説明とバグ報告に関する情報は
+http://www.kernel.org/doc/man\-pages/ に書かれている。