OSDN Git Service

(split) LDP: draft snapshot generated from latest ja.po files.
[linuxjm/LDP_man-pages.git] / draft / man7 / unicode.7
index 91e0f1b..3a9d90a 100644 (file)
 .\" 2001-05-11  Markus Kuhn <mgk25@cl.cam.ac.uk>
 .\"      Update
 .\"
-.\" Japanese Version Copyright (c) 1997 HANATAKA Shinya
-.\"         all rights reserved.
-.\" Translated Thu Jun  3 20:36:31 JST 1997
-.\"         by HANATAKA Shinya <hanataka@abyss.rim.or.jp>
-.\" Updated & Modified Sat Jun 23 07:30:09 JST 2001
-.\"         by Yuichi SATO <ysato@h4.dion.ne.jp>
+.\"*******************************************************************
 .\"
-.\"WORD:       
-.\"WORD:       diacritical mark        発音区別符号
-.\"WORD:       International Phonetic Alphabet         国際音声字母
-.\"WORD:       
+.\" This file was generated with po4a. Translate the source file.
 .\"
-.TH UNICODE 7 2001-05-11 "GNU" "Linux Programmer's Manual"
-.\"O .SH NAME
+.\"*******************************************************************
+.TH UNICODE 7 2001\-05\-11 GNU "Linux Programmer's Manual"
 .SH 名前
-.\"O Unicode \- Universal character set
 Unicode \- 汎用文字集合
-.\"O .SH DESCRIPTION
 .SH 説明
-.\"O The international standard
-.\"O .B ISO 10646
-.\"O defines the
-.\"O .BR "Universal Character Set (UCS)" .
-.\"O UCS contains all characters of all other character set standards.
-.\"O It also guarantees
-.\"O .BR "round-trip compatibility" ,
-.\"O i.e., conversion tables can be built such that no information is lost
-.\"O when a string is converted from any other encoding to UCS and back.
-国際規格
-.B ISO 10646
-は
-.B "汎用文字集合 (Universal Character Set (UCS))"
+国際規格 \fBISO 10646\fP は \fB汎用文字集合 (Universal Character Set (UCS))\fP
 を定義している。
 UCS は他規格の文字集合の文字を全て含んでいる。
 さらに、
-.B "双方向の互換性 (round-trip compatibility)"
-を保証する。
+\fB双方向の互換性 (round\-trip compatibility)\fP を保証する。
 例えば他の符号から UCS に変換しさらに元の符号に変換したとしても、
 何の情報も失なわれないように変換テーブルを作成することができる。
 
-.\"O UCS contains the characters required to represent practically all
-.\"O known languages.
-.\"O This includes not only the Latin, Greek, Cyrillic,
-.\"O Hebrew, Arabic, Armenian, and Georgian scripts, but also Chinese,
-.\"O Japanese and Korean Han ideographs as well as scripts such as
-.\"O Hiragana, Katakana, Hangul, Devanagari, Bengali, Gurmukhi, Gujarati,
-.\"O Oriya, Tamil, Telugu, Kannada, Malayalam, Thai, Lao, Khmer, Bopomofo,
-.\"O Tibetan, Runic, Ethiopic, Canadian Syllabics, Cherokee, Mongolian,
-.\"O Ogham, Myanmar, Sinhala, Thaana, Yi, and others.
 UCS は現実的に知られている全ての言語を表現するのに必要な文字を含んでいる。
 これにはラテン文字、ギリシャ文字、キリル文字、ヘブライ文字、アラビア文字、
 アルメニア文字、グルジア文字だけでなく、中国・日本・韓国で使われている漢字、
@@ -87,152 +55,46 @@ UCS は現実的に知られている全ての言語を表現するのに必要
 チェロキー文字、モンゴル文字、
 オガム文字、ミャンマー文字、シンハラ文字、
 ターナ文字、イ (彝) 文字などが含まれる。
-.\"O For scripts not yet
-.\"O covered, research on how to best encode them for computer usage is
-.\"O still going on and they will be added eventually.
-.\"O This might
-.\"O eventually include not only Hieroglyphs and various historic
-.\"O Indo-European languages, but even some selected artistic scripts such
-.\"O as Tengwar, Cirth, and Klingon.
 まだカバーされていない文字に付いても、
 コンピュータで使用するために
 どのようなエンコードがもっとも良いかという研究が進められており、
 最終的には追加されるだろう。
 ヒエログリフや歴史的ないろいろなインド=ヨーロッパ言語だけでなく、
 テングワール文字、キアス文字、クリンゴン文字などの人工的な言語も選ばれている。
-.\"O UCS also covers a large number of
-.\"O graphical, typographical, mathematical and scientific symbols,
-.\"O including those provided by TeX, Postscript, APL, MS-DOS, MS-Windows,
-.\"O Macintosh, OCR fonts, as well as many word processing and publishing
-.\"O systems, and more are being added.
-UCS は、これらの文字に加えて、TeX, PostScript, APL, MS-DOS, MS-Windows,
+UCS は、これらの文字に加えて、TeX, PostScript, APL, MS\-DOS, MS\-Windows,
 Macintosh, OCR フォント、数多くのワードプロセッサーや
 出版システム、などが提供する
 図形記号・印字記号・数学記号・科学記号などの多くを含むようになった。
 
-.\"O The UCS standard (ISO 10646) describes a
-.\"O .I "31-bit character set architecture"
-.\"O consisting of 128 24-bit
-.\"O .IR groups ,
-.\"O each divided into 256 16-bit
-.\"O .I planes
-.\"O made up of 256 8-bit
-.\"O .I rows
-.\"O with 256
-.\"O .I column
-.\"O positions, one for each character.
-UCS 規格 (ISO 10646) は
-.I "31ビットの文字集合アーキテクチャー"
-を記述しており、128 個の 24 ビット
-.IR 群 " (" group )
-から構成されている。
-各群は 256 個の 16 ビット
-.IR 面 " (" plane )
-に分割されており、各文字は 256 個の 8 ビット
-.IR 区 " (" row )
-の 256
-.IR 点 " (" column )
-の中に位置する。
-.\"O Part 1 of the standard
-.\"O .RB ( "ISO 10646-1" )
-.\"O defines the first 65534 code positions (0x0000 to 0xfffd), which form
-.\"O the
-.\"O .IR "Basic Multilingual Plane (BMP)" ,
-.\"O that is plane 0 in group 0.
-この規格の Part 1
-.RB ( "ISO 10646-1" )
-では、最初の 65534 個のコード位置 (0x0000 〜 0xfffd) を定義している。
-これは第 0 群の第 0 面である
-.IR "基本多言語面 (Basic Multilingual Plane (BMP))"
-を構成する。
-.\"O Part 2 of the standard
-.\"O .RB ( "ISO 10646-2" )
-.\"O adds characters to group 0 outside the BMP in several
-.\"O .I "supplementary planes"
-.\"O in the range 0x10000 to 0x10ffff.
-この規格の Part 2
-.RB ( "ISO 10646-2" )
-では、第 0 群の BMP の外部である
-0x10000 〜 0x10ffff の範囲にある
-.I "補助面"
-に文字を追加した。
-.\"O There are no plans to add characters
-.\"O beyond 0x10ffff to the standard, therefore of the entire code space,
-.\"O only a small fraction of group 0 will ever be actually used in the
-.\"O foreseeable future.
+UCS 規格 (ISO 10646) は \fI31ビットの文字集合アーキテクチャー\fP を記述しており、
+128 個の 24 ビット \fI群 (group)\fP から構成されている。
+各群は 256 個の 16 ビット \fI面 (plane)\fP に分割されており、
+各文字は 256 個の 8 ビット \fI区 (row)\fP の 256 \fI点 (column)\fP の中に位置する。
+この規格の Part 1 (\fBISO 10646\-1\fP) では、
+最初の 65534 個のコード位置 (0x0000 〜 0xfffd) を定義している。
+これは第 0 群の第 0 面である \fI基本多言語面 (Basic Multilingual Plane (BMP))\fP を構成する。
+この規格の Part 2 (\fBISO 10646\-2\fP) では、第 0 群の BMP の外部である
+0x10000 〜 0x10ffff の範囲にある \fI補助面 (supplementary planes)\fP に文字を追加した。
 この規格では 0x10ffff を越えた位置に文字を追加する予定はないので、
 予想できる将来においては、
 全コード空間のうちグループ 0 の一部分は実際には使われることはない。
-.\"O The BMP contains all characters found in the
-.\"O commonly used other character sets.
-.\"O The supplemental planes added by
-.\"O ISO 10646-2 cover only more exotic characters for special scientific,
-.\"O dictionary printing, publishing industry, higher-level protocol and
-.\"O enthusiast needs.
 BMP には他の文字集合で一般に使われる全ての文字が含まれている。
-ISO 10646-2 で追加された補助面は、
+ISO 10646\-2 で追加された補助面は、
 特定の科学分野・辞書出版・印刷産業・高次プロトコル・
 何かのファンの間などで使われる特殊な文字だけをカバーする。
 .PP
-.\"O The representation of each UCS character as a 2-byte word is referred
-.\"O to as the
-.\"O .B UCS-2
-.\"O form (only for BMP characters), whereas
-.\"O .B UCS-4
-.\"O is the representation of each character by a 4-byte word.
-UCS 文字を 2 バイトのワードで表現するのが
-.B UCS-2
-形式である (BMP 文字のみ)。
-また、
-.B UCS-4
-では文字を 4 バイトのワードで表現する。
-.\"O In addition, there exist two encoding forms
-.\"O .B UTF-8
-.\"O for backward compatibility with ASCII processing software and
-.\"O .B UTF-16
-.\"O for the backward compatible handling of non-BMP characters up to
-.\"O 0x10ffff by UCS-2 software.
+UCS 文字を 2 バイトのワードで表現するのが \fBUCS\-2\fP 形式である (BMP 文字のみ)。
+また、\fBUCS\-4\fP では文字を 4 バイトのワードで表現する。
 さらに、ASCII を処理するソフトウェアへの下位互換のために
-.B UTF-8
-エンコード形式がある。
-また、0x10ffff までの非 BMP 文字を扱う
-UCS-2 対応ソフトウェアとの互換のために
-.B UTF-16
-エンコード形式がある。
+\fBUTF\-8\fP エンコード形式がある。
+また、0x10ffff までの非 BMP 文字を扱う UCS\-2 対応ソフトウェアとの互換のために
+\fBUTF\-16\fP エンコード形式がある。
 .PP
-.\"O The UCS characters 0x0000 to 0x007f are identical to those of the
-.\"O classic
-.\"O .B US-ASCII
-.\"O character set and the characters in the range 0x0000 to 0x00ff
-.\"O are identical to those in
-.\"O .BR "ISO 8859-1 Latin-1" .
-UCS 文字集合の 0x0000 から 0x007f は、古典的な
-.B US-ASCII
-文字集合の文字と同じである。
-また 0x0000 から 0x00ff の範囲では、
-.B ISO 8859-1 Latin-1
-文字集合の文字と同じである。
-.\"O .SS Combining Characters
+UCS 文字集合の 0x0000 から 0x007f は、古典的な \fBUS\-ASCII\fP 文字集合の文字と同じである。
+また 0x0000 から 0x00ff の範囲では、\fBISO 8859\-1 Latin\-1\fP 文字集合の文字と同じである。
 .SS "合成文字 (Combining Characters)"
-.\"O Some code points in
-.\"O .B UCS
-.\"O have been assigned to
-.\"O .IR "combining characters" .
-.\"O These are similar to the nonspacing accent keys on a typewriter.
-.\"O A combining character just adds an accent to the previous character.
-.\"O The most important accented characters have codes of their own in UCS,
-.\"O however, the combining character mechanism allows us to add accents
-.\"O and other diacritical marks to any character.
-.\"O The combining characters
-.\"O always follow the character which they modify.
-.\"O For example, the German
-.\"O character Umlaut-A ("Latin capital letter A with diaeresis") can
-.\"O either be represented by the precomposed UCS code 0x00c4, or
-.\"O alternatively as the combination of a normal "Latin capital letter A"
-.\"O followed by a "combining diaeresis": 0x0041 0x0308.
-.B UCS
-のいくつかのコード・ポイントは
-.I "合成文字 (combining characters)"
+\fBUCS\fP のいくつかのコード・ポイントは
+\fI合成文字 (combining characters)\fP
 に割り当てられている。
 これらはタイプライターの移動しないアクセント・キーに似ている。
 合成文字は直前の文字にアクセントのみを加える。
@@ -245,182 +107,62 @@ UCS に前もって準備されたコード 0x00c4 でも、
 "combining diaeresis (合成分音記号)" を続けた組合せ
 (0x0041 0x0308) のどちらでも表現することができる。
 .PP
-.\"O Combining characters are essential for instance for encoding the Thai
-.\"O script or for mathematical typesetting and users of the International
-.\"O Phonetic Alphabet.
 合成文字は、タイ文字や数学植字のエンコード・
 国際音声字母を使うユーザーなどには必須である。
-.\"O .SS Implementation Levels
 .SS 実装レベル
-.\"O As not all systems are expected to support advanced mechanisms like
-.\"O combining characters, ISO 10646-1 specifies the following three
-.\"O .I implementation levels
-.\"O of UCS:
 全てのシステムに合成文字のような進んだサポートを期待しているわけではない。
-ISO 10646-1 は以下の三段階の UCS の実装レベルを指定している。
-.TP 0.9i
+ISO 10646\-1 は以下の三段階の UCS の \fI実装レベル\fP を指定している。
+.TP  0.9i
 Level 1
-.\"O Combining characters and
-.\"O .B Hangul Jamo
-.\"O (a variant encoding of the Korean script, where a Hangul syllable
-.\"O glyph is coded as a triplet or pair of vovel/consonant codes) are not
-.\"O supported.
-合成文字と
-.B ハングル・ジャモ文字
-(いろいろな韓国・朝鮮文字の符号化。
+合成文字と \fBハングル・ジャモ文字\fP (いろいろな韓国・朝鮮文字の符号化。
 この符号化では、ハングル音節のグリフが
 3 つまたは 2 つの母音・子音コードの組み合わせで符号化される) はサポートしない。
-.TP
+.TP 
 Level 2
-.\"O In addition to level 1, combining characters are now allowed for some
-.\"O languages where they are essential (e.g., Thai, Lao, Hebrew,
-.\"O Arabic, Devanagari, Malayalam, etc.).
 Level 1 と同様だが、合成文字を必須とする言語のための文字
 (例えば、タイ文字・ラオス文字・ヘブライ文字・アラビア文字・
 デーヴァナーガリー文字・マレヤーラム文字など) は使える。
-.TP
+.TP 
 Level 3
-.\"O All
-.\"O .B UCS
-.\"O characters are supported.
-全ての
-.B UCS
-文字をサポートする。
+全ての \fBUCS\fP 文字をサポートする。
 .PP
-.\"O The
-.\"O .B Unicode 3.0 Standard
-.\"O published by the
-.\"O .B Unicode Consortium
-.\"O contains exactly the
-.\"O .B UCS Basic Multilingual Plane
-.\"O at implementation level 3, as described in ISO 10646-1:2000.
-.B ユニコード・コンソーシアム (Unicode Consortium)
-から発行された
-.B Unicode 3.0 Standard
-は、ISO 10646-1:2000 に記述された
-.B UCS Basic Multilingual Plane
+\fBユニコード・コンソーシアム (Unicode Consortium)\fP から発行された \fBUnicode 3.0 Standard\fP
+は、ISO 10646\-1:2000 に記述された \fBUCS Basic Multilingual Plane\fP
 の level 3 実装と全く同じである。
-.\"O .B Unicode 3.1
-.\"O added the supplemental planes of ISO 10646-2.
-.\"O The Unicode standard and
-.\"O technical reports published by the Unicode Consortium provide much
-.\"O additional information on the semantics and recommended usages of
-.\"O various characters.
-.\"O They provide guidelines and algorithms for
-.\"O editing, sorting, comparing, normalizing, converting and displaying
-.\"O Unicode strings.
-.B Unicode 3.1
-では ISO 10646-2 の補助面が追加されている。
+\fBUnicode 3.1\fP では ISO 10646\-2 の補助面が追加されている。
 Unicode Consortium から発行される Unicode 規格と技術レポートにより、
 いろいろな文字の意味と推奨される使用法についての更なる情報が得られる。
 これらの規格書や技術レポートで、Unicode 文字列を
 編集・並べ替え・比較・正規化・変換・表示するための
 ガイドラインとアルゴリズムが分かる。
-.\"O .SS Unicode Under Linux
 .SS "Linux における Unicode"
-.\"O Under GNU/Linux, the C type
-.\"O .B wchar_t
-.\"O is a signed 32-bit integer type.
-.\"O Its values are always interpreted
-.\"O by the C library as
-.\"O .B UCS
-.\"O code values (in all locales), a convention that is signaled by the GNU
-.\"O C library to applications by defining the constant
-.\"O .B __STDC_ISO_10646__
-.\"O as specified in the ISO C99 standard.
-GNU/Linux では、C 言語の型
-.B wchar_t
-は符号付き 32 ビット整数型である。
+GNU/Linux では、C 言語の型 \fBwchar_t\fP は符号付き 32 ビット整数型である。
 その値は C ライブラリにより (すべてのロケールにおいて) 常に
-.B UCS
-コードの値として解釈される。
+\fBUCS\fP コードの値として解釈される。
 これを GNU C ライブラリがアプリケーションに知らせるための規約として、
-定数
-.B __STDC_ISO_10646__
-を定義する。
+定数 \fB__STDC_ISO_10646__\fP を定義する。
 これは ISO C99 規格で指定されている。
 
-.\"O UCS/Unicode can be used just like ASCII in input/output streams,
-.\"O terminal communication, plaintext files, filenames, and environment
-.\"O variables in the ASCII compatible
-.\"O .B UTF-8
-.\"O multibyte encoding.
-.\"O To signal the use of UTF-8 as the character
-.\"O encoding to all applications, a suitable
-.\"O .I locale
-.\"O has to be selected via environment variables (e.g.,
-.\"O "LANG=en_GB.UTF-8").
-ASCII 互換の
-.B UTF-8
-マルチバイトエンコードでは、入出力ストリーム・端末通信・
+ASCII 互換の \fBUTF\-8\fP マルチバイトエンコードでは、入出力ストリーム・端末通信・
 プレーンテキストファイル・ファイル名・環境変数において、
 UCS/Unicode を ASCII のように使うことができる。
-UTF-8 を文字エンコードとして使うことを
+UTF\-8 を文字エンコードとして使うことを
 全てのアプリケーションに知らせるためには、
-("LANG=en_GB.UTF-8" のように) 環境変数を使って適切な
-.I ロケール (locale)
-を選択しなければならない。
+("LANG=en_GB.UTF\-8" のように) 環境変数を使って適切な
+\fIロケール (locale)\fP を選択しなければならない。
 .PP
-.\"O The
-.\"O .B nl_langinfo(CODESET)
-.\"O function returns the name of the selected encoding.
-.\"O Library functions such as
-.\"O .BR wctomb (3)
-.\"O and
-.\"O .BR mbsrtowcs (3)
-.\"O can be used to transform the internal
-.\"O .I wchar_t
-.\"O characters and strings into the system character encoding and back
-.\"O and
-.\"O .BR wcwidth (3)
-.\"O tells, how many positions (0\(en2) the cursor is advanced by the
-.\"O output of a character.
-.B nl_langinfo(CODESET)
-関数は選択されたエンコードの名前を返す。
-内部的な
-.I wchar_t
-文字や文字列をシステム文字列エンコードに変換 (逆変換) するのに使われる
-.BR wctomb (3)
-や
-.BR mbsrtowcs (3)、
-さらには
-.BR wcwidth (3)
-といったライブラリ関数は、
+\fBnl_langinfo(CODESET)\fP 関数は選択されたエンコードの名前を返す。
+内部的な \fIwchar_t\fP 文字や文字列をシステム文字列エンコードに変換 (逆変換) するのに使われる
+\fBwctomb\fP(3) や \fBmbsrtowcs\fP(3)、さらには \fBwcwidth\fP(3) といったライブラリ関数は、
 文字出力でどれだけカーソルが進んだか (0\(en2) を返す。
 .PP
-.\"O Under Linux, in general only the BMP at implementation level 1 should
-.\"O be used at the moment.
-.\"O Up to two combining characters per base
-.\"O character for certain scripts (in particular Thai) are also supported
-.\"O by some UTF-8 terminal emulators and ISO 10646 fonts (level 2), but in
-.\"O general precomposed characters should be preferred where available
-.\"O (Unicode calls this
-.\"O .BR "Normalization Form C" ).
-一般的に言うと、Linux では現在のところ
-BMP の level 1 実装のみを使うべきである。
-ある言語の文字 (とくにタイ文字) では、
-ベース文字当たり 2 つまでの合成文字を使うことが
-UTF-8 端末エミュレータと ISO 10646 フォント (level 2) でサポートされている。
+一般的に言うと、Linux では現在のところ BMP の level 1 実装のみを使うべきである。
+ある言語の文字 (とくにタイ文字) では、ベース文字当たり 2 つまでの合成文字を使うことが
+UTF\-8 端末エミュレータと ISO 10646 フォント (level 2) でサポートされている。
 しかし一般的に言えば、もし可能ならばあらかじめ合成した文字を使うべきである
-(Unicode では、これを
-.B "Normalization Form C (合成文字の正規化形式)"
-という)。
-.\"O .SS Private Area
+(Unicode では、これを \fBNormalization Form C (合成文字の正規化形式)\fP という)。
 .SS プライベート・エリア
-.\"O In the
-.\"O .BR BMP ,
-.\"O the range 0xe000 to 0xf8ff will never be assigned to any characters by
-.\"O the standard and is reserved for private usage.
-.\"O For the Linux
-.\"O community, this private area has been subdivided further into the
-.\"O range 0xe000 to 0xefff which can be used individually by any end-user
-.\"O and the Linux zone in the range 0xf000 to 0xf8ff where extensions are
-.\"O coordinated among all Linux users.
-.\"O The registry of the characters
-.\"O assigned to the Linux zone is currently maintained by H. Peter Anvin
-.\"O <Peter.Anvin@linux.org>.
-.B BMP
-の 0xe000 〜 0xf8ff の範囲は、規格ではいかなる文字も割り当てず、
+\fBBMP\fP の 0xe000 〜 0xf8ff の範囲は、規格ではいかなる文字も割り当てず、
 私的な使用のために予約されている。
 Linux コミュニティでは、
 このプライベート・エリアをさらに細かく分割して使用する。
@@ -429,112 +171,66 @@ Linux コミュニティでは、
 全ての Linux ユーザーで共通に使用する。
 Linux Zone への文字割り当ての登録は、
 現在 H. Peter Anvin <Peter.Anvin@linux.org> によって管理されている。
-.\"O .SS Literature
 .SS 文献
-.TP 0.2i
+.TP  0.2i
 *
-Information technology \(em Universal Multiple-Octet Coded Character
-Set (UCS) \(em Part 1: Architecture and Basic Multilingual Plane.
-International Standard ISO/IEC 10646-1, International Organization
-for Standardization, Geneva, 2000.
+Information technology \(em Universal Multiple\-Octet Coded Character Set
+(UCS) \(em Part 1: Architecture and Basic Multilingual Plane.  International
+Standard ISO/IEC 10646\-1, International Organization for Standardization,
+Geneva, 2000.
 
-.\"O This is the official specification of
-.\"O .BR UCS .
-.\"O Available as a PDF file on CD-ROM from http://www.iso.ch/.
-これは
-.B UCS
-の公式な仕様である。
-http://www.iso.ch/ から注文できる CD-ROM で PDF ファイルとして入手できる。
-.TP
+これは \fBUCS\fP の公式な仕様である。
+http://www.iso.ch/ から注文できる CD\-ROM で PDF ファイルとして入手できる。
+.TP 
 *
-The Unicode Standard, Version 3.0.
-The Unicode Consortium, Addison-Wesley,
-Reading, MA, 2000, ISBN 0-201-61633-5.
-.TP
+The Unicode Standard, Version 3.0.  The Unicode Consortium, Addison\-Wesley,
+Reading, MA, 2000, ISBN 0\-201\-61633\-5.
+.TP 
 *
-S. Harbison, G. Steele. C: A Reference Manual. Fourth edition,
-Prentice Hall, Englewood Cliffs, 1995, ISBN 0-13-326224-3.
+S. Harbison, G. Steele. C: A Reference Manual. Fourth edition, Prentice
+Hall, Englewood Cliffs, 1995, ISBN 0\-13\-326224\-3.
 
-.\"O A good reference book about the C programming language.
-.\"O The fourth
-.\"O edition covers the 1994 Amendment 1 to the ISO C90 standard, which
-.\"O adds a large number of new C library functions for handling wide and
-.\"O multibyte character encodings, but it does not yet cover ISO C99,
-.\"O which improved wide and multibyte character support even further.
 C プログラム言語についてのとても良い参考書である。
 第四版では、ワイド文字やマルチバイト文字エンコードを扱うための
 多くの新しい C ライブラリ関数が
 加えられた ISO C90 規格の 1994 Amendment 1 をカバーしている。
 しかし、ワイド文字やマルチバイト文字のサポートを
 更に改善した ISO C99 は、まだカバーしていない。
-.TP
+.TP 
 *
-.\"O Unicode Technical Reports.
 Unicode 技術レポート。
 .RS
 http://www.unicode.org/unicode/reports/
 .RE
-.TP
+.TP 
 *
-.\"O Markus Kuhn: UTF-8 and Unicode FAQ for UNIX/Linux.
-Markus Kuhn: UNIX/Linux のための UTF-8 と Unicode の FAQ。
+Markus Kuhn: UNIX/Linux のための UTF\-8 と Unicode の FAQ。
 .RS
 http://www.cl.cam.ac.uk/~mgk25/unicode.html
 
-.\"O Provides subscription information for the
-.\"O .I linux-utf8
-.\"O mailing list, which is the best place to look for advice on using
-.\"O Unicode under Linux.
-.I linux-utf8
-メーリングリストを購読するための情報がある。
+\fIlinux\-utf8\fP メーリングリストを購読するための情報がある。
 Linux で Unicode を使う場合のアドバイスを探すのに一番良い場所である。
 .RE
-.TP
+.TP 
 *
 Bruno Haible: Unicode HOWTO.
 .RS
-ftp://ftp.ilog.fr/pub/Users/haible/utf8/Unicode-HOWTO.html
+ftp://ftp.ilog.fr/pub/Users/haible/utf8/Unicode\-HOWTO.html
 .RE
-.\"O .SH BUGS
 .SH バグ
-.\"O When this man page was last revised, the GNU C Library support for
-.\"O .B UTF-8
-.\"O locales was mature and XFree86 support was in an advanced state, but
-.\"O work on making applications (most notably editors) suitable for use in
-.\"O .B UTF-8
-.\"O locales was still fully in progress.
-このマニュアル・ページを最後に改訂した時点で、
-GNU C ライブラリの
-.B UTF-8
-サポートは完成している。
+.\" .SH AUTHOR
+.\" Markus Kuhn <mgk25@cl.cam.ac.uk>
+このマニュアルページを最後に改訂した時点で、
+GNU C ライブラリの \fBUTF\-8\fP サポートは完成している。
 XFree86 によるサポートは進行中である。
-.B UTF-8
-ロケールで快適に使えるアプリケーション
+\fBUTF\-8\fP ロケールで快適に使えるアプリケーション
 (多くの有名なエディタ) の作成は、まだ進行中である。
-.\"O Current general
-.\"O .B UCS
-.\"O support under Linux usually provides for CJK double-width characters
-.\"O and sometimes even simple overstriking combining characters, but
-.\"O usually does not include support for scripts with right-to-left
-.\"O writing direction or ligature substitution requirements such as
-.\"O Hebrew, Arabic, or the Indic scripts.
-Linux での
-.B UCS
-サポートでは通常 CJK の 2 ワイド文字が提供される。
+Linux での \fBUCS\fP サポートでは通常 CJK の 2 ワイド文字が提供される。
 単純な重ね打ちによる合成文字が提供される場合もある。
 しかし、右から左へ書く文字やヘブライ文字・アラビア文字・インド語系文字などの
 合字の置き換えを必要とする文字はサポートされていない。
-.\"O These scripts are currently only
-.\"O supported in certain GUI applications (HTML viewers, word processors)
-.\"O with sophisticated text rendering engines.
 現在、これらの文字は洗練されたテキスト描画エンジンを備えた
 GUI アプリケーション (HTML ビューア・ワードプロセッサ) でのみ
 サポートされている。
-.\"O .\" .SH AUTHOR
-.\" .SH 著者
-.\" Markus Kuhn <mgk25@cl.cam.ac.uk>
-.\"O .SH SEE ALSO
 .SH 関連項目
-.BR setlocale (3),
-.BR charsets (7),
-.BR utf-8 (7)
+\fBsetlocale\fP(3), \fBcharsets\fP(7), \fButf\-8\fP(7)