OSDN Git Service

LDP: Update original to LDP v3.68
[linuxjm/LDP_man-pages.git] / original / man7 / charsets.7
index 5e039e1..4d5fe3a 100644 (file)
 .\" research by esr.  Portions derive from a writeup by Roman Czyborra.
 .\"
 .\" Last changed by David Starner <dstarner98@aasaa.ofe.org>.
-.TH CHARSETS 7 2012-08-05 "Linux" "Linux Programmer's Manual"
+.\"
+.\" FIXME This page was written long ago, and various pieces are probably
+.\"    no longer quite current. A reworking by someone knowledgeable
+.\"    on charsets is needed. Among other things, the page needs to
+.\"    give more prominence to Unicode. mtk, May 2014
+.\"
+.TH CHARSETS 7 2014-05-28 "Linux" "Linux Programmer's Manual"
 .SH NAME
 charsets \- programmer's view of character sets and internationalization
 .SH DESCRIPTION
@@ -31,12 +37,6 @@ ISO 4873.
 The primary emphasis is on character sets actually used as
 locale character sets, not the myriad others that can be found in data
 from other systems.
-.LP
-A complete list of charsets used in an officially supported locale in glibc
-2.2.3 is: ISO-8859-{1,2,3,5,6,7,8,9,13,15}, CP1251, UTF-8, EUC-{KR,JP,TW},
-KOI8-{R,U}, GB2312, GB18030, GBK, BIG5, BIG5-HKSCS and TIS-620 (in no
-particular order.)
-(Romanian may be switching to ISO-8859-16.)
 .SS ASCII
 ASCII (American Standard Code For Information Interchange) is the original
 7-bit character set, originally designed for American English.
@@ -83,7 +83,7 @@ The lack of the ligatures Dutch ij, French oe and old-style
 .TP
 8859-2 (Latin-2)
 Latin-2 supports most Latin-written Slavic and Central European
-languages: Croatian, Czech, German, Hungarian, Polish, Rumanian,
+languages: Croatian, Czech, German, Hungarian, Polish, Romanian,
 Slovak, and Slovene.
 .TP
 8859-3 (Latin-3)
@@ -155,7 +155,7 @@ Latin-1.
 .TP
 8859-16 (Latin-10)
 This set covers many of the languages covered by 8859-2, and supports
-Romanian more completely then that set does.
+Romanian more completely than that set does.
 .SS KOI8-R
 KOI8-R is a non-ISO character set popular in Russia.
 The lower half
@@ -365,10 +365,11 @@ are equivalent to ESC \- xx, ESC . xx, ESC / xx, respectively.
 .BR unicode (7),
 .BR utf-8 (7)
 .SH COLOPHON
-This page is part of release 3.65 of the Linux
+This page is part of release 3.68 of the Linux
 .I man-pages
 project.
 A description of the project,
-and information about reporting bugs,
+information about reporting bugs,
+and the latest version of this page,
 can be found at
 \%http://www.kernel.org/doc/man\-pages/.