OSDN Git Service

のひな 饒平名 姓 # pref3「よへな」では済
[o-dic/o-dic.git] / script / geta_checker.sh
1 #!/bin/sh
2 #
3 # 辞書ファイル内の JIS X 0208 に含まれていない文字を検出するためのスクリプト
4 #                                                       山城 潤
5 #   $ ./geta_checker.sh
6 #       ...UTF-8で差分を出力...
7 #
8 # このスクリプトの実行にはnkf(1)が必要です。
9 # https://sourceforge.jp/projects/nkf/
10
11 script_dir=`dirname $0`
12 for i in $script_dir/../*.dic
13 do
14     to_file=`mktemp /tmp/geta.XXXXXXX`
15     utf8_file=`mktemp /tmp/geta.XXXXXXX`
16
17     # UTF-8 -> Shift_JIS -> UTF-8_2
18     nkf -s "$i" > "$to_file"
19     nkf -u "$to_file" > "$utf8_file"
20
21     # UTF-8 と UTF-8_2 の差分を取って〓の位置を確認する。
22     if ! diff -u "$i" "$utf8_file"; then
23         echo "$i: Geta exists." 1>&2
24     fi
25
26     rm "$to_file"
27     rm "$utf8_file"
28 done
29