From: Takuya Nishimoto Date: Sat, 4 May 2013 12:53:41 +0000 (+0900) Subject: added mecab dictionary items and tests using dict object. coordinated with nvdajp... X-Git-Tag: release-2013.1jp-130519~6 X-Git-Url: http://git.osdn.net/view?p=nvdajp%2Fnvdajpmiscdep.git;a=commitdiff_plain;h=76eb6281eaf4e5d0bfdcb1d165efe59a8e55fc9e added mecab dictionary items and tests using dict object. coordinated with nvdajp:source/jptools/harness.py --- diff --git a/include/jtalk/custom_dic_maker.py b/include/jtalk/custom_dic_maker.py index 12ca378..ff4ab72 100644 --- a/include/jtalk/custom_dic_maker.py +++ b/include/jtalk/custom_dic_maker.py @@ -12,242 +12,246 @@ from os import path from alpha2mb import alpha2mb jdic = [ - # first item should use fullshape(zenkaku) charactors - ['読み込み中', 'ヨミコミチュー', "2/6"], - #['一行', 'イチギョー', "2/4"], - #['1行', 'イチギョー', "2/4"], - #['1行下', 'イチギョーシタ', "2/6"], - #['1行上', 'イチギョーウエ', "2/6"], - #['2行', 'ニギョー', "1/3"], - #['3行', 'サンギョー', "1/4"], - ['行', 'ギョー', "1/2", 1000, "名詞,接尾,助数詞,*,*,*"], - ['行上', 'ギョーウエ', "1/4", 1000, "名詞,接尾,助数詞,*,*,*"], - ['行下', 'ギョーシタ', "1/4", 1000, "名詞,接尾,助数詞,*,*,*"], - ['50音順', 'ゴジューオンジュン', "0/7", None, None, '50オンジュン'], - ['空行', 'クーギョー', "0/4"], - ['行末', 'ギョーマツ', "0/4"], - ['複数行', 'フクスーギョー', "3/6"], - ['現在行', 'ゲンザイギョー', "3/6"], - ['最上行', 'サイジョーギョー', "3/6"], - ['行操作', 'ギョーソーサ', "1/5"], - ['誤判定', 'ゴハンテイ', "2/5"], - ['表計算', 'ヒョーケイサン', "3/5"], - ['空要素', 'カラヨーソ', "3/5"], - ['拡張子', 'カクチョーシ', "3/5"], - ['親オブジェクト', 'オヤオブジェクト', "3/7"], - ['小文字', 'コモジ', "0/3"], - ['大文字', 'オーモジ', "0/4"], - ['ニコ生', 'ニコナマ', "0/4"], - ['スリーマイル島原発', 'スリーマイルトーゲンパツ'], + # first item should use fullshape(zenkaku) charactors + ['読み込み中', 'ヨミコミチュー', "2/6"], + #['一行', 'イチギョー', "2/4"], + #['1行', 'イチギョー', "2/4"], + #['1行下', 'イチギョーシタ', "2/6"], + #['1行上', 'イチギョーウエ', "2/6"], + #['2行', 'ニギョー', "1/3"], + #['3行', 'サンギョー', "1/4"], + ['行', 'ギョー', "1/2", 1000, "名詞,接尾,助数詞,*,*,*"], + ['行上', 'ギョーウエ', "1/4", 1000, "名詞,接尾,助数詞,*,*,*"], + ['行下', 'ギョーシタ', "1/4", 1000, "名詞,接尾,助数詞,*,*,*"], + ['50音順', 'ゴジューオンジュン', "0/7", None, None, '50オンジュン'], + ['空行', 'クーギョー', "0/4"], + ['行末', 'ギョーマツ', "0/4"], + ['複数行', 'フクスーギョー', "3/6"], + ['現在行', 'ゲンザイギョー', "3/6"], + ['最上行', 'サイジョーギョー', "3/6"], + ['行操作', 'ギョーソーサ', "1/5"], + ['誤判定', 'ゴハンテイ', "2/5"], + ['表計算', 'ヒョーケイサン', "3/5"], + ['空要素', 'カラヨーソ', "3/5"], + ['拡張子', 'カクチョーシ', "3/5"], + ['親オブジェクト', 'オヤオブジェクト', "3/7"], + ['小文字', 'コモジ', "0/3"], + ['大文字', 'オーモジ', "0/4"], + ['ニコ生', 'ニコナマ', "0/4"], + ['スリーマイル島原発', 'スリーマイルトーゲンパツ'], - ['孫正義', 'ソンマサヨシ', "4/6", None, None, 'ソン マサヨシ'], - ['池田信夫', 'イケダノブオ', "0/6"], - ['方々', 'カタガタ', "2/4"], - ['当分の間', 'トーブンノアイダ', "0/8"], - ['中通り', 'ナカドーリ', "3/5"], - ['中', 'チュー', "1/2", 5000], - ['中の人', 'ナカノヒト', "1/5"], - ['中程度', 'チューテード', "3/5"], - ['各基', 'カクキ', "1/3"], - ['高', 'コー', "1/2", 5000], - ['県立高', 'ケンリツコー', "0/6"], - ['業務', 'ギョーム', "1/3"], - ['値', 'アタイ', "0/3"], - ['24時間', 'ニジューヨジカン' "1/7"], - ['明朝', 'ミンチョー', "1/4"], - ['障がい', 'ショーガイ', "0/4"], - ['蓮舫', 'レンホー', "1/4"], - ['既読', 'キドク', "0/3"], - ['新家', 'シンケ', "1/3"], - ['大嘘', 'オーウソ', "0/4"], - ['1人', 'ヒトリ', "2/3"], - ['一人ひとり', 'ヒトリヒトリ', "0/6"], - ['日中', 'ニッチュー', "3/4"], - ['次', 'ツギ', "2/2", 5000], - ['他人事', 'タニンゴト', "0/5"], - ['セブン―イレブン', 'セブンイレブン', "5/7"], - ['東国原', 'ヒガシコクバル', "5/7"], - ['中越', 'チューエツ', "1/4"], - ['発災', 'ハッサイ', "0/4"], - ['その上', 'ソノウエ', "0/4"], - ['時期', 'ジキ', "1/2"], - ['扱い', 'アツカイ', "0/4"], - ['停波', 'テイハ', "0/3"], - ['建屋', 'タテヤ', "2/3"], - ['なう', 'ナウ', "1/2"], - ['被り', 'カブリ', "0/3"], - ['寺田寅彦', 'テラダトラヒコ', "0/7"], - ['橋下', 'ハシモト', "0/4"], - ['フレッツ光', 'フレッツヒカリ', "2/7"], - ['選択行', 'センタクギョー', "0/6"], - ['ベクレル', 'ベクレル', "1/4", 1000, "名詞,接尾,助数詞,*,*,*"], - ['三毛猫', 'ミケネコ', "0/4"], - ['数多く', 'カズオオク', "1/5"], - ['繁体字', 'ハンタイジ', "3/5"], - ['上矢印', 'ウエヤジルシ', "4/6"], - ['下矢印', 'シタヤジルシ', "4/6"], - ['大見出し', 'オオミダシ', "3/5"], - ['前景色', 'ゼンケイショク', "3/6"], - ['八ッ場', 'ヤンバ', "0/3"], - ['梅雨前線', 'バイウゼンセン', "4/7", None, None, 'バイウ ゼンセン'], - ['1都5県', 'イットゴケン'], - ['1都6県', 'イットロッケン'], - ['昔々', 'ムカシムカシ', "0/6", None, None, 'ムカシ ムカシ'], - ['材販', 'ザイハン', "0/4"], - ['盲ろう者', 'モーローシャ', "3/5"], - ['えき', 'エキ', "1/2"], - ['はは', 'ハハ', "1/2"], - ['万国旗', 'バンコクキ', "3/5"], - ['多角形', 'タカクケイ', "2/5"], - ['高脂血症', 'コーシケツショー', "0/7"], - ['買うた', 'コータ', "1/3"], - ['縫うた', 'ヌータ', "0/3"], - ['透徹る', 'スキトオル', "3/5"], - ['八日', 'ヨーカ', "0/3"], - ['何百', 'ナンビャク', "1/4"], - ['十日', 'トオカ', "0/3"], - ['ちゅうりっぷ', 'チューリップ', "1/5"], - ['きゃりーぱみゅぱみゅ', 'キャリーパミュパミュ', "4/7"], - ['1月', 'イチガツ', '2/4', None, None, '1ガツ'], - ['2月', 'ニガツ', '1/3', None, None, '2ガツ'], - ['3月', 'サンガツ', '1/4', None, None, '3ガツ'], - ['4月', 'シガツ', '1/3', None, None, '4ガツ'], - ['5月', 'ゴガツ', '1/3', None, None, '5ガツ'], - ['6月', 'ロクガツ', '2/4', None, None, '6ガツ'], - ['7月', 'シチガツ', '2/4', None, None, '7ガツ'], - ['8月', 'ハチガツ', '2/4', None, None, '8ガツ'], - ['9月', 'クガツ', '1/3', None, None, '9ガツ'], - ['10月', 'ジューガツ', '1/4', None, None, '10ガツ'], - ['11月', 'ジューイチガツ', '4/6', None, None, '11ガツ'], - ['12月', 'ジューニガツ', '3/5', None, None, '12ガツ'], - ['為おおせる', 'シオオセル', '4/5'], - ['砂利道', 'ジャリミチ', '2/4'], - ['少しずつ', 'スコシズツ', '4/5'], - ['まづ', 'マズ', '1/2'], - ['一つづつ', 'ヒトツズツ', '4/5'], - ['大きう', 'オオキュー', '1/4'], - ['うれしう', 'ウレシュー', '2/4'], - ['みづうみ', 'ミズウミ', '2/4'], - ['もみぢ', 'モミジ', '1/3'], - ['ヴァイオリン', 'バイオリン' , '0/5', None, None, 'ヴァイオリン'], - ['ヴィタミン', 'ビタミン', '1/4', None, None, 'ヴィタミン'], - ['ラヂオ', 'ラジオ', '1/3'], - ['ヂャケット', 'ジャケット', '1/4'], - ['ウヰスキー', 'ウイスキー', '1/5'], - ['スヰフト', 'スイフト', '1/4'], - ['ヱルテル', 'ウェルテル', '1/4'], - ['ヲルポール', 'ウォルポール', '1/5'], - ['ヘリコプタア', 'ヘリコプター', '1/6'], - ['ちゅうりっぷ', 'チューリップ', '1/5'], - ['おみやぁさん', 'オミャアサン', '2/5'], - ['先生ぇさまぁ', 'センセエサマア', '0/7'], - ['おとゥ', 'オトー', '2/3'], - ['ヂェスチャー', 'ジェスチャー', '1/3'], - ['ヒァーッ', 'ヒャーッ', '1/3'], - ['東井', 'トーイ', '1/3'], - ['みやこをどり', 'ミヤコオドリ', '4/6', None, None, 'ミヤコ オドリ'], - ['をりがみ', 'オリガミ', '2/4'], - ['キャレット', 'キャレット', '1/4'], - ['ヱビスビール', 'エビスビール', '4/6', None, None, 'エビス ビール'], - ['十数人', 'ジュースーニン', '3/6', None, None, '10スーニン'], - ['いらっしゃい', 'イラッシャイ', '2/5'], - ['ごめんください', 'ゴメンクダサイ', '0/7', None, None, 'ゴメン クダサイ'], - ['おはようございます', 'オハヨーゴザイマス', '0/9', None, None, 'オハヨー ゴザイマス'], - ['嘘みたい', 'ウソミタイ', '1/5'], - ['満遍', 'マンベン', '0/4'], - ['形なし', 'カタナシ', '0/4'], - ['わかりっこ', 'ワカリッコ', '3/5'], - ['言わしむれば', 'イワシムレバ', '4/6'], - ['一人', 'ヒトリ', '2/3'], - ['二人', 'フタリ', '0/3'], - ['於て', 'オイテ', '1/3'], - ['この期', 'コノゴ', '0/3'], - ['その節', 'ソノセツ', '3/4'], - ['二十日', 'ハツカ', '0/3'], - ['二十歳', 'ハタチ', '1/3'], - ['3泊4日', 'サンパクヨッカ', '1/7', None, None, '3パク ヨッカ'], - ['二百十日', 'ニヒャクトーカ', '0/6', None, None, '2ヒャク トオカ'], - ['一日', 'ツイタチ', '0/4'], - ['十日', 'トーカ', '0/3', 100, None, 'トオカ'], - ['十四日', 'ジューヨッカ', '1/5', None, None, '14カ'], - ['二十四日', 'ニジューヨッカ', '1/6', None, None, '24カ'], - ['三三七拍子', 'サンサンナナビョーシ', '0/9', None, None, '3⠼3⠼7ビョーシ'], - ['三十三間堂', 'サンジューサンゲンドー', '1/10', None, None, '33ゲンドー'], - ['フレンドシップ', 'フレンドシップ', '5/7'], - ['我等', 'ワレラ', '1/3'], - ['相たずさえる', 'アイタズサエル', '1/7'], - ['各方面', 'カクホーメン', '1/6', None, None, 'カク ホーメン'], - ['旧陸軍', 'キューリクグン', '1/6', None, None, 'キュー リクグン'], - ['山や川', 'ヤマヤカワ', '2/5', None, None, 'ヤマヤ カワ'], + ['孫正義', 'ソンマサヨシ', "4/6", None, None, 'ソン マサヨシ'], + ['池田信夫', 'イケダノブオ', "0/6"], + ['方々', 'カタガタ', "2/4"], + ['当分の間', 'トーブンノアイダ', "0/8"], + ['中通り', 'ナカドーリ', "3/5"], + ['中', 'チュー', "1/2", 5000], + ['中の人', 'ナカノヒト', "1/5"], + ['中程度', 'チューテード', "3/5"], + ['各基', 'カクキ', "1/3"], + ['高', 'コー', "1/2", 5000], + ['県立高', 'ケンリツコー', "0/6"], + ['業務', 'ギョーム', "1/3"], + ['値', 'アタイ', "0/3"], + ['24時間', 'ニジューヨジカン' "1/7"], + ['明朝', 'ミンチョー', "1/4"], + ['障がい', 'ショーガイ', "0/4"], + ['蓮舫', 'レンホー', "1/4"], + ['既読', 'キドク', "0/3"], + ['新家', 'シンケ', "1/3"], + ['大嘘', 'オーウソ', "0/4"], + ['1人', 'ヒトリ', "2/3"], + ['一人ひとり', 'ヒトリヒトリ', "0/6"], + ['日中', 'ニッチュー', "3/4"], + ['次', 'ツギ', "2/2", 5000], + ['他人事', 'タニンゴト', "0/5"], + ['セブン―イレブン', 'セブンイレブン', "5/7"], + ['東国原', 'ヒガシコクバル', "5/7"], + ['中越', 'チューエツ', "1/4"], + ['発災', 'ハッサイ', "0/4"], + ['その上', 'ソノウエ', "0/4"], + ['時期', 'ジキ', "1/2"], + ['扱い', 'アツカイ', "0/4"], + ['停波', 'テイハ', "0/3"], + ['建屋', 'タテヤ', "2/3"], + ['なう', 'ナウ', "1/2"], + ['被り', 'カブリ', "0/3"], + ['寺田寅彦', 'テラダトラヒコ', "0/7"], + ['橋下', 'ハシモト', "0/4"], + ['フレッツ光', 'フレッツヒカリ', "2/7"], + ['選択行', 'センタクギョー', "0/6"], + ['ベクレル', 'ベクレル', "1/4", 1000, "名詞,接尾,助数詞,*,*,*"], + ['三毛猫', 'ミケネコ', "0/4"], + ['数多く', 'カズオオク', "1/5"], + ['繁体字', 'ハンタイジ', "3/5"], + ['上矢印', 'ウエヤジルシ', "4/6"], + ['下矢印', 'シタヤジルシ', "4/6"], + ['大見出し', 'オオミダシ', "3/5"], + ['前景色', 'ゼンケイショク', "3/6"], + ['八ッ場', 'ヤンバ', "0/3"], + ['梅雨前線', 'バイウゼンセン', "4/7", None, None, 'バイウ ゼンセン'], + ['1都5県', 'イットゴケン'], + ['1都6県', 'イットロッケン'], + ['昔々', 'ムカシムカシ', "0/6", None, None, 'ムカシ ムカシ'], + ['材販', 'ザイハン', "0/4"], + ['盲ろう者', 'モーローシャ', "3/5"], + ['えき', 'エキ', "1/2"], + ['はは', 'ハハ', "1/2"], + ['万国旗', 'バンコクキ', "3/5"], + ['多角形', 'タカクケイ', "2/5"], + ['高脂血症', 'コーシケツショー', "0/7"], + ['買うた', 'コータ', "1/3"], + ['縫うた', 'ヌータ', "0/3"], + ['透徹る', 'スキトオル', "3/5"], + ['八日', 'ヨーカ', "0/3"], + ['何百', 'ナンビャク', "1/4"], + ['十日', 'トオカ', "0/3"], + ['ちゅうりっぷ', 'チューリップ', "1/5"], + ['きゃりーぱみゅぱみゅ', 'キャリーパミュパミュ', "4/7"], + ['1月', 'イチガツ', '2/4', None, None, '1ガツ'], + ['2月', 'ニガツ', '1/3', None, None, '2ガツ'], + ['3月', 'サンガツ', '1/4', None, None, '3ガツ'], + ['4月', 'シガツ', '1/3', None, None, '4ガツ'], + ['5月', 'ゴガツ', '1/3', None, None, '5ガツ'], + ['6月', 'ロクガツ', '2/4', None, None, '6ガツ'], + ['7月', 'シチガツ', '2/4', None, None, '7ガツ'], + ['8月', 'ハチガツ', '2/4', None, None, '8ガツ'], + ['9月', 'クガツ', '1/3', None, None, '9ガツ'], + ['10月', 'ジューガツ', '1/4', None, None, '10ガツ'], + ['11月', 'ジューイチガツ', '4/6', None, None, '11ガツ'], + ['12月', 'ジューニガツ', '3/5', None, None, '12ガツ'], + ['為おおせる', 'シオオセル', '4/5'], + ['砂利道', 'ジャリミチ', '2/4'], + ['少しずつ', 'スコシズツ', '4/5'], + ['まづ', 'マズ', '1/2'], + ['一つづつ', 'ヒトツズツ', '4/5'], + ['大きう', 'オオキュー', '1/4'], + ['うれしう', 'ウレシュー', '2/4'], + ['みづうみ', 'ミズウミ', '2/4'], + ['もみぢ', 'モミジ', '1/3'], + ['ヴァイオリン', 'バイオリン' , '0/5', None, None, 'ヴァイオリン'], + ['ヴィタミン', 'ビタミン', '1/4', None, None, 'ヴィタミン'], + ['ラヂオ', 'ラジオ', '1/3'], + ['ヂャケット', 'ジャケット', '1/4'], + ['ウヰスキー', 'ウイスキー', '1/5'], + ['スヰフト', 'スイフト', '1/4'], + ['ヱルテル', 'ウェルテル', '1/4'], + ['ヲルポール', 'ウォルポール', '1/5'], + ['ヘリコプタア', 'ヘリコプター', '1/6'], + ['ちゅうりっぷ', 'チューリップ', '1/5'], + ['おみやぁさん', 'オミャアサン', '2/5'], + ['先生ぇさまぁ', 'センセエサマア', '0/7'], + ['おとゥ', 'オトー', '2/3'], + ['ヂェスチャー', 'ジェスチャー', '1/3'], + ['ヒァーッ', 'ヒャーッ', '1/3'], + ['東井', 'トーイ', '1/3'], + ['みやこをどり', 'ミヤコオドリ', '4/6', None, None, 'ミヤコ オドリ'], + ['をりがみ', 'オリガミ', '2/4'], + ['キャレット', 'キャレット', '1/4'], + ['ヱビスビール', 'エビスビール', '4/6', None, None, 'エビス ビール'], + ['十数人', 'ジュースーニン', '3/6', None, None, '10スーニン'], + ['いらっしゃい', 'イラッシャイ', '2/5'], + ['ごめんください', 'ゴメンクダサイ', '0/7', None, None, 'ゴメン クダサイ'], + ['おはようございます', 'オハヨーゴザイマス', '0/9', None, None, 'オハヨー ゴザイマス'], + ['嘘みたい', 'ウソミタイ', '1/5'], + ['満遍', 'マンベン', '0/4'], + ['形なし', 'カタナシ', '0/4'], + ['わかりっこ', 'ワカリッコ', '3/5'], + ['言わしむれば', 'イワシムレバ', '4/6'], + ['一人', 'ヒトリ', '2/3'], + ['二人', 'フタリ', '0/3'], + ['於て', 'オイテ', '1/3'], + ['この期', 'コノゴ', '0/3'], + ['その節', 'ソノセツ', '3/4'], + ['二十日', 'ハツカ', '0/3'], + ['二十歳', 'ハタチ', '1/3'], + ['3泊4日', 'サンパクヨッカ', '1/7', None, None, '3パク ヨッカ'], + ['二百十日', 'ニヒャクトーカ', '0/6', None, None, '2ヒャク トオカ'], + ['一日', 'ツイタチ', '0/4'], + ['十日', 'トーカ', '0/3', 100, None, 'トオカ'], + ['十四日', 'ジューヨッカ', '1/5', None, None, '14カ'], + ['二十四日', 'ニジューヨッカ', '1/6', None, None, '24カ'], + ['三三七拍子', 'サンサンナナビョーシ', '0/9', None, None, '3⠼3⠼7ビョーシ'], + ['三十三間堂', 'サンジューサンゲンドー', '1/10', None, None, '33ゲンドー'], + ['フレンドシップ', 'フレンドシップ', '5/7'], + ['我等', 'ワレラ', '1/3'], + ['相たずさえる', 'アイタズサエル', '1/7'], + ['各方面', 'カクホーメン', '1/6', None, None, 'カク ホーメン'], + ['旧陸軍', 'キューリクグン', '1/6', None, None, 'キュー リクグン'], + ['山や川', 'ヤマヤカワ', '2/5', None, None, 'ヤマヤ カワ'], - ['相対する', 'アイタイスル'], - ['相たずさえて', 'アイタズサエテ'], - ['相整う', 'アイトトノウ'], - ['相憐れむ', 'アイアワレム'], - ['木立の間', 'コダチノアイダ', None, None, None, 'コダチノ アイダ'], - ['開いた口', 'アイタクチ', None, None, None, 'アイタ クチ'], - ['相無く', 'アイナク'], - ['お生憎様', 'オアイニクサマ'], - ['開かずの間', 'アカズノマ', None, None, None, 'アカズノ マ'], - ['不開の間', 'アカズノマ', None, None, None, 'アカズノ マ'], - ['山田県主', 'ヤマダノアガタヌシ', None, None, None, 'ヤマダノ アガタヌシ'], - ['暁闇', 'アカツキヤミ'], - ['上がり降り', 'アガリオリ'], - ['四条上ル', 'シジョーアガル', '1/', None, None, '4ジョー アガル'], - ['秋津国', 'アキツクニ'], - ['現つ神', 'アキツカミ'], - ['阿Q正伝', 'アキューセイデン', '1/7', None, None, 'アQ セイデン'], - ['悪源太', 'アクゲンタ'], - ['明くる朝', 'アクルアサ', None, None, None, 'アクル アサ'], - ['明くる年', 'アクルトシ', None, None, None, 'アクル トシ'], - ['明の星', 'アケノホシ', None, None, None, 'アケノ ホシ'], - ['麻布十番', 'アザブジューバン', None, None, None, 'アザブ ジューバン'], - ['男漁り', 'オトコアサリ', None, None, None, 'オトコ アサリ'], - ['古本漁り', 'フルホンアサリ', None, None, None, 'フルホン アサリ'], - ['足の甲', 'アシノコー', None, None, None, 'アシノ コー'], - ['日の足', 'ヒノアシ'], - {'text':'醤油味', 'speech':'ショーユアジ', 'accent':'3/5', 'braille':'ショーユ アジ'}, + ['相対する', 'アイタイスル'], + ['相たずさえて', 'アイタズサエテ'], + ['相整う', 'アイトトノウ'], + ['相憐れむ', 'アイアワレム'], + ['木立の間', 'コダチノアイダ', None, None, None, 'コダチノ アイダ'], + ['開いた口', 'アイタクチ', None, None, None, 'アイタ クチ'], + ['相無く', 'アイナク'], + ['お生憎様', 'オアイニクサマ'], + ['開かずの間', 'アカズノマ', None, None, None, 'アカズノ マ'], + ['不開の間', 'アカズノマ', None, None, None, 'アカズノ マ'], + ['山田県主', 'ヤマダノアガタヌシ', None, None, None, 'ヤマダノ アガタヌシ'], + ['暁闇', 'アカツキヤミ'], + ['上がり降り', 'アガリオリ'], + ['四条上ル', 'シジョーアガル', '1/', None, None, '4ジョー アガル'], + ['秋津国', 'アキツクニ'], + ['現つ神', 'アキツカミ'], + ['阿Q正伝', 'アキューセイデン', '1/7', None, None, 'アQ セイデン'], + ['悪源太', 'アクゲンタ'], + ['明くる朝', 'アクルアサ', None, None, None, 'アクル アサ'], + ['明くる年', 'アクルトシ', None, None, None, 'アクル トシ'], + ['明の星', 'アケノホシ', None, None, None, 'アケノ ホシ'], + ['麻布十番', 'アザブジューバン', None, None, None, 'アザブ ジューバン'], + ['男漁り', 'オトコアサリ', None, None, None, 'オトコ アサリ'], + ['古本漁り', 'フルホンアサリ', None, None, None, 'フルホン アサリ'], + ['足の甲', 'アシノコー', None, None, None, 'アシノ コー'], + ['日の足', 'ヒノアシ'], + {'text':'醤油味', 'speech':'ショーユアジ', 'accent':'3/5', 'braille':'ショーユ アジ'}, - ['きゃ', 'キャ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['きゅ', 'キュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['きょ', 'キョ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['しゃ', 'シャ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['しゅ', 'シュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['しょ', 'ショ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ちゃ', 'チャ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ちゅ', 'チュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ちょ', 'チョ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['にゃ', 'ニャ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['にゅ', 'ニュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['にょ', 'ニョ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ひゃ', 'ヒャ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ひゅ', 'ヒュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ひょ', 'ヒョ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['みゃ', 'ミャ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['みゅ', 'ミュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['みょ', 'ミョ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['りゃ', 'リャ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['りゅ', 'リュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['りょ', 'リョ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['くゎ', 'クワ', "1/1", 15000, "記号,一般,*,*,*,*"], + {'text':'源朝臣頼政', 'braille':'ミナモトノ アソン ヨリマサ', 'accent':'6/'}, + {'text':'東漢直駒', 'braille':'ヤマトノ アヤノ アタイノ コマ'}, + {'text':'兄貴風', 'braille':'アニキカゼ', 'accent':'3/5'}, - ['ぎゅ', 'ギュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ぎょ', 'ギョ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['じゃ', 'ジャ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['じゅ', 'ジュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['じょ', 'ジョ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ぢゃ', 'ジャ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ぢゅ', 'ジュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ぢょ', 'ジョ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['びゃ', 'ビャ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['びゅ', 'ビュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['びょ', 'ビョ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ぴゃ', 'ピャ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ぴゅ', 'ピュ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ぴょ', 'ピョ', "1/1", 15000, "記号,一般,*,*,*,*"], - ['ぐゎ', 'グワ', "1/1", 15000, "記号,一般,*,*,*,*"], - - ] + ['きゃ', 'キャ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['きゅ', 'キュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['きょ', 'キョ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['しゃ', 'シャ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['しゅ', 'シュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['しょ', 'ショ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ちゃ', 'チャ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ちゅ', 'チュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ちょ', 'チョ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['にゃ', 'ニャ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['にゅ', 'ニュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['にょ', 'ニョ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ひゃ', 'ヒャ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ひゅ', 'ヒュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ひょ', 'ヒョ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['みゃ', 'ミャ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['みゅ', 'ミュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['みょ', 'ミョ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['りゃ', 'リャ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['りゅ', 'リュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['りょ', 'リョ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['くゎ', 'クワ', "1/1", 15000, "記号,一般,*,*,*,*"], + + ['ぎゅ', 'ギュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ぎょ', 'ギョ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['じゃ', 'ジャ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['じゅ', 'ジュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['じょ', 'ジョ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ぢゃ', 'ジャ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ぢゅ', 'ジュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ぢょ', 'ジョ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['びゃ', 'ビャ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['びゅ', 'ビュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['びょ', 'ビョ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ぴゃ', 'ピャ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ぴゅ', 'ピュ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ぴょ', 'ピョ', "1/1", 15000, "記号,一般,*,*,*,*"], + ['ぐゎ', 'グワ', "1/1", 15000, "記号,一般,*,*,*,*"], + +] class DicItem(object): __slots__ = ('text', 'speech', 'accent', 'cost', 'pos', 'braille') @@ -262,7 +266,10 @@ class DicItem(object): self.braille = a[5] if len(a) >= 6 else None elif isinstance(a, dict): self.text = a['text'] - self.speech = a['speech'] if 'speech' in a else None + if 'speech' in a: + self.speech = a['speech'] + else: + self.speech = a['braille'].replace(' ', '').replace('/', '') self.accent = a['accent'] if 'accent' in a else None self.cost = a['cost'] if 'cost' in a else None self.pos = a['pos'] if 'pos' in a else None diff --git a/include/jtalk/mecabRunner.py b/include/jtalk/mecabRunner.py index d1bd6ab..e4f8e03 100644 --- a/include/jtalk/mecabRunner.py +++ b/include/jtalk/mecabRunner.py @@ -29,7 +29,7 @@ def Mecab_get_reading(mf, CODE_=CODE): rd = ar[0] reading += rd if len(ar) > 12: - braille += ar[12] + r" " + braille += ar[12] + r"/" else: braille += rd + r"/" return (reading, braille.rstrip(r" /")) @@ -160,7 +160,7 @@ tasks = [ ['をりがみ', 'オリガミ', ], # 点訳のてびき第3版 第2章 その1 2 5 No.25 ['八幡平', 'ハチマンタイ', ], # ヤワタダイラ ['山ん中', 'ヤマンナカ', ], # 点訳のてびき第3版 第3章 その1 2 No.14 - ['そういうわけ', 'ソーユウワケ', 'ソー イウ ワケ', ], # 点訳のてびき第3版 第3章 その1 3 No.51 + ['そういうわけ', 'ソーユウワケ', 'ソー イウ/ワケ', ], # 点訳のてびき第3版 第3章 その1 3 No.51 ['そういう', 'ソーユウ', 'ソー イウ', ], # 点訳のてびき第3版 第3章 その1 5 No.2 ['どうして', 'ドーシテ', 'ドー シテ', ], # 点訳のてびき第3版 第3章 その1 5 No.5 @@ -245,8 +245,24 @@ tasks = [ ['古本漁り', 'フルホンアサリ', 'フルホン アサリ'], ['足の甲', 'アシノコー', 'アシノ コー'], ['日の足が伸びる', 'ヒノアシガノビル', 'ヒノアシ/ガ/ノビル'], - {'text':'醤油味', 'speech':'ショーユアジ', 'braille':'ショーユ アジ'}, + {'text':'醤油味', 'braille':'ショーユ アジ'}, {'text':'砂糖醤油', 'speech':'サトージョウユ'}, # regression test + + # 点字表記辞典「あ」(2) + #{'text':'足手纏い', 'braille':'アシデ マトイ'}, + #{'text':'手荷物預かり所', 'braille':'テニモツ アズカリジョ'}, + #{'text':'額に汗して', 'braille':'ヒタイニ アセ シテ'}, + #{'text':'認め遊ばす', 'braille':'シタタメアソバス'}, + {'text':'源朝臣頼政', 'braille':'ミナモトノ アソン ヨリマサ'}, + {'text':'東漢直駒', 'braille':'ヤマトノ アヤノ アタイノ コマ'}, + #{'text':'徒し男', 'braille':'アダシ オトコ'}, + #{'text':'徒し世', 'braille':'アダシヨ'}, + #{'text':'新し物好き', 'braille':'アタラシモノズキ'}, + #{'text':'暖かご飯', 'braille':'アッタカ ゴハン'}, + #{'text':'城跡', 'braille':'シロアト'}, + #{'text':'兄妹', 'braille':'アニ イモート'}, + {'text':'兄貴風を吹かす', 'input':'アニキカゼヲ フカス', 'braille':'アニキカゼ/ヲ/フカス'}, + #{'text':'秀兄イ', 'braille':'ヒデ アニイ'}, ] if __name__ == '__main__': @@ -256,7 +272,17 @@ if __name__ == '__main__': for i in tasks: if isinstance(i, dict): if 'braille' in i: - item = [ i['text'], i['speech'], i['braille'] ] + if 'speech' in i: + item = [ i['text'], i['speech'], i['braille'] ] + else: + s = i['braille'].replace(' ', '').replace('/', '') + item = [ i['text'], s, i['braille'] ] + elif 'input' in i: + if 'speech' in i: + item = [ i['text'], i['speech'], i['input'] ] + else: + s = i['input'].replace(' ', '').replace('/', '') + item = [ i['text'], s, i['input'] ] else: item = [ i['text'], i['speech'] ] else: