
ATOK用IME辭書正字化ツール
ファイル
atok_jisho_seijika_tool.zip
内容物
- atok_jisho_seijika_tool.exe
- 本體(HSP3.1で作成)
- jishoconverter.pl
- perlスクリプト
- seiji.dic
- 變換辭書
以上は動作に必須。
- atok_jisho_seijika_tool.as、fileop03.hsp
- ソース
- atok_jisho_seijika_tool.txt
- 説明文書
説明
- 正字/略字變換CGIの、辭書變換版です。
- ATOK用のIME辭書を、より正字化するためのツールです。
- ActivePerl(5.8以降)が必要です。Windows XPで動作確認してゐます。
使用例
既にJIS X 0208まで對應した正字正假名辭書があり、それをIVSなどに對應にしたい
といふか、私がこの爲だけに作成したプログラムなのだけども。
ここでは、森さんの正字正假名辭書を例として、變換してみます。
下準備
- 正字正假名辭書をインストールする。
- それを、ATOK辭書ユーティリティでUnicodeテキストファイルに出力する(例:スクリーンショット)。
- ATOK標準辭書も同じく出力する。その他、單漢字辭書なども、必要に應じて出力。
※ATOK17では、標準辭書の出力ができましたが、最新のATOK2008では出來ないやうです。
- 以上で下準備完了。
變換作業
- atok_jisho_seijika_tool.exeを起動する。
- 變換元に下準備で作成したファイルを選擇する。
- 變換範圍、文字コードの指定をする。私の使った設定がデフォルトになってゐる(小塚明朝Pr6N R用の設定です)。
- 「JISX0208内の略字を含む單語を變換しない」オプションは必須。
- 「變換開始」を押す。プログラムが惡いせゐで、時間がかなりかかる。變換自體は正常に行はれる。
- 他のファイルも同樣に繰返す。
- 以上で變換作業は終了。
辭書登録
- あとは、變換した單語ファイルを、ATOK辭書ユーティリティで「一括登録」すればよいだけ。
- 出力した削除用ファイルで「一括削除」を行ふと、元の略字の部分を削除し、變換效率を良くすることができる。
注意點
- 單純な機械的變換に過ぎないので、假名遣の變換等はできません。特に「書き換へ語」などで不具合が生じることが豫想されます。
- また、變換の際、元のテキストファイルが餘りに大きすぎると、變換の際に「perlが不正な処理が云々」とエラーが出ることがありました(Windows 98+ActivePerlで、單語數二十萬以上の時に確認)。Windows XPでは問題ないやうです。
變換後辭書サンプル
「細かい説明はどうでもいい」、「取敢ずzipでくれ」といふ聲無き聲に御應へして、變換後の辭書のサンプルを置いておきます。
- atok_seiji_ivs.zip
- 上記使用例で作成したもの。略字部分は削除濟。
不具合報告などは、メールか掲示板まで。お氣輕にどうぞ。
首頁に戻る