
TeX otfパッケージ用漢字變換スクリプト試作
ファイル
- texhenkwan.pl
- perlスクリプトです。
- texseiji.dic
- 變換用のデータです。(utf8のテキストファイル)
動作確認環境
動作説明
データを開いてもらふと分りますが、例へば、
飴 7634
とありますが、この場合、文章中に「飴」といふ字があれば、それを\CID{7634}といふ形に置換へます。
變換後、ついでに、utf8toutf、platex、dvipdfmxを呼び出して、pdf作成までしてゐます。
補足
- データは、http://partners.adobe.com/public/developer/en/font/5078.Adobe-Japan1-6.pdfから一字づつ拾つて入力しました。
- 主に、CIDの7633から8267あたり、13408から14100あたりを見て入力しました。
- 8359から8717(Windows機種依存文字(「塚」や「敎」等)などが含まれる)や、13320から13407(JIS X 0213追加分(「漢」や「淚」等、Unicodeで言へばFA30以降のあたり)などが含まれる)は、今回は(面倒だつたので)入れてゐません。
- 14101以降も、面倒になつたので、殆ど見てゐません。
- 複數ある異體字からどれを撰んだかは、特に基準はなく、主觀で決めました。要は、適當です。氣に入らなければ、その都度、變へていけばいいと思ひます。
- その際のヒントですが、Adobe Reader上で檢索すれば、異體字がヒットすることもあります。例へば、「音」で檢索すれば、一畫目が橫になつたCID13664の「音」がヒットします。
- しかし、「教」で檢索しても、「敎」(CID8471)はヒットせず、「視」で檢索しても、「視」(CID13346)はヒットしませんでした(「視」に至つては、檢索窓に入力すら出來ない)。