動機
「英辞郎のテキストデータからMac OS Xの辞書.app用辞書を自炊する」の余勢をかってロワイヤル仏和中辞典の自炊に挑戦しましたが、CD-ROMに含まれるhtmlに<a>なしの</a>が多数含まれていて、削除し切れなかったため、一旦断念しました。
その後、以前「ロワイヤル仏和中辞典 第2版 のEPWING化」で作成したHTMLファイルが使用出来るのではないかと思い当たり、PerlでMyDictionary.xmlに変換するスクリプトを作成しました。
※2021/04/03 11:00 日本語見出しを追加しました。
※2021/04/06 09:00 移動メニューから前付/後付が表示出来るようにしました。jpgindex.htmlが必要になりました。
※2022/05/04 09:30 ページ内リンクで図に飛ばないバグを修正しました。6〜7をやり直して下さい。
環境
- Mac OS Big Sur
- Additional Tools for Xcode 11
- Perl 5 (v5.28.2)
- Homebrew
「ロワイヤル仏和中辞典 第2版 のEPWING化」のHTMLファイル作成の作業手順に従い、items.html、morph.html、conju.html及びjpgindex.htmlを作成します。また、挿絵画像の作成手順に従ってJPEGファイルを作成します。
2. Homebrewでnkfをインストールする。
brew install nkf
nkf -wd items.html > items-utf8.html
nkf -wd jpgindex.html > jpgindex-utf8.htmlnkf -wd morph.html > morph-utf8.htmlnkf -wd conju.html > conju-utf8.html
https://developer.apple.com/download/more/ よりダウンロードして下さい。解凍すると Utilitesの中にDictionary Development Kit があるのでホームホルダーの下にコピーしてください。
5. 変換に使用するスクリプト及び関連ファイルをダウンロードする。
こちらからダウンロードして下さい。
最終的なホルダー構成は次のようになります。project_template、OtherResources及び 画像ファイルが入るImagesの各ホルダーの名前と位置はこの通りでなければ、画像は取り込めません。 JPEGファイルはImageホルダー直下にコピーします。
.
└── project_template
├── Makefile
├── MyDictionary.css
├── MyDictionary.xml
├── MyInfo.plist
├── OtherResources
│ └── Images
├── conju-utf8.html
├── items-utf8.html
├── jpgindex-utf8.html
├── morph-utf8.html
└── royal_conv.pl
6. テキストデータをDictionary Development Kitに渡す形に変換する。
perl royal_conv.pl > MyDictionary.xml
7. Dictionary Development Kit で辞書作成&インストール
Makefile の DICT_BUILD_TOOL_DIR は、Dictionary Development Kitを配置したパスに書き換えて実行して下さい(特に自分のホームホルダー名は必ず変更)。
make; make install
makeに要する時間は、MacBook Pro(2018)にて10分ほどです。
8. 辞書.appに登録する。
辞書.appを起動し、メニューの[辞書] - [環境設定...]から辞書リストの一番下にある仏和辞典に✓を入れる。