2022年5月5日木曜日

広辞苑 第五版 CD-ROM版からMac OS Xの辞書.app用辞書を作成する

  動機 

かつて、岩波書店から「広辞苑 第五版 CD-ROM版 (EPWING) 」が発売されていましたが、富士通のパソコンに添付されていたものがメルカリで安価に出品されていましたので(「広辞苑 第五版・現代用語の基礎知識 2007年版・学研パーソナル総合辞典)、それを利用してMac OS Xの辞書.app用に変換して見ました。

Tats_yさんの「Leopardの「辞書」アプリでEPWING辞書を使う」と言うサイトに、hishida氏が作成されたEPWING構造解析ツール「EBDump」からの出力を、太田純氏が作成された「ebd2html」でHTMLに変換する方法が掲載されていたので、参考にさせて頂きました。

※2022/05/10 17:25 honmon_gaiji_rep.plとkoujien_conv.plの不具合を修正しました。ダウンロードして6、9、11をやり直して下さい。

 環境 

  • Windows 11
  • Mac OS Monterey
  • Additional Tools for Xcode 11
  • Perl 5
  • Homebrew
 手順 

(Windows)
1. 広辞苑をHDDにインストールし、EBDumpにて本文とインデックデータを抽出する。
EBDumpをインストールし、ebd2htmlの「●再構成の手順 (2) 既存の電子ブック/EPWINGからデータを取り出す」を参考に、honmon.txt、fkindex.txt及びfhindex.txtを取り出します。但し、ebd2html自体のインストールは不要です。

(Mac OSX)
2. 作業用フォルダーを作成し、変換に使用するスクリプト及び関連ファイルをこちらからダウンロードする。

3. Homebrewでnkfをインストールする。

    brew install nkf                                       

    4. 1.でダウンロードしたテキストデータを作業用フォルダーにコピーし、nkfでUTF-8に変換する。

        nkf -wd honmon.txt > honmon-utf8.txt    
        nkf -wd fkindex.txt > fkindex-utf8.txt.      
        nkf -wd fhindex.txt > fhindex-utf8.txt.      

    5. EBMacをインストールし、/Applications/EBMac.app/Contents/Resources/から外字変換テーブルKOUJIEN.plistを作業用フォルダーにコピーする。

    6. KOUJIEN.plistを使ってhonmon-utf8.txt内の外字をutf8のフォントに変更する。

        perl  honmon_gaiji_rep.pl > honmon-utf8-rep.txt    

    7. Additional Tools for Xcode 11をインストールする。

    https://developer.apple.com/download/more/ よりダウンロードして下さい。
    解凍すると Utilitesの中にDictionary Development Kit があるのでホームホルダーの下にコピーしてください。

    8. Makefile の DICT_BUILD_TOOL_DIR は、Dictionary Development Kitを配置したパスに書き換える(自分のホームホルダー名は必ず変更)。

    9. 本文データをDictionary Development Kitに渡す形に変換する。

        perl koujien_conv.pl > MyDictionary.xml       

    10. make前のホルダー構成は次のようになります。

    .
    └── <Home Holder>
        ├── Dictionary Development Kit
        │   ├── bin
        │   ├── documents
        │   ├── project_templates
        │   └── samples
        ├── Library
        │   └── Dictionaries
        └── <Work Holder>
             ├── fhindex-utf8.txt
             ├── fkindex-utf8.txt
             ├── honmon_gaiji_rep.pl
             ├── honmon-utf8-rep.txt
             ├── koujien-conv.pl
             ├── koujien-utf8-rep.txt
             ├── KOUJIEN.plist
             ├── Makefile
             ├── MyDictionary.css
             ├── MyDictionary.xml
             └── MyInfo.plist

    11. Dictionary Development Kit で辞書作成&インストール

        make; make install                               

    12. 辞書.appに登録する。

    辞書.appを起動し、アプリケーションメニューの[辞書] - [環境設定...]から辞書リストの一番下にある広辞苑 第五版に✓を入れる。また、[移動] - [前付/後付]からメニューにアクセス出来ます。