2021年4月1日木曜日

英辞郎のテキストデータからMac OS Xの辞書.app用辞書を作成する

 動機 

Aurélioと言うブラジルポルトガル語の大辞典に付属しているWindows用電子辞書のCDから辞書.app用の辞書を作成した人がいて、辞書.appに自炊の辞書が追加出来るのを知りました。

Mac OS Catalinaの辞書.appで英辞郎を利用する」と言うサイトに英辞郎のテキストデータから辞書を自炊する方法が載っていましたが、Rubyのバージョンが低くそのままでは作成に失敗するので、自分なりに改変して何とか実用になるレベルまで出来ましたが、自分で一から作って見たいと言う欲求に駆られ、英辞郎のテキストデータ(Ver.144.8)からPerlで自炊することにしました。

※2021/04/11 11:50 <→...>が変換されないバグを修正しました。

 環境 

  • Mac OS Big Sur
  • Additional Tools for Xcode 11
  • Perl 5
  • Homebrew
 手順 

1. 英辞郎のテキストデータを用意する。
こちらから英辞郎 Ver.144.8(2015年3月20日版)のテキストデータが495円でダウンロード出来ます。

2. Homebrewでnkfをインストールする。

    brew install nkf                                       

    3. nkfで1.でダウンロードしたテキストデータをUTF-8に変換する。
        nkf -wd EIJIRO-1448.TXT > EIJIRO-1448_UTF8.TXT       
    ※ファイル名がこれと異なる場合はeiji_conv.plの10行目と60行目の"open(FILE, 'EIJIRO-1448_UTF8.TXT')"を修正して下さい。
      4. Additional Tools for Xcode 11をインストールする。
      解凍すると Utilitesの中にDictionary Development Kit があるのでホームホルダーの下にコピーしてください。

      5. 変換に使用するスクリプト及び関連ファイルをこちらからダウンロードする。

      最終的なホルダー構成は次のようになります。

      .
      └── <Home Holder>
          ├── Dictionary Development Kit
          │   ├── bin
          │   ├── documents
          │   ├── project_templates
          │   └── samples
          ├── Library
          │   └── Dictionaries
          └── <Work Holder>
               ├── EIJIRO-1448_UTF8.TXT
               ├── Makefile
               ├── MyDictionary.css
               ├── MyDictionary.xml
               ├── MyInfo.plist
               └── eiji_conv.pl

      6. テキストデータをDictionary Development Kitに渡す形に変換する。

          perl eiji_conv.pl > MyDictionary.xml       

      7. Dictionary Development Kit で辞書作成&インストール

      Makefile の DICT_BUILD_TOOL_DIR は、Dictionary Development Kitを配置したパスに書き換えて実行して下さい(特に自分のホームホルダー名は必ず変更)。

          make; make install                               

      MacBook Pro(2018)にて14時間ほどかかりました。

      8. 辞書.appに登録する。

      辞書.appを起動し、メニューの[辞書] - [環境設定...]から辞書リストの一番下にある英辞郎に✓を入れる。


      0 件のコメント:

      コメントを投稿