2021年4月1日木曜日

ロワイヤル仏和中辞典 第2版付属のCD-ROMからMac OS Xの辞書.app用辞書を作成する

  動機 

英辞郎のテキストデータからMac OS Xの辞書.app用辞書を自炊する」の余勢をかってロワイヤル仏和中辞典の自炊に挑戦しましたが、CD-ROMに含まれるhtmlに<a>なしの</a>が多数含まれていて、削除し切れなかったため、一旦断念しました。

その後、以前「ロワイヤル仏和中辞典 第2版 のEPWING化」で作成したHTMLファイルが使用出来るのではないかと思い当たり、PerlでMyDictionary.xmlに変換するスクリプトを作成しました。

※2021/04/03 11:00 日本語見出しを追加しました。
※2021/04/06 09:00 移動メニューから前付/後付が表示出来るようにしました。jpgindex.htmlが必要になりました。

※2022/05/04 09:30 ページ内リンクで図に飛ばないバグを修正しました。6〜7をやり直して下さい。

 環境 

  • Mac OS Big Sur
  • Additional Tools for Xcode 11
  • Perl 5 (v5.28.2)
  • Homebrew
 手順 

1. CD-ROMからHTMLファイル及びJPEGファイルを作成する。
ロワイヤル仏和中辞典 第2版 のEPWING化」のHTMLファイル作成の作業手順に従い、items.html、morph.html、conju.html及びjpgindex.htmlを作成します。また、挿絵画像の作成手順に従ってJPEGファイルを作成します。

2. Homebrewでnkfをインストールする。

    brew install nkf                                            

    3. 1.で作成したHTMLファイルをUTF-8に変換する。
        nkf -wd items.html > items-utf8.html            
        nkf -wd jpgindex.html > jpgindex-utf8.html   
        nkf -wd morph.html > morph-utf8.html         
        nkf -wd conju.html > conju-utf8.html            
      4. Additional Tools for Xcode 11をインストールする。
      https://developer.apple.com/download/more/ よりダウンロードして下さい。
      解凍すると Utilitesの中にDictionary Development Kit があるのでホームホルダーの下にコピーしてください。

      5. 変換に使用するスクリプト及び関連ファイルをダウンロードする。

      こちらからダウンロードして下さい。

      最終的なホルダー構成は次のようになります。project_template、OtherResources及び 画像ファイルが入るImagesの各ホルダーの名前と位置はこの通りでなければ、画像は取り込めません。 JPEGファイルはImageホルダー直下にコピーします。

      .
      └── project_template
           ├── Makefile
           ├── MyDictionary.css
           ├── MyDictionary.xml
           ├── MyInfo.plist
           ├── OtherResources
           │   └── Images
           ├── conju-utf8.html
           ├── items-utf8.html
           ├── jpgindex-utf8.html
           ├── morph-utf8.html
           └── royal_conv.pl


      6. テキストデータをDictionary Development Kitに渡す形に変換する。

          perl royal_conv.pl > MyDictionary.xml       

      7. Dictionary Development Kit で辞書作成&インストール

      Makefile の DICT_BUILD_TOOL_DIR は、Dictionary Development Kitを配置したパスに書き換えて実行して下さい(特に自分のホームホルダー名は必ず変更)。

          make; make install                               

      makeに要する時間は、MacBook Pro(2018)にて10分ほどです。

      8. 辞書.appに登録する。

      辞書.appを起動し、メニューの[辞書] - [環境設定...]から辞書リストの一番下にある仏和辞典に✓を入れる。

      英辞郎のテキストデータからMac OS Xの辞書.app用辞書を作成する

       動機 

      Aurélioと言うブラジルポルトガル語の大辞典に付属しているWindows用電子辞書のCDから辞書.app用の辞書を作成した人がいて、辞書.appに自炊の辞書が追加出来るのを知りました。

      Mac OS Catalinaの辞書.appで英辞郎を利用する」と言うサイトに英辞郎のテキストデータから辞書を自炊する方法が載っていましたが、Rubyのバージョンが低くそのままでは作成に失敗するので、自分なりに改変して何とか実用になるレベルまで出来ましたが、自分で一から作って見たいと言う欲求に駆られ、英辞郎のテキストデータ(Ver.144.8)からPerlで自炊することにしました。

      ※2021/04/11 11:50 <→...>が変換されないバグを修正しました。

       環境 

      • Mac OS Big Sur
      • Additional Tools for Xcode 11
      • Perl 5
      • Homebrew
       手順 

      1. 英辞郎のテキストデータを用意する。
      こちらから英辞郎 Ver.144.8(2015年3月20日版)のテキストデータが495円でダウンロード出来ます。

      2. Homebrewでnkfをインストールする。

          brew install nkf                                       

        3. nkfで1.でダウンロードしたテキストデータをUTF-8に変換する。
            nkf -wd EIJIRO-1448.TXT > EIJIRO-1448_UTF8.TXT       
        ※ファイル名がこれと異なる場合はeiji_conv.plの10行目と60行目の"open(FILE, 'EIJIRO-1448_UTF8.TXT')"を修正して下さい。
          4. Additional Tools for Xcode 11をインストールする。
          解凍すると Utilitesの中にDictionary Development Kit があるのでホームホルダーの下にコピーしてください。

          5. 変換に使用するスクリプト及び関連ファイルをこちらからダウンロードする。

          最終的なホルダー構成は次のようになります。

          .
          └── <Home Holder>
              ├── Dictionary Development Kit
              │   ├── bin
              │   ├── documents
              │   ├── project_templates
              │   └── samples
              ├── Library
              │   └── Dictionaries
              └── <Work Holder>
                   ├── EIJIRO-1448_UTF8.TXT
                   ├── Makefile
                   ├── MyDictionary.css
                   ├── MyDictionary.xml
                   ├── MyInfo.plist
                   └── eiji_conv.pl

          6. テキストデータをDictionary Development Kitに渡す形に変換する。

              perl eiji_conv.pl > MyDictionary.xml       

          7. Dictionary Development Kit で辞書作成&インストール

          Makefile の DICT_BUILD_TOOL_DIR は、Dictionary Development Kitを配置したパスに書き換えて実行して下さい(特に自分のホームホルダー名は必ず変更)。

              make; make install                               

          MacBook Pro(2018)にて14時間ほどかかりました。

          8. 辞書.appに登録する。

          辞書.appを起動し、メニューの[辞書] - [環境設定...]から辞書リストの一番下にある英辞郎に✓を入れる。