2022年5月5日木曜日

広辞苑 第五版 CD-ROM版からMac OS Xの辞書.app用辞書を作成する

  動機 

かつて、岩波書店から「広辞苑 第五版 CD-ROM版 (EPWING) 」が発売されていましたが、富士通のパソコンに添付されていたものがメルカリで安価に出品されていましたので(「広辞苑 第五版・現代用語の基礎知識 2007年版・学研パーソナル総合辞典)、それを利用してMac OS Xの辞書.app用に変換して見ました。

Tats_yさんの「Leopardの「辞書」アプリでEPWING辞書を使う」と言うサイトに、hishida氏が作成されたEPWING構造解析ツール「EBDump」からの出力を、太田純氏が作成された「ebd2html」でHTMLに変換する方法が掲載されていたので、参考にさせて頂きました。

※2022/05/10 17:25 honmon_gaiji_rep.plとkoujien_conv.plの不具合を修正しました。ダウンロードして6、9、11をやり直して下さい。

 環境 

  • Windows 11
  • Mac OS Monterey
  • Additional Tools for Xcode 11
  • Perl 5
  • Homebrew
 手順 

(Windows)
1. 広辞苑をHDDにインストールし、EBDumpにて本文とインデックデータを抽出する。
EBDumpをインストールし、ebd2htmlの「●再構成の手順 (2) 既存の電子ブック/EPWINGからデータを取り出す」を参考に、honmon.txt、fkindex.txt及びfhindex.txtを取り出します。但し、ebd2html自体のインストールは不要です。

(Mac OSX)
2. 作業用フォルダーを作成し、変換に使用するスクリプト及び関連ファイルをこちらからダウンロードする。

3. Homebrewでnkfをインストールする。

    brew install nkf                                       

    4. 1.でダウンロードしたテキストデータを作業用フォルダーにコピーし、nkfでUTF-8に変換する。

        nkf -wd honmon.txt > honmon-utf8.txt    
        nkf -wd fkindex.txt > fkindex-utf8.txt.      
        nkf -wd fhindex.txt > fhindex-utf8.txt.      

    5. EBMacをインストールし、/Applications/EBMac.app/Contents/Resources/から外字変換テーブルKOUJIEN.plistを作業用フォルダーにコピーする。

    6. KOUJIEN.plistを使ってhonmon-utf8.txt内の外字をutf8のフォントに変更する。

        perl  honmon_gaiji_rep.pl > honmon-utf8-rep.txt    

    7. Additional Tools for Xcode 11をインストールする。

    https://developer.apple.com/download/more/ よりダウンロードして下さい。
    解凍すると Utilitesの中にDictionary Development Kit があるのでホームホルダーの下にコピーしてください。

    8. Makefile の DICT_BUILD_TOOL_DIR は、Dictionary Development Kitを配置したパスに書き換える(自分のホームホルダー名は必ず変更)。

    9. 本文データをDictionary Development Kitに渡す形に変換する。

        perl koujien_conv.pl > MyDictionary.xml       

    10. make前のホルダー構成は次のようになります。

    .
    └── <Home Holder>
        ├── Dictionary Development Kit
        │   ├── bin
        │   ├── documents
        │   ├── project_templates
        │   └── samples
        ├── Library
        │   └── Dictionaries
        └── <Work Holder>
             ├── fhindex-utf8.txt
             ├── fkindex-utf8.txt
             ├── honmon_gaiji_rep.pl
             ├── honmon-utf8-rep.txt
             ├── koujien-conv.pl
             ├── koujien-utf8-rep.txt
             ├── KOUJIEN.plist
             ├── Makefile
             ├── MyDictionary.css
             ├── MyDictionary.xml
             └── MyInfo.plist

    11. Dictionary Development Kit で辞書作成&インストール

        make; make install                               

    12. 辞書.appに登録する。

    辞書.appを起動し、アプリケーションメニューの[辞書] - [環境設定...]から辞書リストの一番下にある広辞苑 第五版に✓を入れる。また、[移動] - [前付/後付]からメニューにアクセス出来ます。


    2021年4月1日木曜日

    ロワイヤル仏和中辞典 第2版付属のCD-ROMからMac OS Xの辞書.app用辞書を作成する

      動機 

    英辞郎のテキストデータからMac OS Xの辞書.app用辞書を自炊する」の余勢をかってロワイヤル仏和中辞典の自炊に挑戦しましたが、CD-ROMに含まれるhtmlに<a>なしの</a>が多数含まれていて、削除し切れなかったため、一旦断念しました。

    その後、以前「ロワイヤル仏和中辞典 第2版 のEPWING化」で作成したHTMLファイルが使用出来るのではないかと思い当たり、PerlでMyDictionary.xmlに変換するスクリプトを作成しました。

    ※2021/04/03 11:00 日本語見出しを追加しました。
    ※2021/04/06 09:00 移動メニューから前付/後付が表示出来るようにしました。jpgindex.htmlが必要になりました。

    ※2022/05/04 09:30 ページ内リンクで図に飛ばないバグを修正しました。6〜7をやり直して下さい。

     環境 

    • Mac OS Big Sur
    • Additional Tools for Xcode 11
    • Perl 5 (v5.28.2)
    • Homebrew
     手順 

    1. CD-ROMからHTMLファイル及びJPEGファイルを作成する。
    ロワイヤル仏和中辞典 第2版 のEPWING化」のHTMLファイル作成の作業手順に従い、items.html、morph.html、conju.html及びjpgindex.htmlを作成します。また、挿絵画像の作成手順に従ってJPEGファイルを作成します。

    2. Homebrewでnkfをインストールする。

        brew install nkf                                            

      3. 1.で作成したHTMLファイルをUTF-8に変換する。
          nkf -wd items.html > items-utf8.html            
          nkf -wd jpgindex.html > jpgindex-utf8.html   
          nkf -wd morph.html > morph-utf8.html         
          nkf -wd conju.html > conju-utf8.html            
        4. Additional Tools for Xcode 11をインストールする。
        https://developer.apple.com/download/more/ よりダウンロードして下さい。
        解凍すると Utilitesの中にDictionary Development Kit があるのでホームホルダーの下にコピーしてください。

        5. 変換に使用するスクリプト及び関連ファイルをダウンロードする。

        こちらからダウンロードして下さい。

        最終的なホルダー構成は次のようになります。project_template、OtherResources及び 画像ファイルが入るImagesの各ホルダーの名前と位置はこの通りでなければ、画像は取り込めません。 JPEGファイルはImageホルダー直下にコピーします。

        .
        └── project_template
             ├── Makefile
             ├── MyDictionary.css
             ├── MyDictionary.xml
             ├── MyInfo.plist
             ├── OtherResources
             │   └── Images
             ├── conju-utf8.html
             ├── items-utf8.html
             ├── jpgindex-utf8.html
             ├── morph-utf8.html
             └── royal_conv.pl


        6. テキストデータをDictionary Development Kitに渡す形に変換する。

            perl royal_conv.pl > MyDictionary.xml       

        7. Dictionary Development Kit で辞書作成&インストール

        Makefile の DICT_BUILD_TOOL_DIR は、Dictionary Development Kitを配置したパスに書き換えて実行して下さい(特に自分のホームホルダー名は必ず変更)。

            make; make install                               

        makeに要する時間は、MacBook Pro(2018)にて10分ほどです。

        8. 辞書.appに登録する。

        辞書.appを起動し、メニューの[辞書] - [環境設定...]から辞書リストの一番下にある仏和辞典に✓を入れる。

        英辞郎のテキストデータからMac OS Xの辞書.app用辞書を作成する

         動機 

        Aurélioと言うブラジルポルトガル語の大辞典に付属しているWindows用電子辞書のCDから辞書.app用の辞書を作成した人がいて、辞書.appに自炊の辞書が追加出来るのを知りました。

        Mac OS Catalinaの辞書.appで英辞郎を利用する」と言うサイトに英辞郎のテキストデータから辞書を自炊する方法が載っていましたが、Rubyのバージョンが低くそのままでは作成に失敗するので、自分なりに改変して何とか実用になるレベルまで出来ましたが、自分で一から作って見たいと言う欲求に駆られ、英辞郎のテキストデータ(Ver.144.8)からPerlで自炊することにしました。

        ※2021/04/11 11:50 <→...>が変換されないバグを修正しました。

         環境 

        • Mac OS Big Sur
        • Additional Tools for Xcode 11
        • Perl 5
        • Homebrew
         手順 

        1. 英辞郎のテキストデータを用意する。
        こちらから英辞郎 Ver.144.8(2015年3月20日版)のテキストデータが495円でダウンロード出来ます。

        2. Homebrewでnkfをインストールする。

            brew install nkf                                       

          3. nkfで1.でダウンロードしたテキストデータをUTF-8に変換する。
              nkf -wd EIJIRO-1448.TXT > EIJIRO-1448_UTF8.TXT       
          ※ファイル名がこれと異なる場合はeiji_conv.plの10行目と60行目の"open(FILE, 'EIJIRO-1448_UTF8.TXT')"を修正して下さい。
            4. Additional Tools for Xcode 11をインストールする。
            解凍すると Utilitesの中にDictionary Development Kit があるのでホームホルダーの下にコピーしてください。

            5. 変換に使用するスクリプト及び関連ファイルをこちらからダウンロードする。

            最終的なホルダー構成は次のようになります。

            .
            └── <Home Holder>
                ├── Dictionary Development Kit
                │   ├── bin
                │   ├── documents
                │   ├── project_templates
                │   └── samples
                ├── Library
                │   └── Dictionaries
                └── <Work Holder>
                     ├── EIJIRO-1448_UTF8.TXT
                     ├── Makefile
                     ├── MyDictionary.css
                     ├── MyDictionary.xml
                     ├── MyInfo.plist
                     └── eiji_conv.pl

            6. テキストデータをDictionary Development Kitに渡す形に変換する。

                perl eiji_conv.pl > MyDictionary.xml       

            7. Dictionary Development Kit で辞書作成&インストール

            Makefile の DICT_BUILD_TOOL_DIR は、Dictionary Development Kitを配置したパスに書き換えて実行して下さい(特に自分のホームホルダー名は必ず変更)。

                make; make install                               

            MacBook Pro(2018)にて14時間ほどかかりました。

            8. 辞書.appに登録する。

            辞書.appを起動し、メニューの[辞書] - [環境設定...]から辞書リストの一番下にある英辞郎に✓を入れる。


            2020年2月2日日曜日

            Raspberry Pi 4 4GB

            去年(2019年)の暮れに、イギリスのPimoroni Ltd社からRaspberry Pi 4 4GBを購入した。技適公示が9月29日なので、技適マークが付く前の製品だ。当時、まだ国内での流通量が非常に少なく、値段も高かったので、個人輸入することにした。
            注文内訳は次の通り。

            1x Aluminium Heatsink Case for Raspberry Pi 4 - Gunmetal for £10.00 each
            1x Raspberry Pi Official USB-C Power Supply - US - White for £6.25 each
            1x Raspberry Pi 4 - 4GB RAM for £45.00 each
            Subtotal : £61.25 GBP
            Shipping : £9.00 GBP
            Total : £70.25 GBP

            10月30日に出荷されて、11月7日に到着した。換算レートは143.62円/ポンドで、支払額は10,089円だった。ギリギリ消費税はかからなかったので、運賃を按分して本体価格は7,412円となり、現在アマゾンで7,315円で販売されていることを考えると、まずまずの価格だったのではないかと思う。

            これに、国内でOSインストール用に32GBのmicroSDHCカード599円と、ロジクールのキーボードとマウスのセット1,842円、Micro-HDMI to HDMI 変換 ケーブル 759円、それにTVでは家族との共用で苦しくなったので23.8インチディスプレイ12,100円を追加購入した。

            それ以来、すっかりメインのPCとして使用しているのだが、何故か居間で使用すると、こたつから立ち上がると言うような微小な振動でブラックアウトして落ちてしまう現象が多発。隣の日本間では全く安定しているので、電圧の関係かと思ったが、日本間から居間に延長コードでつないでもやはり落ちるので、原因は良く分らず。

            ウェブの閲覧とPythonの勉強が主な使用目的なので、パワー的にも不足はない。文書作成はGoogleスプレッドシートとドキュメントでMicrosoft Officeの代用をしている。

            2019年8月16日金曜日

            イギリス旅行(2日目: オックスフォード)

            本日は、オックスフォードの市内観光です。

             ホテル前の通り 
            泊まったホテル・ヘンリーズ前のセント・マイケルズ・ストリート。

            殉教者の碑

             屋内市場(Covered Market) 



             オックスフォード城址 

             ブラックウェルズ書店 


             ためいき橋 

             ボドリアン図書館 


             パイミンスター 

             マザーシップ・パイ 
            11:20 屋内市場内のパイミンスターで昼食。全部のせのマザーシップを選択。

             クライストチャーチ 


             ハリー・ポッターに出て来る食堂 


             モース警部の看板 

             パブ内部 

             ビル・クリントンの看板 
            ためいき橋の近くの狭い路地を入ったところにパブ ターフ・タヴァーンで一杯。
            実はこの店、クリントン元米大統領がオックスフォード大への留学時にマリファナを吸引した現場として有名。大統領選でマリファナ吸引疑惑をかけられた際に「英国でマリファナを試したことがあったが肺には吸い込まなかった」と発言したことが話題になったが、店内には「ビル・クリントンが違法薬物を吸い込まなかった場所」と書かれた看板がある。

            2019年8月15日木曜日

            イギリス旅行(1日目: 羽田~ロンドン〜オックスフォード)

            8月15日から約2週間の予定でイギリスのオックスフォード,チェスター,ブリストルとその周辺都市に行って来た。

            BA008便にて8:50羽田発,13:10ヒースロー着。
             ヒースロー空港のバゲージクレーム 

            13:57 ヒースローエクスプレスに乗り、約15分でパディントン駅着。
             13:59 ヒースローエクスプレス内 

             14:23 パディントン駅構内 
            首から黄色いカメラ(中身はソニーα7)を下げ、撮った写真をペンを使ってiPadで編集するスーパーばあちゃん。
             14:38 スーパーばあちゃん 

            14:50パディントン発、15:46オックスフォード着。
             15:21 オックスフォード行きの列車内 

             15:53 オックスフォード駅のプラットホーム 

             オックスフォード駅の改札を出たところ 

             オックスフォード運河 

             シップストリート 

             殉教者の記念碑 
            1554年カトリックの女王メアリ1世によって処刑されたプロテスタントの司教たちの慰霊のため1833年に造られた。

             ランドルフホテル 
             イギリスの推理作家コリン・デクスターのモース警部シリーズ「消えた装身具」の舞台となったホテル。


             パブ イーグル&チャイルド 
            18:30「指環物語」のJ・R・R・トールキンや、「ナルニア国物語」のC・S・ルイスといった英国が誇る文豪たちが、オックスフォード大生だった20世紀前半通い詰めていたことで有名なパブで夕飯。

             ウォーターストーンズ書店 



            2018年9月18日火曜日

            イギリス&パリ旅行(16日目: パリ モンパルナス~空港)

            2018/09/18(火)

            ル・セレクトの店内
            モンパルナスでもう一軒有名なカフェ・ロトンドに行こうと思ったのだが,まだ開店していなかったので,ル・セレクトで朝食。

            フル・ブレックファースト
            メニューのPetit-déjeuner Complet(プティデジャネ・コンプレ=完全な朝食)と言う言葉からフル・イングリッシュ・ブレックファーストのイメージを想像して注文したのだが,フランスパンとジャムが追加されているだけだった。

            モンパルナス駅横のバス乗り場
            チケットは事前にインターネットで購入してあったので,国鉄モンパルナス駅横から直行バス(Le Bus Direct)に乗り,約1時間でシャルル・ド・ゴール空港のターミナル2Eに到着。


            シャトル内
            ゲートLまではシャトルで移動。


            ゲートLでシャトルを降りる

            帰りの機内食
            キュウリのさいの目切りのクリームスープ
            鶏肉のピーマン・クリーム煮
            香り米
            カマンベール・チーズ
            リンゴのスライスの袋入り
            洋ナシとチョコレートのケーキ
            コーヒーとお茶類