Kobo用 英辞郎コンバータ

—–12/09/13 追記ここから—–

1.0 では dll ファイルが足りなかったので、追加したものを 1.0.1 として公開しました。 

—–12/09/13 追記ここまで—– 

だいぶ長い時間がかかってしまいましたが、kobo 用の英辞郎辞書コンバータが完成しました。

これを使うと、英辞郎(英和辞書)を kobo で使うことができるようになります。 

kobo で英辞郎を使う
kobo で英辞郎を使う

コンバータはwindowsアプリとして作りました。 

また、英辞郎の辞書データが必要です。EIJI-134.TXTで確認しました。 

展開すると作成される EijiroConverter.exe を実行すると以下のようなシンプルなウィンドウが開きます。

起動画面
起動画面

Inputのところに英辞郎の .txt ファイルを指定し、変換オプションを指定して「実行」を押すと Kobo.tgz が作成されます。

Kobo.tgz は .txt ファイルと同じディレクトリに作成されます。 

変換オプションは全てチェックを入れるのがお勧めです。全部チェックをはずすと、オリジナルの辞書データ全てを kobo 形式に変換するのですが、それではファイルサイズが大きくなりすぎて Kobo のシステムパーテーションが disk full になるので注意してください。

変換オプションの意味を1つずつ説明します。意味がよくわからない場合は、チェックはいじらないでください。

熟語(2語以上の項目)を削除

kobo の辞書機能の制限(?)で、2語以上の辞書は検索できないようです。そのため、2語以上の項目は入っていても検索されることがないため、削除しても問題ありません。

英辞郎は豊富な熟語が売りの1つなのですが、仕方ありません。

その代わり、熟語を消すだけで辞書データのサイズがかなり小さくなります。 辞書サイズ的にチェックは必須です。 

漢字の読み仮名を削除

英辞郎の説明文には "企業{きぎょう}" のように漢字に読み仮名が振ってあります。この読み仮名を削除するオプションです。

画面に表示できる文字数もそれほど多くないので、削除するオプションを作ってみました。 

人名、企業名、映画名の項目を削除

これは完全に個人的な主観なのですが、英語の本を読んでいて、これらの項目を検索することはないだろうという、独断と偏見で追加したオプションです。

好みでチェックをはずしてください。

非アルファベットで始まる語を削除

数字で始まる語や、"-able" のように、語尾の説明などは kobo の辞書機能では検索されないので、その項目を削除するオプションです。

特に理由がなければチェックを入れてください。

 

やっつけで作ったので、異常系は手抜きになっています。意地悪な操作はしないでくださいねあっかんべー

生成された Kobo.tgz は Kobo を USB につなげると認識されるドライブの .kobo ディレクトリにコピーしてください。USB 接続を外すとアップデートが実行されます。

12/09/13 追記: 生成された Kobo.tgz は F/W v2.1.1 専用です。v2.0.x では使えませんのでご注意ください。

 

ちょっと駆け足で説明したので分かりづらくてすいません。

一応軽く確認はしていますが、試す際は自己責任でお願いします。

辞書を戻すには工場出荷時に戻すしか方法がないので、リセットしてもいい人だけお試しください。

そんなわけで人柱大募集です。 試してみた方は動作報告をいただけるとありがたいです。

kobo touchで英和辞書 リターンズ

えー、先日のアップデートで使えなくなった英和辞書ですが、ついカッとなってバイナリハックしてしまいました。もう、意地で。

その結果、とりあえず辞書の差し替えに成功したので v2.1.1 用の辞書を置いておきます。

語彙等の辞書データは前回の wordnet の辞書と全く同じです。

v2.1.1 でも英和辞書
v2.1.1 ファームでも英和辞書 

案の定、辞書データは暗号化されていました。

もともと平文だったファイルを暗号化したという経緯から、楽天は kobo 内部の辞書データにはアクセスして欲しくないという思いを持っていると思いますので、暗号化の形式などの詳細は非公開にしたいと思います。

 暗号化情報の公開によって、暗号化方式の変更を余儀なくされ、無駄に Kobo 社のマンパワーが使われてしまうのは本意ではありませんので。もっと改良や改善といった方向にエネルギーを使ってほしいですからね。

 

英辞郎用コンバータですが、完成したとしても、上記理由でクローズドソースでリリースすることになると思います。本当は、趣味で作ったプログラムはできるだけオープンソースにしたいんですけどね・・・。

おかげでまた英辞郎コンバータは完成まで遠のいてしまいました・・・。気を長くしてお待ちください。 

kobo で英和辞書が使えなくなった

先日作ったkobo 用英和辞書ですが、それなりに好評でブログに取り上げていただいたり、お礼のコメントまでいただきました。

使っていただいたみなさま、ありがとうございました。

 

その英和辞書ですが、残念ながら先日 kobo のファームアップデートで使えなくなってしまいました。  

原因は辞書フォーマットの変更です。以前は html ファイルを gzip で圧縮したものが辞書ファイルとして使われていたのですが、v2.1.1 では全く知らないファイル形式になっていました。

ファイルサイズはほとんど変わっていないので、圧縮の方式を変えたと言うよりは、暗号化の意味合いが強いのではないかと予想しています。

仮に暗号化したとすると、 ライセンス料を払っている辞書データを抜かれたくない or 辞書データの提供側から暗号化をリクエストされた、というのが対応目的ではないかと思います。

暗号化となると解析はかなり困難ですので、新しいファームウェア用の英和辞書は作れない可能性が高いです。英辞郎用のコンバータもチビチビと作っていたので、一応無駄あがきはやってみるつもりですけども。

こうなったらオフィシャルで英和辞書に対応してもらうしかないですね

kobo touchで英和辞書

—-2012/09/01追記ここから—- 

この記事はファームウェア v2.0.2 の頃のものです。v2.1.1 ではこの英和辞書は使えなくなっています。

—-2012/09/01追記ここまで—-  

kobo Touch には英英辞書、国語辞書、英独辞書など、いくつかの辞書が入っています。ただ、日本語がからむものとしては国語辞書しかありません。

英語が苦手な私にとっては、洋書を読むには英和辞書は必須です。個人的に一番使いたいのは英和辞書なので、なんとか英和辞書が使えるようにならないか試行錯誤してみました。

その結果、英英辞書の内容を差し替えることで英和辞書が使えるようになりました!

 kobo touch で英和辞書!!

とりあえず簡単に試せるパッケージを作ってみました。動作保証は出来かねますので最悪工場出荷に戻してもいい人だけ試してください。

また、この英和辞書は WordNet のフリーな辞書データを使用している関係上、日本語が登録されていない単語もあります。あまり過剰な期待はしないでください。

適用すると英英辞書と差し替えますので、英英辞書は使えなくなるのでご注意ください。

2012/09/01追記:  v2.0.2 用です。v2.1.1 では使えませんのでご注意ください。 

zipファイルを展開すると Kobo.tgz が入っていますので、Kobo touch を PC に接続して認識されるドライブの .kobo ディレクトリにコピーしてください。

kobo Touch を PC から切断するとアップデートが開始されます。

元の英英辞書に戻すには工場出荷時に戻す必要があります。

 

さて、この英和辞書ですが、上でも書いたとおり、フリーな辞書データを使っています。辞書データの取り出しには、以下のサイトのスクリプトを使わせて頂きました。いじったスクリプトは整理して公開するつもりです。

細かいことはよくわかりませんが、WordNet, 日本語WordNet というプロジェクトの成果物としてフリーの英和辞書が作れるようです。

また、上記ブログにも書かれていますが、単語の意味は日本語が表示されますが、例文は英語のものが表示されます。そのあたりも上記ブログと同じです。 (というよりいじり方が分からなかった :p)

 

辞書の形式ですが、辞書ファイルは本体の /usr/local/Kobo/dicthtml-* に置いてあります。英英辞書は dicthtml, 国語辞書は dicthtml-ja と言った感じです。

dicthtml 以下には

  • aa.html
  • ab.html
  • ac.html

といったように単語の頭文字2文字ごとにファイルが用意されています。拡張子は html となっていますが、実際は gzip された html です。

html ファイルの中身は実際に覗いてみたほうが早いので割愛します。<w>タグで1単語ずつ区切られています。

また、dicthtml ディレクトリには *.html ファイルの他に words という単語のデータベースファイルがあります。

これは marisa 用のデータベースだそうです。marisa 自体初めて知りました。

*.html ファイルに存在する語を1行1語としたファイルを作り、以下のように marisa-build コマンドに入力することで words ファイルを生成することができます。marisa-build コマンドは marisa をビルドすると tools/ 以下に生成されます。

$ cat word-list.txt
A
A battery 
A horizon
      :
      : 
$ ./marisa-build < word-list.txt > words

ちょっと駆け足でしたが、こんな感じで辞書データを差し替えることが可能なようです。

英辞郎の辞書が使えれば完璧なんですが、試したら容量が大きくて kobo 本体に入りませんでした。 ある程度間引くなどの工夫が必要みたいです。もう少し試してみます。

Kobo 用のシリアルコネクタ作成

今回は kobo Touch にシリアルを繋げるためのコネクタを作りました。

直接ハンダ付けしてしまってもいいんですが、裏蓋を閉めて使うことも考えると簡単に脱着できたほうがいいかなと思い、 コネクタを作ることにしました。

本当はストロベリーリナックスのスルーホールテストクリップが欲しかったんですが、ちょっと高いので・・。

参考にしたのは以下のページ。

ハンダ付けしやすい金属で、比較的弾性が強い順として洋白線、燐青銅線、真鍮の順らしいので、これらの 0.3mm の線材を買って来ました。

燐青銅線、真鍮線
真鍮線(上)と燐青銅線(下2本)

洋白線は在庫切れで売っていなかったので、燐青銅線と真鍮線 (ともに0.3mm) を買って来ました。

これを折り曲げて作ったのがこちら

自作コネクタ
自作コネクタ

燐青銅線で作ってみました。

こんな感じで装着します。

コネクタを装着
コネクタを装着

とりあえずはいい感じで満足です。

ただ、思っていたよりバネが弱く、数回抜き差しすると緩んでしまいそうです。ちょっと様子見ですね。

これで裏蓋さえ開ければ手軽にシリアルデバッグができるようになったので、本格的にいじってみようと思います。