フリーのかな漢字変換辞書たち
いわゆる「かな漢字変換システム」に用いる事ができる、
フリーの(あるいはパブリックドメインの)辞書のリンク集です。きちんと
校正されたものから、かなりいい加減なものまで玉石混淆です。
時間の都合上、この一年ほどはまともにメンテナンスできていません。
また今後しばらくはその予定もありません。
ご利用の際には、その旨、悪しからずご了承下さい。(1999/9/18)
INDEX
- はじめに
- 辞書たち
- フォーマット変換フィルタ達
- リンク集
- ページ作者のつぶやき
Since: Sun Nov 2 10:43:55 1997
Last Refreshed: Sun Jan 18 19:15:34 JST 2004
ワークステーション上で動作するかな漢字変換システムには
各種ありますが、その中でも代表的な Wnn (Wnn4) の変換効率は、
一般に「バカ」と言われることが多いです。
しかし、これは実際には標準で付いてくる辞書、すなわち pubdic の
単語数が少ないためにバカなように見えるだけで、
巷で言われているほどバカなシステムじゃないのです。
こう言われるのはたいへん悲しいことです。
そこで、ユーザが辞書を強化するための起点として、
このページを作ってみました。デフォルトのWnn4の変換パラメータを
より現実的な値に変更し、
さらにこのページに従って辞書を強化すれば、
より使いやすいシステムになる事は間違いないものとおもいます。
ここに集めたものは、自分の使っている「かな漢字変換システム」用に
利用者が適当にフォーマット変換して個人的利用の範囲内で使うことには
問題はないものばかりだとおもいます。
中にはいわゆるパブリックドメインを宣言しているものもありますし、
作者がメンテを放棄した(時間的都合などでね)ようなものもありますし、
明示的に著作権を主張しているものもあります。
いきなり作者に連絡しちゃったりすることは
先方の迷惑になりかねませんから、可能な限り避けてください。
実際に使用する前には、
必ず それぞれの辞書の利用条件を読んで下さい。
もちろん、それぞれの辞書の利用条件は違うんですが、
基本的に内容については無保証と考えてください。
つまり、利用者の責任で利用してください、と言うことです。
Wnn4 で使うことが前提になっていますが、
パソコン上で動作する他のかな漢字変換システム(ATOK, MS-IME など)
への変換方法も、可能な限りはフォローしたいと考えています。
できれば、これさえあれば各種FEP間の相互フォーマット変換は万全、
というツールがあれば良いのですが。(自分で作れって? :-P)
なお、ここからのリンクは、
glossary 的な辞典の類は含んでいません。
集め出すとキリがないし、個人的にはあまし興味もないからです。
そういうのはサーチエンジンででも調べてね。
以下のリストの順番は、かなりムチャクチャです。
分野別の分類などは何もしていません
(趣味系のは後ろの方に持ってきてはいますが)。
まだあまり数がないし、そもそも分野が片寄っている段階で
分類してもしょうがないとおもうからです。
もっと集まったら自然に分類できるようになるでしょう。
| 名称: |
日本語形態素解析システムJUMAN附属辞書 |
| URL: |
http://pine.kuee.kyoto-u.ac.jp/nl-resource/juman.html |
| 作者(編者): |
京都大学工学部長尾研究室 |
| 語数: |
231985語 (JUMAN-3.4) |
| ファイル形式: |
独自形式 |
| 利用条件: |
フリー (研究利用目的の場合) |
| 解説: |
基本的にICOT辞書を元に改良したもの(詳しくは
doc/manual.tex 参照)だが、JUMAN3.0
以降の標準辞書の一部は,日本電子化辞書
研究所(EDR)の日本語単語辞書を基にして京都大学で修正を加え
たものらしい。EDR辞書は有料であるので、利用に当たっては使
用説明書の最初にある許諾条件の説明に注意すること。 |
| 入手方法: |
オリジナルサイトからダウンロード
|
| 名称: |
pubdic+ 補遺 (私家版 えんどうさん) |
| URL: |
http://www.remus.dti.ne.jp/~endo-h/wnn/ |
| 作者(編者): |
えんどう 氏 (endo-h@remus.dti.ne.jp) |
| 語数: |
約27,368語(ver.1.14) |
| ファイル形式: |
Wnn4テキストファイル形式 |
| 利用条件: |
フリー |
| 解説: |
一般性の強い語句を中心に、
カタカナの語句を追加したもの。
着実にメンテナンスされているので信頼性はたいへん高い。
一度見ておいて損はないとおもう。おすすめ。 |
| 入手方法: |
オリジナルサイトからダウンロード
|
| 名称: |
pubdic+ 補遺 (私家版 狩野@わせださん) |
| URL: |
http://www.remus.dti.ne.jp/~endo-h/wnn/ |
| 作者(編者): |
狩野@わせだ 氏 (g92k0323@mn.waseda.ac.jp) |
| 語数: |
約5800語 |
| ファイル形式: |
Wnn4テキストファイル形式 |
| 利用条件: |
フリー |
| 解説: |
pubdic+ の公開以降、狩野@わせださんが集めた単語と、他の方
から contribute のあった単語を登録順でそのまま収録したもの。
狩野@わせださんは pubdic+ の校正の中心メンバーの一人なので、
その内容は基本辞書としては充分信頼できるとおもう。 |
| 入手方法: |
オリジナルサイトからダウンロード
|
| 名称: |
もなもなのかな漢辞書 |
| URL: |
http://www.isoternet.org/~monaka/KanaKanDic/ |
| 作者(編者): |
もなもなもなか (邑中 雅樹) 氏 (mailto:monamour@monaka.org) |
| 語数: |
|
| ファイル形式: |
sj3形式、一部 pubdic 形式 |
| 利用条件: |
GNU General Public Licence Version 2 |
| 解説: |
いろいろある。SKK辞書をベースに品詞付けをしたものなど。
ISASのページがずっと閉鎖されていたので悲しかったのだが、
別のページに移って再開してくださったようだ。
(2000/?/?: 再度移転) |
| 入手方法: |
オリジナルサイトからダウンロード
|
| 名称: |
gerodic (人名に関する固有名詞辞書) |
| URL: |
なし |
| 作者(編者): |
gerodic プロジェクト (現在は終了) |
| 語数: |
23345語 |
| ファイル形式: |
Wnn4テキストファイル形式 |
| 利用条件: |
フリー |
| 解説: |
Wnnコンソーシアムのテクニカルコミティの活動の一つとして行
なわれたgerodic プロジェクトの成果物。
Wnn4.109(1993年7月リリース)以降のパッケージにも含まれている。 |
| 入手方法: |
えんどう 氏のサイトから入手するのが良いだろう。
ftp.wg.omron.co.jp からダウンロード
|
| 名称: |
SKK形式辞書 |
| URL: |
http://openlab.ring.gr.jp/skk/index-j.html |
| 作者(編者): |
佐藤 雅彦 京都大学教授 |
| 語数: |
約15万語 |
| ファイル形式: |
SKK形式 (読みと漢字だけ、品詞無し) |
| 利用条件: |
GNU General Public Licence Version 2 |
| 解説: |
混ぜるべきかどうか少し考えたが、まあ良いだろうとおもって入れた。
語彙数が多く特に複合語に強いのは良いのだが、品詞情報が無いので、
Wnnその他の通常のかな漢字変換システムで用いるのには若干問題がある。
もっとも、割りきって使えなくもないだろう。 |
| 入手方法: |
オリジナルサイトからダウンロード
|
| 名称: |
Canada式 医学用語変換辞書 |
| URL: |
http://spica.onh.go.jp/med_dic/ |
| 作者(編者): |
Yasuhide CANADA 氏 (y-canada@onh.go.jp) |
| 語数: |
約6万5千語 |
| ファイル形式: |
MS-IME2000、98、97システム辞書、Canna 3.2p2(FreeBSD(i386))、Canna 3.5b2(Debian(i386))バイナリ辞書 |
| 利用条件: |
無償(一部条件付再配布可) |
| 解説: |
医学・医療全分野の用語を広く収録していますので、
医学研究者・医療関係者等の方々の医学・医療関連文書作成が
効率善く行なえます。また、多くの病院情報システムで実稼働しており、
安心して御使用頂けます。
|
| 入手方法: |
オリジナルサイトからダウンロード |
| 名称: |
me-dic (医学用語辞書) |
| URL: |
なし |
| 作者(編者): |
くにたか@あすろ 氏 (hi@asro.csk.co.jp) |
| 語数: |
約1万語 |
| ファイル形式: |
ATOK7用一括登録辞書形式 |
| 利用条件: |
フリー |
| 解説: |
ASCII-NET/PCS の pool pdd というところに登録されていた
【1万語医学用語拡張辞書】の中のigaku.lst 医学用語辞書を
抜き出したもの。 |
| 入手方法: |
ftp.wg.omron.co.jpからダウンロード
ミラーサイトからダウンロード(京大宇宙物理) |
| 名称: |
chibutsu (地球惑星物理辞書) |
| URL: |
http://www.chibutsu.org/jisho/ |
| 作者(編者): |
地球物理辞書編纂グループ
問い合わせ先: aic@chibutsu.orig |
| 語数: |
6130語(2001/2/2現在) |
| ファイル形式: |
Wnn4 テキスト形式、その他多数 |
| 利用条件: |
フリー |
| 解説: |
一般の辞書に入っていない、または実用にならないくらい頻度が
低くなっていて不便な地球物理に関連する用語や重要な人名など
をサポート。1997年7月に fj.sources に投稿された。 |
| 入手方法: |
オリジナルサイトからダウンロード |
| 名称: |
正字正かな辭書ファイル「THn.DIC 2.0」 |
| URL: |
http://www.vector.co.jp/authors/VA013051/index.html |
| 作者(編者): |
debugger@sheep.net0726.or.jp 氏 |
| 語数: |
52521語 |
| ファイル形式: |
ATOK11 for Macintosh, テキスト形式 |
| 利用条件: |
フリー(GPL相当) |
| 解説: |
「總收録單語數52521(名詞31825、固有名詞12331、動詞6866、
形容詞572、其の他927)といふ、泣く子も默る規模のシロモノ
であり、研究でコンピューターを利用する國文學者にとって、
またとない強力な武器となりうると、自負してをります。」
とのこと(作者談)。 |
| 入手方法: |
オリジナルサイトからダウンロード
|
| 名称: |
h-dic (北海道辞書) |
| URL: |
なし |
| 作者(編者): |
北海道辞書作成メーリングリスト (h-dic@cs.titech.ac.jp) |
| 語数: |
1040語 |
| ファイル形式: |
Wnn4形式 |
| 利用条件: |
フリー |
| 解説: |
北海道に関する言葉を集めた辞書。 |
| 入手方法: |
ダウンロード
ミラーサイトからダウンロード(京大宇宙物理) |
| 名称: |
i-dic (アイドル辞書) |
| URL: |
http://i-dic.dorachan.com/ (正式なものはないらしい) |
| 作者(編者): |
i-dicメーリングリスト (i-dic@nttfgw.ntt-f.co.jp) |
| 語数: |
15248語 (i-dic-9710a) |
| ファイル形式: |
i-dic形式 |
| 利用条件: |
フリー (パブリックドメインに置くものとする、とのこと) |
| 解説: |
主として女性アイドルの姓名を集めたかな漢字変換用辞書/人名辞典。
かなり改版が速いようだ。(^_^;) |
| 入手方法: |
最新版の入手先は、
% echo "#guide" | mail i-dic@nttfgw.ntt-f.co.jp
して自動返送されてくるメールの中にftpサイトが書いてある。 |
| 名称: |
okinawa-dic-2.5 (沖縄辞書) |
| URL: |
http://www.ryukyu.ad.jp/~shin/o-dic/ |
| 作者(編者): |
沖縄辞書メーリングリスト (o-dic@mb.inforyukyu.or.jp) |
| 語数: |
2383語 (okinawa-dic-2.5) |
| ファイル形式: |
独自形式(?)、各種FEPへの変換スクリプト付き |
| 利用条件: |
フリー (パブリックドメインに置くものとする、とのこと) |
| 解説: |
沖縄関係の人名・地名はほとんどの市販の漢字変換用の辞書には
載っていないらしいので、沖縄で仕事をする場合には必須? |
| 入手方法: |
オリジナルサイトからダウンロード
|
| 名称: |
P-dic-4.0 (プロレス用語辞書) |
| URL: |
http://www.suplex.gr.jp/~hourin/P-dic/ |
| 作者(編者): |
P-dicメーリングリスト (p-dic-request@cactus.slab.ntt.jp) |
| 語数: |
10008語 (P-dic-4.0) |
| ファイル形式: |
i-dic第2版形式+独自拡張 |
| 利用条件: |
フリー (パブリックドメインに置くものとする、とのこと) |
| 解説: |
主に日本の団体に所属している(していた)プロレスラーおよびプ
ロレス関係者の人名、さらにプロレス技などのプロレス固有の用
語の読みと表記を集めたもの。 |
| 入手方法: |
オリジナルサイトからダウンロード
|
| 名称: |
s-dic1.0 (お相撲辞書) |
| URL: |
なし |
| 作者(編者): |
田中 淳裕 氏
(omochi@meip7.t.u-tokyo.ac.jp) |
| 語数: |
1043語 |
| ファイル形式: |
i-dic 形式 (Wnn4形式変換スクリプト付き) |
| 利用条件: |
フリー |
| 解説: |
・幕内力士 (千代の富士以降の幕内力士)
・横綱全て,昭和の大関 ・全親方
・相撲に関わりのある人々 (アナウンサーや解説者)
・決まり手等の用語 を集めたもの。 |
| 入手方法: |
ftp.wg.omron.co.jpからダウンロード
ミラーサイトからダウンロード(京大宇宙物理) |
| 名称: |
metal-dic (ヘヴィメタル辞書) |
| URL: |
なし |
| 作者(編者): |
金子@図研(金子 敏彦)氏 (kaneko@zuken.co.jp)
ヘヴィ・メタル辞書ML (metal-request@zuken.co.jp) |
| 語数: |
|
| ファイル形式: |
独自形式 (変換スクリプト付き) |
| 利用条件: |
フリー |
| 解説: |
曲目リストと附属ツールからなっているヘヴィ・メタル、
ハード・ロックの音楽辞書 |
| 入手方法: |
ftp.wg.omron.co.jpからダウンロード
ミラーサイトからダウンロード(京大宇宙物理) |
| 名称: |
東京女子高制服辞書 |
| URL: |
|
| 作者(編者): |
塚本 高之 氏 |
| 語数: |
3500 エントリ前後 |
| ファイル形式: |
Wnn4形式 |
| 利用条件: |
フリー |
| 解説: |
「いかん。何処の制服だか識別出来ーん。しくしくT_T」(作者談)
という方向け、かなあ。たぶん。 |
| 入手方法: |
ダウンロード
ミラーサイトからダウンロード(京大宇宙物理) |
以下は未整理... _o_
えっち・へんたい(えっへん)辞書
http://www.sf.airnet.ne.jp/kurasiki/ehhen.html
ATOK形式かとおもっていたのだが、どうやらWH形式というものらしい。
編者の方から連絡頂きました。(_o_) ううむ初めて聞くFEP(IME)だ。
==== 引用ここから
WHシリーズについて
この辞書はOS/2ワープに標準でついてくるWH/2というIME用に
作りました。WHシリーズはIBMの製品で、なんかよくわからない
原理(笑)により、高い変換精度を実現したらしいです。
「WHシリーズ」と言う通り、WHを冠した製品はいくつかあります。
私が知っているのは、Windows用の「WH」、OS/2WarpV3に付属の「WH/2」、
そして現在のOS/2WarpV4に付属する「WH/IM32」です。
WHとはライティングヘッドの略だそうです。
そして、えっちへんたい辞書自身はWH/2上で編纂を開始し、現在は
WH/IM32上で続けています。
えっへん辞書にはテキストファイルも付属しますが、いまのところ他の
辞書との互換性がないので、他のIMEを使っている方にはあまりおやくに
たたないかもしれません。
しかし、こちらで紹介されていることをしり、いくつかの辞書にコンバートする
決心をしました。いつになるかは定かではありませんが、長い目で見守って
やって下さい。
==== 引用ここまで
さだまさし辞書
http://www.mt.cs.keio.ac.jp/person/morimori/massan/massan.html
によるとメーリングリストメンバーならもらえるのでは?
番外: 通信用語の基礎知識 '98 第1版
読む分には結構おもしろい。かな漢字変換辞書としてはちょっと使えない
かもしれないのでこのページの主旨には合わないんだけど、以前『使える
かも』ということで載せていたんで、紹介しておきます。
(情報ありがとう>やす@札幌さん)
などから入手できます。
ちゃんとまとめてリンクとか張りたいけど、しばらくはこのままかな...
情報歓迎っす。
Wnn4(UJIS), Canna, SJ3, pubdic,
I-dic, r-dic,
ATOK?, MS-IME95, MS-IME97, NEC-IME, WX2, WXG, VJE, 松茸, その他...
各種パソコンFEPの一括登録フォーマット形式は、それぞれ異なる。
mdic (少女漫画家辞書)のドキュメントから引用すると、
> WX3・ラリイォ 読み[TAB]"単語":固有名詞
> WXP 読み[TAB]単語:固有名詞
> VJE-β 読み[TAB]単語[TAB]【人名】
> OAK 読み[TAB]単語[TAB]4(名前として登録)
> (注:「i 登録単語ファイル V01.00」というヘッダが必要。)
> ASK V3.0 読み,単語,人名(名),28
> ATOK7・ク 読み(片仮名),単語,02(固有名詞として登録)
> 松茸V3 読み(片仮名),"単語",人名
> DFJ 読み(片仮名),単語,ユーザー人名
> FIXER 読み(片仮名)[TAB]単語[TAB]*SL名詞(姓)
とのこと。あとは、新しいところ (ATOK9/10/11, MS-IME 95/97,
NEC-AI-IME など) を調べなアカン。
- Wnn 形式からパソコンFEP形式への変換は ldic-1.03 が
良くできていて感心した。残された課題は逆方向への変換かな。
- pubdic 附属の pod は pubdic 形式からの変換だけだからなあ。
- i-tools-4.1 こいつのドキュメントもしっかり書いてある。
もっと新しいのがあるとおもうんだけど、見当たらないなあ。
- s-dic_6.11 (せらむん辞書)の中に utilというディレクトリが
あり、ここにも結構詳しく書いてある
- rits100 (r-dic information tool set) にも詳しい。
- g-dic, k-dic, s-dic(相撲) などにもある。
- jisyo-tools SKK用辞書ユーティリティ
以下は、このページを作成した 1997/11月当時の戯言です。念のため。
インターネット上では、ここまで網羅的に辞書を集めたページは
他にはないんじゃないかなあ。
でも、僕はいわゆるパソコン通信やBBSの類には加入していないので、
そういう方面からの情報が欠落しているものとおもわれます。
しばらくは更新を続けて、ある程度網羅的なリンク集にしたいので、
情報は歓迎します。
趣味的なものについては、例えば名字だけ入れると姓名とも出るとか、
そういうのも混ざっているものが多い。辞書という事にこだわるなら
そういうのは除けた方がいいんだろうね。
特に、そういうのは基本辞書としては使えないね。
もっとも、お遊びとしては楽しいのでそういうのはアリだとおもう。
今回の辞書探しで一番辛かったのは、デッドリンクが多かったことかな。
例えば、やっと見つけたとおもった代数幾何学辞書は実はデッドリンクでした。
また、明らかに学生のホームページに置いてあるとおもわれるリンクは
404 Not Found になることがシバシバでした。
収集した結果を見ると、ビジネス・政治・経済・法律関係の辞書が
非常に少ないのが不可解です。
国会議員人名辞書とか、誰かが作ってもおかしくないのにそういうのが
無かったのは、単にweb上に無かっただけなんでしょうか。
(1999/1/21補足)でも、
法律用語電子化辞書 LKKS というものができたりしたので、
ここでウダウダゆってたことも、まんざらムダではなかったという
ことになるのでしょうか?:-)
しかーし、うーん、疲れました(T_T)。
やっぱ、しばらくは探さないでください(爆)。
このページへのリンクは、それが個人的になされる限りにおいては、確認無し
に御自由になさって頂いて構いません。ただし、雑誌記事等の商業出版物に掲
載する場合には(それがURLのみの紹介であっても)必ず御一報下さい。
Hajime BABA / 馬場 肇 <baba.hajime@nifty.com>
Copyright (C) 1995-1999 Hajime BABA. All rights reserved.
$Id: index.html,v 1.2 2006/01/18 10:46:20 baba Exp $