summaryrefslogtreecommitdiff
path: root/alt-cannadic/orig-README.ja
blob: 2a21db661c657ff425c18733708e64a19fcc023e (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
かんな辞書 cannadic

'cannadic' is a Japanese kana-kanji conversion dictionary for Canna (and Anthy,
PRIME). This dictionary has been compiled as a supplement/replacement to the
dictionaries distributed with Canna3.5b2 or later. Currently the main
dictionary and suffix- and prefix-dictionaries contain over 140000 words.

[配布物内容]

cannadic-0.95c.tar.gz

README.ja
    このファイルです。
COPYING
    ライセンスを記述した GNU GENERAL PUBLIC LICENSE です。
gcanna.ctd
    自立語辞書です。
gcannaf.ctd
    付属語辞書です。
Makefile
    インストール用 Makefile です。
convert-old-cannadic.pl
    古いバージョンのかんなの品詞分類に対応するためのスクリプトです。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[辞書への単語収録について]

かな漢字変換のベースになる辞書として FreeWnn 収録の辞書(pubdic+, gerodic)を採用
しました。また、これ以外に下記の辞書から単語を抽出・追加しました。

 ・ FreeWnn (http://www.freewnn.org/) 付属辞書(pubdic+, gerodic)収録単語のほと
    んど。
 ・ kakasi (http://kakasi.namazu.org/) 付属辞書から名詞を抽出したものの一部。
 ・ 図書館関連単語辞書 ldic (http://www.tulips.tsukuba.ac.jp/misc/export/cat/
    ldic/) に収録単語のほとんど。
 ・ 池田勇氏提供の医学用語辞書のほとんどすべて。

くわえて、編纂者が新規単語を逐次追加しています。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[バージョン履歴]

version 0.90 - 2000-05-17
    ドキュメント整理および辞書再構築して、GPL 版としてリリース。
version 0.91 - 2000-06-13
    kakasi 付属辞書単語をお手軽スクリプト + 人力で品詞分類して大量追加。自立語
    辞書、付属語辞書の分離。
version 0.92 - 2001-02-13
    日常利用で不足した単語の追加。いろいろと誤字修正。バイナリ辞書化ドキュメン
    ト追加。
version 0.93 - 2002-01-12
    サイト引越し。誤字指摘単語修正。単語追加。品詞分類見直し。変換候補表示順設
    定。README 変更。
version 0.93a - 2002-01-14
    Makefile と README 修正。わずかな単語追加。品詞分類見直し。
version 0.94 - 2002-02-19
    単語追加。品詞分類見直し。付属語辞書口語拡張。
version 0.94a - 2002-02-28
    いくつかの誤字単語の修正。単語追加と品詞分類見直し。さらなる口語拡張。
version 0.94b - 2002-03-10
    http://www.sekimizu.net/ で指摘されている pubdic+ 由来の誤字修正。
version 0.94c - 2002-07-05
    飯田昌成さん寄付の単語追加。anthy-3100 の情報反映。その他単語追加と頻度情報
    見直し。
version 0.94d - 2002-09-04
    約1000語追加。頻度情報見直し。anthy-3222 の情報反映。自立語辞書収録単語数が
    140,000語を越える。
version 0.94e - 2002-10-20
    T??系自立語の別分類重複語削除および品詞分類見直し。約2000語追加。anthy-3403
    の情報反映。
version 0.94f - 2002-11-26
    [Canna-dev 85], anthy-3525, Vine Linux cannadic-0.94e.wrongword.patch の情
    報反映。
version 0.94g - 2003-02-24
    約500語追加。[Canna-dev 165], anthy-3822 の情報反映。Teruo YAMAWAKI さん、
    井汲景太さん、komura さん、Yu OOASA さんからの誤字情報反映。J. Grant さんか
    らの英文修正情報反映。
version 0.94h - 2003-04-25
    約200語追加。anthy-4023 の情報反映。伊藤竜太さん、中島幹夫さん、H N さんか
    らの誤字情報・新語情報反映。
version 0.95 - 2003-07-07
    約1000語追加。anthy-4229 の情報反映。H N さん、井汲景太さんからの新語情報反
    映。テキスト辞書拡張子変更(.t → .ctd)。
version 0.95a - 2003-09-15
    約1000語追加。anthy-4515 の情報反映。SUWA Yoshikazu さん、高橋仁さん、H N
    さん、中井幸博さんからの新語・誤字情報反映。
version 0.95b - 2004-04-01
    約800語追加。anthy-5122 の情報反映。中井幸博さん、H N さん、小松弘幸さん、
    高橋仁さんからの新語・誤字情報反映。
version 0.95c - 2004-11-27
    約400語追加。anthy-5924 の情報反映。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[インストール]

ここではパッケージ管理システムを利用しないソースコードからのインストール方法を
解説しています。パッケージ管理システムを使ったインストールについては Gentoo
Linux, FreeBSD ports、MacOS X fink などが提供するドキュメントにしたがってくださ
い。いくつかの Linux ディストリビューション(Vine Linux, Plamo Linux など)では
cannadic がデフォルト辞書として組み込まれています。この場合、既存辞書を上書きす
ることになります。いままでの辞書の頻度情報が失われてしまうので注意してください
。

OS やディストリビューションによって、かんな辞書のインストールディレクトリが異な
っています。辞書ファイルが格納されているディレクトリは

 ・ /usr/local/canna/lib/dic/canna/ (デフォルト設定でコンパイルした場合)
 ・ /var/lib/canna/dic/canna/ (Vine Linux, Debian GNU/Linux など)
 ・ /usr/local/lib/canna/dic/canna/ (FreeBSD など)
 ・ /var/dict/canna/canna/ (NetBSD, OpenBSD など)

などになっています。以下、/usr/local/canna/lib/dic/canna/ にシステム辞書ファイ
ルが存在し、 cannaserver, cannakill が /usr/local/canna/bin/ に存在するものとし
て作業を進めます。自分の環境での辞書ファイルや設定ファイルの格納ディレクトリは
各自で調べてください。

canna3.5b2 より前のバージョンの canna では本辞書の付属語辞書は使えません。これ
は canna3.5b2 以降で拡張された品詞分類を採用しているためです。 canna3.5b2 より
前のバージョンの canna に本辞書を導入する場合は付属語辞書に関する部分は作業対象
外にしてください。

接続中のかんなクライアントが存在すると辞書のインストールに失敗することがありま
す。インストールの前に emacs や kinput2 などのかんなクライアントを終了してくだ
さい。

まずはテキスト辞書からバイナリ辞書を作成します。

$ gzip -dc cannadic-0.95c.tar.gz | tar xf -
$ cd cannadic-0.95c

Canna3.5b2 以降のバージョンの canna を使っている場合
$ make maindic

Canna3.5b2 より前のバージョンの canna を使っている場合
$ make maindic-old-version

注意. Canna3.6p1 以前のバージョンの mkdic コマンドには以下に示す辞書作成上の問
題があります。

 ・ mkdic コマンドはテキスト辞書作成時に文字コード順で単語をソートします。

このため、本辞書が想定している変換候補順初期情報が無効になります。日本語かな漢
字変換システムの動作そのものには影響ありませんが、インストール直後の変換効率が
非常に低下します。この問題を回避するためには crxdic と crfreq コマンドをそれぞ
れ単独で使ってバイナリ辞書を作成してください。付属の Makefile はそのようになっ
ています。

できあがったバイナリ辞書ファイルをかんな辞書ディレクトリにコピーし、パーミッシ
ョンと所有権を設定します。 OS やディストリビューションによっては所有者は bin で
はなく root や canna などになっているかもしれません。適切な所有者を設定してくだ
さい。

(作業は root 権限で)
$ su
(かんなサーバ停止)
# /usr/local/canna/bin/cannakill
(自立語辞書ファイルコピー/所有者設定/パーミッション設定)
# install -o bin -g bin -m 0664 gcanna.c[bl]d /usr/local/canna/lib/dic/canna/
(付属語辞書ファイルコピー/所有者設定/パーミッション設定)
# install -o bin -g bin -m 0664 gcannaf.ctd /usr/local/canna/lib/dic/canna/

辞書登録ファイルの /usr/local/canna/lib/dic/canna/dics.dir に以下の3行を追加し
ます。 cannadic-0.95 よりテキスト辞書の拡張子が ".t" から ".ctd" に変更されたの
で注意してください.

gcanna.cbd(gcanna.mwd) -gcanna---
gcanna.cld(gcanna.mwd) -gcanna---
gcannaf.ctd(.swd) -gcannaf---

cannaserver を再起動します。

(かんなサーバ再起動)
# /usr/local/canna/bin/cannaserver

ユーザ権限に戻って、ホームディレクトリに存在する各ユーザの .canna の
(use-dictionary ...) の部分に "gcanna", "gcannaf" の2行を付け足してください。抜
粋するとこんな感じです。

(use-dictionary
 "gcanna"   ; ←自立語辞書はこの行を追加
 "gcannaf"  ; ←付属語辞書はこの行を追加
 ;;"iroha"  ; ←上位互換なのでこの行をコメントアウトします
 "fuzokugo"
 "hojomwd"
 "hojoswd"
 :bushu "bushu"
 :user "user"
 )

変換結果を学習させるためにユーザごとに頻度辞書を作成します。既に同名のユーザ辞
書がインストールされている場合、辞書を上書きするかどうか質問されます。古い頻度
辞書のままでは変換がうまくいかないので、必ず yes を選択して上書き作成してくださ
い(ただし、いままでの頻度情報は全てリセットされます)。

$ mkdic -fq gcanna
Personal learning file of dictionary "gcanna" exists. Do you overwrite it ? (y/n)

なお、変換時に難しい単漢字が変換候補の前の方に出てきて、変換効率が悪くなってい
ると感じる場合、 :bushu "bushu" をコメントアウトすることで状況がいくぶん改善さ
れます。ただし、部首変換は利用できなくなりますので、各自の好みにあわせて設定し
てください。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[ライセンス]

配布および利用にあたってはいかなる保証も行ないません。ライセンスは辞書のベース
となった FreeWnn と同様に GPL にしたがいます。詳細については付属の COPYING ファ
イル(英語)をお読みください。 GNU General Public License(日本語訳) はこちら -
http://www.gnu.org/philosophy/license-list.ja.html

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[謝辞]

まずなによりかんなを開発し、フリーソフトウェアとして公開してくださった関係者各
位に感謝します。また、各種フリー辞書情報を編纂してくださった馬場肇さんに感謝し
ます。

 ・ フリーのかな漢字変換辞書たち - http://www.kusastro.kyoto-u.ac.jp/%7Ebaba/
    dic/free-dic.html

そして、各種辞書を GPL または public domain として公開してくださったみなさまに
感謝します。そして、以下の方々に誤字単語の御指摘や設定情報のアドバイスをいただ
きました。ありがとうございます。

 ・ 池田勇さん
 ・ 奥山倫さん
 ・ George さん
 ・ たぶち@Kondara Project さん
 ・ 戸川聡士さん - FreeBSD ports 化
 ・ 広瀬雄二さん
 ・ Project Anthy 田畑悠介さん
 ・ Yasuhiro Ohta さん
 ・ カナダ@関西医大さん
 ・ 平原貴音さん
 ・ nyx-a さん
 ・ 力野健さん
 ・ 中井幸博さん
 ・ http://www.sekimizu.net/
 ・ 井汲景太さん
 ・ 飯田昌成さん
 ・ Teruo YAMAWAKI さん
 ・ J. Grant さん
 ・ komura さん
 ・ Yu OOASA さん
 ・ 伊藤竜太さん
 ・ 中島幹夫さん
 ・ H N さん
 ・ SUWA Yoshikazu さん
 ・ 高橋仁さん
 ・ 小松弘幸さん
 ・ その他匿名で誤字単語情報を提示してくださったかたがた

...and special thanks to yc.el

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

[関連リンク]

http://canna.sourceforge.jp/
    日本語入力システムかんな
http://anthy.sourceforge.jp/
    日本語入力システム Anthy
http://www.taiyaki.org/prime/
    予測入力システム PRIME
http://www.ceres.dti.ne.jp/%7Eknak/yc.html
    モードレスな日本語入力環境を実現する Emacs Lisp 「yc」

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

感想、御意見、誤字脱字の指摘、新語登録などのメールはこちら。
すぎもとまさお <sugimoto@oucrc.org>