- - PR -
lucene + sen について
1
投稿者 | 投稿内容 |
---|---|
|
投稿日時: 2004-08-28 02:47
全文検索の実現に
Jakarta LuceneとSenを合わせて使用しています。 インデックス作成や、検索時に日本語解析するのですが、 業務固有の名詞などは、うまく解析してくれません。 精度を高めるため、Senの辞書に名詞などを追加登録 したいと考えていますが、実現の方法がわかりません ご存知の方、ご教授お願いします。 Windows 2000,XP tomcat4.1.30 lucene-ja sen1.0 |
|
投稿日時: 2004-09-17 15:54
私もSenの辞書追加に苦戦しています。
私の環境では、何故か辞書を更新しても反映されないのですが、 知り合いは辞書の更新が出来たそうなので、その方法を書きます。 1 /sen-1.0/dic/dic.csvをEUCが読めるテキストエディタ(xyzzy等)で開く 2 他の単語のフォーマットを参考にして新しい単語を追加する 3 保存する これで出来るそうです。makeとかしなくても反映されるそうです。 |
|
投稿日時: 2004-09-17 16:53
すみません、訂正です。
1 /sen-1.0/dic/dic.csvをEUCが読めるテキストエディタ(xyzzy等)で開く 2 他の単語のフォーマットを参考にして新しい単語を追加する 3 保存する 4 /sen-1.0/dic/でantを実行 知り合いの勘違いで、batファイルにantを書いていたそうです。 |
|
投稿日時: 2004-09-24 10:34
むぅいしさん。こんにちは。
情報ありがとうございます。 早速、試してみます。 |
1