- PR -

lucene + sen について 

1
投稿者投稿内容
TA
会議室デビュー日: 2004/08/28
投稿数: 4
投稿日時: 2004-08-28 02:47
全文検索の実現に
Jakarta LuceneとSenを合わせて使用しています。

インデックス作成や、検索時に日本語解析するのですが、
業務固有の名詞などは、うまく解析してくれません。
精度を高めるため、Senの辞書に名詞などを追加登録
したいと考えていますが、実現の方法がわかりません

ご存知の方、ご教授お願いします。


Windows 2000,XP
tomcat4.1.30
lucene-ja
sen1.0
むぅいし
会議室デビュー日: 2004/09/17
投稿数: 7
投稿日時: 2004-09-17 15:54
私もSenの辞書追加に苦戦しています。
私の環境では、何故か辞書を更新しても反映されないのですが、
知り合いは辞書の更新が出来たそうなので、その方法を書きます。

1 /sen-1.0/dic/dic.csvをEUCが読めるテキストエディタ(xyzzy等)で開く
2 他の単語のフォーマットを参考にして新しい単語を追加する
3 保存する

これで出来るそうです。makeとかしなくても反映されるそうです。
むぅいし
会議室デビュー日: 2004/09/17
投稿数: 7
投稿日時: 2004-09-17 16:53
すみません、訂正です。

1 /sen-1.0/dic/dic.csvをEUCが読めるテキストエディタ(xyzzy等)で開く
2 他の単語のフォーマットを参考にして新しい単語を追加する
3 保存する
4 /sen-1.0/dic/でantを実行

知り合いの勘違いで、batファイルにantを書いていたそうです。
TA
会議室デビュー日: 2004/08/28
投稿数: 4
投稿日時: 2004-09-24 10:34
むぅいしさん。こんにちは。

情報ありがとうございます。
早速、試してみます。
1

スキルアップ/キャリアアップ(JOB@IT)