- PR -

namazuでの検索結果が文字化けします。

投稿者投稿内容
たて
常連さん
会議室デビュー日: 2003/12/18
投稿数: 39
お住まい・勤務地: 沖縄
投稿日時: 2004-10-27 18:38
ほとほと困り果ててしまい投稿させて頂きます。
何が出来ないかと申しますと、namazuでの検索結果(日本語)が文字化けします。
検索結果のタイトルがUTF-8で要約のところがSJISです。
  (ブラウザのエンコードを日本語SJISとUTF-8で試しました)

なにが悪いのかサッパリ解りませんので皆さんのお知恵をお借りしたく思います。

■使用ソフト
os momongalinux 1
namazu2.0.12
nkf2.0.4
kakasi2.3.4
を使用しております。

■namazuの設定ファイル(文字に関係しそうな部分)
.namazurc Lang ja_SJIS(他にjaとja_EUC試しました)
 
 mknmrc $NKF = "/usr/bin/nkf";
$KAKASI = "/usr/local/bin/kakasi -i euc -o euc -w";
(eucの部分をsjisに変更しても特に変化なし)

■シェルでLANG=ja ;export LANGとしました。

検索を掛けたいファイルはWindowsで作りSAMBAの3.0.7でサーバーに送った物です。

■sambaの設定
 smb.conf
   [global]
    dos charset = CP932
  unix charset = UTF-8
   display charset = UTF-8

また、libiconvにはlibiconv-patchが当ててあります。

不足な情報があるかも知れませんが以上よろしくお願いします。
あんとれ
ぬし
会議室デビュー日: 2004/01/14
投稿数: 556
投稿日時: 2004-10-27 21:07
引用:

たてさんの書き込み (2004-10-27 18:38) より:
■sambaの設定
 smb.conf
   [global]
    dos charset = CP932
  unix charset = UTF-8
   display charset = UTF-8



ファイル名の文字コードが UTF-8 で上がってしまっているようですので、
それに併せて環境変数の LANG を ja_JP.UTF-8 としてみたらどうなりますか?
たて
常連さん
会議室デビュー日: 2003/12/18
投稿数: 39
お住まい・勤務地: 沖縄
投稿日時: 2004-10-28 11:14
LANGをja_JP.UTF-8に変更してみましたが、やはり文字化けします。

./mknmz -Cとすると以下のように表示されます。

システム: linux
Namazu: 2.0.12
Perl: 5.008002
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w ←ここが怪しい?
.namazurcを変更しても反映しない。
茶筌: no
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.UTF-8
言語: ja_JP.UTF-8
文字コード: euc
CONFDIR: /usr/local/etc/namazu
LIBDIR: /usr/local/share/namazu/pl
FILTERDIR: /usr/local/share/namazu/filter
TEMPLATEDIR: /usr/local/share/namazu/template
対応メディアタイプ:
application/x-bzip2
application/x-compress
application/x-gzip
application/x-rpm
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
text/x-hdml
text/x-roff

nkfとかKAKASIの使い方や文字コードについて勉強しないとだめですかねぇ・・
namazuが動かなくなってしまったので、とりあえずnamazuをインストールし直してみます。
まさ
ベテラン
会議室デビュー日: 2002/11/15
投稿数: 74
投稿日時: 2004-10-28 12:44
まさです。

引用:

■namazuの設定ファイル(文字に関係しそうな部分)
.namazurc Lang ja_SJIS(他にjaとja_EUC試しました)



NAMAZU_HOME/etc/namazu にある、namazurc-sample には、

## Lang: Set the locale code such as `ja_JP.eucJP', `ja_JP.SJIS',
## `de', etc.

と書いてあります。

ja_SJIS → ja_JP.SJIS

でどうでしょうか?
たて
常連さん
会議室デビュー日: 2003/12/18
投稿数: 39
お住まい・勤務地: 沖縄
投稿日時: 2004-10-28 14:27
まささん、あんとれさん有り難うございます。

namazuをインストールし直してみました。

LANG=SJISとかLANG=UTF-8とかLANG=jp_JP.eucjpをそれぞれexport LANGしてみたり。
.namazurcやらmknmrcやら適当に試していたら検索結果のタイトル(主にWindowsで作成したテキストファイルを検索に掛けています)にファイル名として「サンプル.txt」と表示されなければいのに「7腴倶橿・х・・・TXT 」などと文字化けします。
但しタイトルの下に出るファイルの中身は文字化けせずに日本語で表示されるようになりました。

両方を正常に表示させるのは無理なんでしょうかね。

システムはUTF-8、namazuはeucで内部処理している?ファイルの中身はWindowsで作成したSJIS。
そもそもこの組み合わせに無理があるような気がしてきました。
はゆる
ぬし
会議室デビュー日: 2004/02/16
投稿数: 1008
お住まい・勤務地: 首都圏をウロウロと
投稿日時: 2004-10-28 14:46
こんにちは。

こちらのこととは違うのでしょうか?

 ・ namazu.cgi で、日本語文字列で検索すると検索結果が文字化けします。
   (Namazu: FAQ より)
たて
常連さん
会議室デビュー日: 2003/12/18
投稿数: 39
お住まい・勤務地: 沖縄
投稿日時: 2004-10-29 18:35
はゆるさま

素晴らしいヒントかも知れません。早速mod_encodingを放り込んで試してみます。希望が湧いてきました。
また、ご報告致します。
たて
常連さん
会議室デビュー日: 2003/12/18
投稿数: 39
お住まい・勤務地: 沖縄
投稿日時: 2004-10-31 16:35
mod_encodingを組み込もうとしたのですが、mod_encoding.cがapxs出来ません。Cコンパイラが無いと怒られます。
gcc -v とすると
ここから--------------------------------------------------------------
Reading specs from /usr/lib/gcc-lib/i586-momonga-linux/3.2.3/specs
Configured with: ../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --enab
le-shared --enable-threads=posix --disable-checking --with-system-zlib --enable-__cxa_atexit --enabl
e-languages=c,c++,f77,java,objc --enable-java-gc=boehm --enable-java-awt=xlib --host=i586-momonga-li
nux
Thread model: posix
gcc version 3.2.3 (Momonga Linux 1.0 3.2.3-12m)
--------------------------------------------------------------ここまで
と表示されるのでインストールはされていると思います。
心当たりのある点と言えばquotaをyum remove quotaしたとき依存関係のあるkernel-headers-2.4.26-21mも一緒に削除してしまいました。
のちにkernel-headers-2.4.27-4m(バージョンが上がってました)をyum install kernel-headersで依存関係のある物も含めて全てインストールそしましたが状況変わらずです。
そもそもkernel-headersが何か解っていないので解決の糸口が全くつかめません。

システムごと再インストールすれば直るとは思うのですが、出来ればこの問題を解決したいです。
namazuとは関係ない話になってきてしまったみたいですが、なにかヒントがあれば教えて頂きたいと思います。

スキルアップ/キャリアアップ(JOB@IT)