- - PR -
namazuでの検索結果が文字化けします。
投稿者 | 投稿内容 | ||||
---|---|---|---|---|---|
|
投稿日時: 2004-10-27 18:38
ほとほと困り果ててしまい投稿させて頂きます。
何が出来ないかと申しますと、namazuでの検索結果(日本語)が文字化けします。 検索結果のタイトルがUTF-8で要約のところがSJISです。 (ブラウザのエンコードを日本語SJISとUTF-8で試しました) なにが悪いのかサッパリ解りませんので皆さんのお知恵をお借りしたく思います。 ■使用ソフト os momongalinux 1 namazu2.0.12 nkf2.0.4 kakasi2.3.4 を使用しております。 ■namazuの設定ファイル(文字に関係しそうな部分) .namazurc Lang ja_SJIS(他にjaとja_EUC試しました) mknmrc $NKF = "/usr/bin/nkf"; $KAKASI = "/usr/local/bin/kakasi -i euc -o euc -w"; (eucの部分をsjisに変更しても特に変化なし) ■シェルでLANG=ja ;export LANGとしました。 検索を掛けたいファイルはWindowsで作りSAMBAの3.0.7でサーバーに送った物です。 ■sambaの設定 smb.conf [global] dos charset = CP932 unix charset = UTF-8 display charset = UTF-8 また、libiconvにはlibiconv-patchが当ててあります。 不足な情報があるかも知れませんが以上よろしくお願いします。 | ||||
|
投稿日時: 2004-10-27 21:07
ファイル名の文字コードが UTF-8 で上がってしまっているようですので、 それに併せて環境変数の LANG を ja_JP.UTF-8 としてみたらどうなりますか? | ||||
|
投稿日時: 2004-10-28 11:14
LANGをja_JP.UTF-8に変更してみましたが、やはり文字化けします。
./mknmz -Cとすると以下のように表示されます。 システム: linux Namazu: 2.0.12 Perl: 5.008002 NKF: module_nkf KAKASI: module_kakasi -ieuc -oeuc -w ←ここが怪しい? .namazurcを変更しても反映しない。 茶筌: no わかち書き: module_kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.UTF-8 言語: ja_JP.UTF-8 文字コード: euc CONFDIR: /usr/local/etc/namazu LIBDIR: /usr/local/share/namazu/pl FILTERDIR: /usr/local/share/namazu/filter TEMPLATEDIR: /usr/local/share/namazu/template 対応メディアタイプ: application/x-bzip2 application/x-compress application/x-gzip application/x-rpm message/news message/rfc822 text/hnf text/html text/html; x-type=mhonarc text/plain text/plain; x-type=rfc text/x-hdml text/x-roff nkfとかKAKASIの使い方や文字コードについて勉強しないとだめですかねぇ・・ namazuが動かなくなってしまったので、とりあえずnamazuをインストールし直してみます。 | ||||
|
投稿日時: 2004-10-28 12:44
まさです。
NAMAZU_HOME/etc/namazu にある、namazurc-sample には、 ## Lang: Set the locale code such as `ja_JP.eucJP', `ja_JP.SJIS', ## `de', etc. と書いてあります。 ja_SJIS → ja_JP.SJIS でどうでしょうか? | ||||
|
投稿日時: 2004-10-28 14:27
まささん、あんとれさん有り難うございます。
namazuをインストールし直してみました。 LANG=SJISとかLANG=UTF-8とかLANG=jp_JP.eucjpをそれぞれexport LANGしてみたり。 .namazurcやらmknmrcやら適当に試していたら検索結果のタイトル(主にWindowsで作成したテキストファイルを検索に掛けています)にファイル名として「サンプル.txt」と表示されなければいのに「7腴倶橿・х・・・TXT 」などと文字化けします。 但しタイトルの下に出るファイルの中身は文字化けせずに日本語で表示されるようになりました。 両方を正常に表示させるのは無理なんでしょうかね。 システムはUTF-8、namazuはeucで内部処理している?ファイルの中身はWindowsで作成したSJIS。 そもそもこの組み合わせに無理があるような気がしてきました。 | ||||
|
投稿日時: 2004-10-28 14:46
こんにちは。
こちらのこととは違うのでしょうか? ・ namazu.cgi で、日本語文字列で検索すると検索結果が文字化けします。 (Namazu: FAQ より) | ||||
|
投稿日時: 2004-10-29 18:35
はゆるさま
素晴らしいヒントかも知れません。早速mod_encodingを放り込んで試してみます。希望が湧いてきました。 また、ご報告致します。 | ||||
|
投稿日時: 2004-10-31 16:35
mod_encodingを組み込もうとしたのですが、mod_encoding.cがapxs出来ません。Cコンパイラが無いと怒られます。
gcc -v とすると ここから-------------------------------------------------------------- Reading specs from /usr/lib/gcc-lib/i586-momonga-linux/3.2.3/specs Configured with: ../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --enab le-shared --enable-threads=posix --disable-checking --with-system-zlib --enable-__cxa_atexit --enabl e-languages=c,c++,f77,java,objc --enable-java-gc=boehm --enable-java-awt=xlib --host=i586-momonga-li nux Thread model: posix gcc version 3.2.3 (Momonga Linux 1.0 3.2.3-12m) --------------------------------------------------------------ここまで と表示されるのでインストールはされていると思います。 心当たりのある点と言えばquotaをyum remove quotaしたとき依存関係のあるkernel-headers-2.4.26-21mも一緒に削除してしまいました。 のちにkernel-headers-2.4.27-4m(バージョンが上がってました)をyum install kernel-headersで依存関係のある物も含めて全てインストールそしましたが状況変わらずです。 そもそもkernel-headersが何か解っていないので解決の糸口が全くつかめません。 システムごと再インストールすれば直るとは思うのですが、出来ればこの問題を解決したいです。 namazuとは関係ない話になってきてしまったみたいですが、なにかヒントがあれば教えて頂きたいと思います。 |