- - PR -
namazuでの検索結果(日本語)でURIの所だけ文字化けします。
1
投稿者 | 投稿内容 |
---|---|
|
投稿日時: 2006-06-28 12:59
いろいろと調べましたが、結局分からなかったため、投稿いたします。
何が出来ないかと申しますと、namazuでの検索結果(日本語)でURIの所だけ文字化けします。 検索結果のタイトルがUTF-8で要約のところがEUCです。 (ブラウザのエンコードを日本語EUCとUTF-8で試しました) どこを変えればよいのかサッパリ解りませんので皆さんのお知恵をお借りしたく思います。 ■使用ソフト os RedHat EnterpriseLinux ES ver3 namazu2.0.16 nkf2.0.4 kakasi2.3.4 を使用しております。 ■mknmz -Cの結果(一部) システム: linux Namazu: 2.0.16 Perl: 5.008000 File-MMagic: 1.25 NKF: /usr/bin/nkf KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w 茶筌: no 和布蕪: no わかち書き: /usr/local/bin/kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.eucJP 言語: ja_JP.eucJP 文字コード: euc ■namazuの設定ファイル(文字に関係しそうな部分) .namazurc Lang ja(他にja_JP.SJISとja_JP.eucJP,ja_JP.UTF8試しました) .mknmrc $NKF = "/usr/bin/nkf"; $KAKASI = "/usr/local/bin/kakasi -isjis -oeuc -w"; (isjisの部分をieucに変更しても特に変化なし) ■シェルでLANG=ja ;export LANGとしました。 (他にja_JP.SJISとja_JP.eucJP,ja_JP.UTF8試しました) 検索を掛けたいファイルはWindowsで作りSAMBAの3.0.7でサーバーに送った物です。 ■インデックス作成のコマンドには-Uのオプションを付加しています。 mknmz -kU --replace='s#/home/XXXX/YYYY##;' --config='/var/www/cgi-bin/.mknmzrc' -O /usr/local/var/namazu/index /home/XXXX/YYYY ■mod_encoding SetServerEncoding EUC-JP DefaultClientEncoding JA-AUTO-SJIS-MS SJIS AddClientEncoding "cadaver/" EUC-JP ■作成されたインデックスのファイル NMZ.field.subject NMZ.field.uri をPCにダウンロードし、サクラエディタを用いて EUCで保存しなおし、アップロードしたところ、 文字化けが解消されたため、このファイルが文字化けの原因ようです。 不足な情報があるかも知れませんが以上よろしくお願いします。 |
|
投稿日時: 2006-06-29 19:58
自己レスです。
解決しましたのでご報告します。 smb.conf を次のように 編集し、Samba を再起動します。 unix charset = EUCJP-MS 再度、Windows から UNIX にファイル名、フォルダ名がEUC−JPになるようにファイルを移動し、インデックスを作り直しました。 |
1