- - PR -
Windows XP上 PDFファイルのIndexing Serviceでヒットしないものがある
1
投稿者 | 投稿内容 |
---|---|
|
投稿日時: 2009-01-16 00:49
環境 Windows XPでローカルPCドライブ上のデータに対して
Indexing Serviceを使っています。 Indexing Service用のPDF iFilterも導入しました。(PDF IFilter Ver6) (参考:当該マシンにインストールされているAcrobatのバージョンはVer8のReader) PDFに含まれている用語を指定して検索を掛けると (Indexing Serviceの検索処理は Satoriというフリーウェアを利用) ヒットするファイルと、ヒットしないファイルがあります。 ヒットしないファイルについて、その法則性がわかりません。 ヒットしないファイルについても、その用語をAcrobatReader上、 検索ボックスにキーワードを入力して検索するとヒットします。 最初はPDFのバージョン(例えばVer7で作成されたファイル)の違いなのかとも 思ったのですが、どうしても法則性がわかりません。 なお、ファイルを放り込んだ直後、 OSが一生懸命インデックスを作成している最中には、 当然ながらヒットしませんが、 Indexは作成完了していることは、MMCスナップインから 確認をしております。 ひょっとしたら、 1)PDFのファイルサイズの問題ではなかろうか。 (すごく大きなファイルサイズのPDFが存在します) 一定ファイルサイズを超えたデータは、途中で検索が打ち切られるケースが あるのではないか。 2)インデックス作成対象フォルダ内のデータファイル群の ファイルサイズの総和の問題ではなかろうか 3)インデックスのカタログファイル(*.cwi)のファイルサイズが、 一定量を超えると、アウトになるのか などがありそうな話だと思って、ググってみたのですが、 わかりませんでした。 ★Share Point 2007Serverだと、 クロールできるファイルサイズの制限値の設定があるようですが。 http://shanqiai.weblogs.jp/sharepoint_technical_note/moss/index.html ========================================================== もし、この手の症状で何らかの情報があれば、ご教示ください。 |
|
投稿日時: 2009-01-20 09:17
Windows2003でも同じような検索もれが起こります。2年くらいまえMSに問い合わせても100%のヒットは保証しないというとこでした。
運用して経験的には、カタログのサイズは50MB程度で小さいほうがいいような気がします。 |
|
投稿日時: 2009-01-20 10:30
自己レスです。
未だ、解決していませんが、 yawata133さんのくれた情報の他、 多少なりとも関係のありそうな記事を見つけたので、 投稿しておきます。 http://www.microsoft.com/japan/msdn/community/gdn/ShowPost-10324.htm |
|
投稿日時: 2009-01-20 10:50
http://support.microsoft.com/kb/318747/ja
上記に、やはり PDF(PDFとは特定していないが、テキストファイル以外)の ファイルサイズの上限問題が元々あり、 それが解消できそうな記事がありましたので、 まだ 未検証ですが、参考情報として自己レス提示します。 |
|
投稿日時: 2009-01-20 16:44
又もや自己レスです。
色々なPDFを配置して、かつ、その都度カタログを念のため 新規作成して調べてみると・・・ まだ調査中ではありますが、大容量PDFファイルに対する Adobe PDF iFilterの性能限界の可能性が高いようです。 Indexing Serviceの性能に関するパラメータ (レジストリ)を全く変更していなくても、(触らなくても) Adobe PDF iFilter で× FoxitのPDF iFilter で○ となるケースの複数結果が得られました。 その他、 Adobe PDF iFilter では、 あるファイル(20MB)程度がヒットして、 そのファイルから後半の半分のページを削除して 10MBに減らしたファイルがヒットしない など 不可解な現象も発生しており、(検索対象ファイルサイズに依存する 話なら20MBがOKなら10MBがNGになるのはおかしい)、 どうも挙動がよくわからず、怪しいところがあります。 無料ソフトなので、文句を言う筋合いはないことは承知。 ※逆説的に言えば、 無償Adobeと同等性能なら、有償ソフトのFoxitは売れるわけがないので、 Foxitの製品は当然、性能優位でなければならないわけですが。 ====================== 追記 1/20 21:17 Adobe の iFilter 6.0を使うことが問題ありなのかも。 http://support.microsoft.com/kb/960628/ja によれば、最近のバージョンのAcrobatには内蔵されているので、 それを使ったほうがよいのかも。 但し、これはReaderを入れなくてはいけなくて、 自分のマシンはAcrobatがインストールされているので、 試せない・・・。別マシンで試してみるしかないですね。 [ メッセージ編集済み 編集者: platini 編集日時 2009-01-20 21:18 ] |
1