- PR -

Windows XP上 PDFファイルのIndexing Serviceでヒットしないものがある

1
投稿者投稿内容
platini
大ベテラン
会議室デビュー日: 2002/12/03
投稿数: 193
投稿日時: 2009-01-16 00:49
環境 Windows XPでローカルPCドライブ上のデータに対して
Indexing Serviceを使っています。
Indexing Service用のPDF iFilterも導入しました。(PDF IFilter Ver6)
(参考:当該マシンにインストールされているAcrobatのバージョンはVer8のReader)

PDFに含まれている用語を指定して検索を掛けると
(Indexing Serviceの検索処理は Satoriというフリーウェアを利用)
ヒットするファイルと、ヒットしないファイルがあります。
ヒットしないファイルについて、その法則性がわかりません。

ヒットしないファイルについても、その用語をAcrobatReader上、
検索ボックスにキーワードを入力して検索するとヒットします。

最初はPDFのバージョン(例えばVer7で作成されたファイル)の違いなのかとも
思ったのですが、どうしても法則性がわかりません。

なお、ファイルを放り込んだ直後、
OSが一生懸命インデックスを作成している最中には、
当然ながらヒットしませんが、
Indexは作成完了していることは、MMCスナップインから
確認をしております。

ひょっとしたら、

1)PDFのファイルサイズの問題ではなかろうか。
(すごく大きなファイルサイズのPDFが存在します)
 一定ファイルサイズを超えたデータは、途中で検索が打ち切られるケースが
 あるのではないか。

2)インデックス作成対象フォルダ内のデータファイル群の
 ファイルサイズの総和の問題ではなかろうか

3)インデックスのカタログファイル(*.cwi)のファイルサイズが、
 一定量を超えると、アウトになるのか

などがありそうな話だと思って、ググってみたのですが、
わかりませんでした。

★Share Point 2007Serverだと、
 クロールできるファイルサイズの制限値の設定があるようですが。
http://shanqiai.weblogs.jp/sharepoint_technical_note/moss/index.html


==========================================================
もし、この手の症状で何らかの情報があれば、ご教示ください。
yawata133
ベテラン
会議室デビュー日: 2007/04/06
投稿数: 76
投稿日時: 2009-01-20 09:17
Windows2003でも同じような検索もれが起こります。2年くらいまえMSに問い合わせても100%のヒットは保証しないというとこでした。
運用して経験的には、カタログのサイズは50MB程度で小さいほうがいいような気がします。
platini
大ベテラン
会議室デビュー日: 2002/12/03
投稿数: 193
投稿日時: 2009-01-20 10:30
自己レスです。
未だ、解決していませんが、
yawata133さんのくれた情報の他、
多少なりとも関係のありそうな記事を見つけたので、
投稿しておきます。

http://www.microsoft.com/japan/msdn/community/gdn/ShowPost-10324.htm
platini
大ベテラン
会議室デビュー日: 2002/12/03
投稿数: 193
投稿日時: 2009-01-20 10:50
http://support.microsoft.com/kb/318747/ja
上記に、やはり PDF(PDFとは特定していないが、テキストファイル以外)の
ファイルサイズの上限問題が元々あり、
それが解消できそうな記事がありましたので、
まだ 未検証ですが、参考情報として自己レス提示します。
platini
大ベテラン
会議室デビュー日: 2002/12/03
投稿数: 193
投稿日時: 2009-01-20 16:44
又もや自己レスです。
色々なPDFを配置して、かつ、その都度カタログを念のため
新規作成して調べてみると・・・
まだ調査中ではありますが、大容量PDFファイルに対する
Adobe PDF iFilterの性能限界の可能性が高いようです。

Indexing Serviceの性能に関するパラメータ
(レジストリ)を全く変更していなくても、(触らなくても)

Adobe PDF iFilter で×
FoxitのPDF iFilter で○
となるケースの複数結果が得られました。

その他、
Adobe PDF iFilter では、
あるファイル(20MB)程度がヒットして、
そのファイルから後半の半分のページを削除して
10MBに減らしたファイルがヒットしない など
不可解な現象も発生しており、(検索対象ファイルサイズに依存する
話なら20MBがOKなら10MBがNGになるのはおかしい)、
どうも挙動がよくわからず、怪しいところがあります。

無料ソフトなので、文句を言う筋合いはないことは承知。


※逆説的に言えば、
無償Adobeと同等性能なら、有償ソフトのFoxitは売れるわけがないので、
Foxitの製品は当然、性能優位でなければならないわけですが。

======================
追記 1/20 21:17
Adobe の iFilter 6.0を使うことが問題ありなのかも。
http://support.microsoft.com/kb/960628/ja
によれば、最近のバージョンのAcrobatには内蔵されているので、
それを使ったほうがよいのかも。

但し、これはReaderを入れなくてはいけなくて、
自分のマシンはAcrobatがインストールされているので、
試せない・・・。別マシンで試してみるしかないですね。


[ メッセージ編集済み 編集者: platini 編集日時 2009-01-20 21:18 ]
1

スキルアップ/キャリアアップ(JOB@IT)