- PR -

Oracle Textでのテキストファイルの検索について

1
投稿者投稿内容
linx
会議室デビュー日: 2006/02/02
投稿数: 9
投稿日時: 2006-06-08 21:33
Oracle10gにおいて Oracle Textを使用してテキストファイル(.txt)を検索するにあたり、
データベースにファイルを格納する際にファイルの形式がShift_JIS か EUCの形式だと
日本語の検索キーワードを使用するとヒットしません(英語はヒットする)。
UTF-8のファイル形式ではヒットします。
データベースはデフォルトでUTF-8になっていますのでこれが原因かと思いますが。。
txtファイルの場合はファイル形式をShift_JISからUTF-8へ変換してデータベースへ格納するべきでしょうか?

select id from data_table where contains(data, 'キーワード' ,1) > 0
などとして検索しています。

あと、PDFファイルの検索についても少し怪しい気がします。
例えば「Oracleファイル」という文字列(英語と日本語続きの文字)を含んだテキストファイルをPDFファイル化して検索にかけると
「Oracle」ではヒットせず「O r a c l e」とするとヒットします。
こういうものでしょうか。
1

スキルアップ/キャリアアップ(JOB@IT)