- - PR -
Oracle Textでのテキストファイルの検索について
1
| 投稿者 | 投稿内容 |
|---|---|
|
投稿日時: 2006-06-08 21:33
Oracle10gにおいて Oracle Textを使用してテキストファイル(.txt)を検索するにあたり、
データベースにファイルを格納する際にファイルの形式がShift_JIS か EUCの形式だと 日本語の検索キーワードを使用するとヒットしません(英語はヒットする)。 UTF-8のファイル形式ではヒットします。 データベースはデフォルトでUTF-8になっていますのでこれが原因かと思いますが。。 txtファイルの場合はファイル形式をShift_JISからUTF-8へ変換してデータベースへ格納するべきでしょうか? select id from data_table where contains(data, 'キーワード' ,1) > 0 などとして検索しています。 あと、PDFファイルの検索についても少し怪しい気がします。 例えば「Oracleファイル」という文字列(英語と日本語続きの文字)を含んだテキストファイルをPDFファイル化して検索にかけると 「Oracle」ではヒットせず「O r a c l e」とするとヒットします。 こういうものでしょうか。 |
1
