「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、フルテキストインデックスに含まれるプロパティ関連のコンテンツに関する情報の出力について解説します。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理関数「sys.dm_fts_index_keywords_by_property」における、フルテキストインデックスに含まれるプロパティ関連のコンテンツに関する情報の出力について解説します。対応バージョンは、SQL Server(サポートされている全てのバージョン)です。
SQL Serverではフルテキスト検索の機能を使用して、英語や日本語など、特定の言語の規則に基づいた言語検索を実行できます。フルテキスト関数を使用して大量のテキストデータを対象としたテキスト検索をする場合、全文検索を行うLIKE句と比較して高速に実行できます。フルテキスト検索ではフォーマットされたバイナリデータ(Microsoft Wordドキュメントなど)を対象とすることもできます。
フルテキスト検索を使用するには、SQL Serverインスタンスに「検索のためのフルテキスト抽出とセマンティック抽出」機能を追加する必要があります。また、データベースにフルテキストカタログを作成し、対象のテーブルに対してフルテキストインデックスを作成する必要があります。
ドキュメントの種類によっては、本文以外にタイトルやタグなどのプロパティを含められます。プロパティの値も通常のフルテキストインデックスで検索が可能ですが、プロパティに対してのみ検索を実行する場合は、検索プロパティリストを作成する必要があります。
「sys.dm_fts_index_keywords_by_property」では、フルテキストインデックスに含まれるプロパティ関連のコンテンツに関する情報を出力します。
構文 sys.dm_fts_index_keywords_by_property(database_id, object_id)
列名 | データ型 | 説明 |
---|---|---|
database_id | int | 対象のデータベースID |
object_id | int | 対象のテーブルのオブジェクトID |
列名 | データ型 | 説明 |
---|---|---|
keyword | nvarchar(4000) | 16進数で表されたキーワード |
display_term | nvarchar(4000) | 人間が判読できるキーワード |
column_id | int | キーワードが作成された列のID |
document_id | int | キーワードを含んでいるドキュメントまたは行のID |
property_id | int | 検索プロパティの内部ID |
「.docx」などのドキュメントの検索プロパティに対してフルテキスト検索を実行するためには、SQL Serverに既定でインストールされている「.doc」などのフィルターに加えて、「Microsoft Filter Pack IFilters with SQL Server」のインストールが必要になります。
まずは、下記のマイクロソフトの公開情報を参考に「Microsoft Office 2010 Filter Packs」をインストールし、「sp_fulltext_service」を使用してSQL Serverに新しいIFilterを読み込ませます(図1)。
次に検索プロパティリストを作成し、検索プロパティリストに対象のプロパティを追加します。インストールされたIFilterで検出できるプロパティを調べるにはWindows SDKに含まれる「filtdump.exe」が必要ですが、一部のプロパティについては、ALTER SERACH PROPETY LISTに例として記載されているため、こちらをそのまま使用します(図2)。
格納する「.docx」のプロパティを確認すると、タイトルとタグに値が入っていました(図3)。
その「.docx」のドキュメントをSQL Serverに格納します(図4)。
「sys.dm_fts_index_keywords_by_property」を実行すると、格納されたプロパティのキーワードを確認できました(図5)。
前回紹介した「sys.dm_fts_index_keywords_by_document」でも、プロパティのキーワードが格納されていることが確認できます。また、プロパティを対象とした検索もできました(図6)。
※本Tipsは、「Windows Server 2019」上に「SQL Server 2019」をインストールした環境を想定して解説しています。
日本ユニシス株式会社所属。Microsoft MVP for Data Platform(2017〜)。入社以来 SQL Serverの評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。SQL Serverのトラブル対応で社長賞の表彰を受けた経験も持つ。休日は学生時代の仲間と市民駅伝に参加し、銭湯で汗を流してから飲み会へと流れる。
日本ユニシス株式会社所属。入社以来SQL Server一筋で評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。社内のプログラミングコンテストで4回の優勝経験も持つ。趣味は輪行で週末は自転車を持っての旅行。目標は色々な日本百選を制覇すること。
Copyright © ITmedia, Inc. All Rights Reserved.