フルテキストインデックスに含まれるプロパティ関連のコンテンツに関する情報を出力するSQL Server動的管理ビューレファレンス(97)

「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、フルテキストインデックスに含まれるプロパティ関連のコンテンツに関する情報の出力について解説します。

» 2022年03月29日 05時00分 公開
[椎名武史@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

SQL Server動的管理ビュー一覧

 本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理関数「sys.dm_fts_index_keywords_by_property」における、フルテキストインデックスに含まれるプロパティ関連のコンテンツに関する情報の出力について解説します。対応バージョンは、SQL Server(サポートされている全てのバージョン)です。

概要

 SQL Serverではフルテキスト検索の機能を使用して、英語や日本語など、特定の言語の規則に基づいた言語検索を実行できます。フルテキスト関数を使用して大量のテキストデータを対象としたテキスト検索をする場合、全文検索を行うLIKE句と比較して高速に実行できます。フルテキスト検索ではフォーマットされたバイナリデータ(Microsoft Wordドキュメントなど)を対象とすることもできます。

 フルテキスト検索を使用するには、SQL Serverインスタンスに「検索のためのフルテキスト抽出とセマンティック抽出」機能を追加する必要があります。また、データベースにフルテキストカタログを作成し、対象のテーブルに対してフルテキストインデックスを作成する必要があります。

 ドキュメントの種類によっては、本文以外にタイトルやタグなどのプロパティを含められます。プロパティの値も通常のフルテキストインデックスで検索が可能ですが、プロパティに対してのみ検索を実行する場合は、検索プロパティリストを作成する必要があります。

 「sys.dm_fts_index_keywords_by_property」では、フルテキストインデックスに含まれるプロパティ関連のコンテンツに関する情報を出力します。

構文と引数

構文 sys.dm_fts_index_keywords_by_property(database_id, object_id)

列名 データ型 説明
database_id int 対象のデータベースID
object_id int 対象のテーブルのオブジェクトID

出力内容

列名 データ型 説明
keyword nvarchar(4000) 16進数で表されたキーワード
display_term nvarchar(4000) 人間が判読できるキーワード
column_id int キーワードが作成された列のID
document_id int キーワードを含んでいるドキュメントまたは行のID
property_id int 検索プロパティの内部ID

動作例

 「.docx」などのドキュメントの検索プロパティに対してフルテキスト検索を実行するためには、SQL Serverに既定でインストールされている「.doc」などのフィルターに加えて、「Microsoft Filter Pack IFilters with SQL Server」のインストールが必要になります。

 まずは、下記のマイクロソフトの公開情報を参考に「Microsoft Office 2010 Filter Packs」をインストールし、「sp_fulltext_service」を使用してSQL Serverに新しいIFilterを読み込ませます(図1)。

図1 図1 Filterインストール後に「sp_fulltext_service」を使用してSQL Serverに読み込ませる

 次に検索プロパティリストを作成し、検索プロパティリストに対象のプロパティを追加します。インストールされたIFilterで検出できるプロパティを調べるにはWindows SDKに含まれる「filtdump.exe」が必要ですが、一部のプロパティについては、ALTER SERACH PROPETY LISTに例として記載されているため、こちらをそのまま使用します(図2)。

図2 図2 検索プロパティリストを作成して、対象のプロパティを追加する

 格納する「.docx」のプロパティを確認すると、タイトルとタグに値が入っていました(図3)。

図3 図3 ドキュメントのプロパティにはタイトルとタグに値が入っている

 その「.docx」のドキュメントをSQL Serverに格納します(図4)。

図4 図4 フルテキストインデックスを作成しドキュメントを格納した

 「sys.dm_fts_index_keywords_by_property」を実行すると、格納されたプロパティのキーワードを確認できました(図5)。

図5 図5 プロパティに格納されたキーワードが確認できる

 前回紹介した「sys.dm_fts_index_keywords_by_document」でも、プロパティのキーワードが格納されていることが確認できます。また、プロパティを対象とした検索もできました(図6)。

図6 図6 プロパティを対象とした検索ができた

※本Tipsは、「Windows Server 2019」上に「SQL Server 2019」をインストールした環境を想定して解説しています。

筆者紹介

椎名 武史(しいな たけし)

日本ユニシス株式会社所属。Microsoft MVP for Data Platform(2017〜)。入社以来 SQL Serverの評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。SQL Serverのトラブル対応で社長賞の表彰を受けた経験も持つ。休日は学生時代の仲間と市民駅伝に参加し、銭湯で汗を流してから飲み会へと流れる。

伊東 敏章(いとう としあき)

日本ユニシス株式会社所属。入社以来SQL Server一筋で評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。社内のプログラミングコンテストで4回の優勝経験も持つ。趣味は輪行で週末は自転車を持っての旅行。目標は色々な日本百選を制覇すること。


Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

4AI by @IT - AIを作り、動かし、守り、生かす
Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。