フルテキストインデックスのキーワード一覧を出力するSQL Server動的管理ビューレファレンス(95)

「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、フルテキストインデックスのキーワード一覧を出力する方法について解説します。

» 2022年03月23日 05時00分 公開
[伊東敏章@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

SQL Server動的管理ビュー一覧

 本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理ビュー「sys.dm_fts_index_keywords」における、フルテキストインデックスのキーワード一覧を出力する方法について解説します。対応バージョンは、SQL Server(サポートされている全てのバージョン)です。

概要

 SQL Serverではフルテキスト検索の機能を使用して、英語や日本語などの特定の言語の規則に基づいた言語検索を実行できます。フルテキスト関数を使用して大量のテキストデータを対象としたテキスト検索を行う場合、全文検索を行うLIKE句と比較して高速に実行できます。フルテキスト検索ではフォーマットされたバイナリデータ(Microsoft Wordドキュメントなど)を対象とすることもできます。

 フルテキスト検索を使用するには、SQL Serverインスタンスに「検索のためのフルテキスト抽出とセマンティック抽出」機能を追加する必要があります。また、データベースにフルテキストカタログを作成し、対象のテーブルに対してフルテキストインデックスを作成する必要があります。

 「sys.dm_fts_index_keywords」動的管理関数を使用することで、フルテキストインデックスに含まれるキーワードの一覧と、そのキーワードを含むドキュメント数の一覧を出力できます。

構文と引数

構文 sys.dm_fts_index_keywords(db_id, object_id)

引数名 データ型 説明
db_id int 対象のデータベースID
DB_ID関数を使用することでデータベース名からデータベースIDを取得できる
object_id int 対象のテーブルのオブジェクトID
OBJECT_ID関数を使用することで、テーブル名からオブジェクトIDを取得できる

出力内容

列名 データ型 説明
keyword nvarchar(4000) キーワードの16進数表現
※0xFFは、ファイルまたはデータセットの末尾を示す
display_term nvarchar(4000) 人間が判読できる形式で表したキーワード
※※「END OF FILE」は、ファイルまたはデータセットの末尾を示す
column_id int このキーワードが作成された列のID
document_count int このキーワードを含むドキュメントまたは行の数

動作例

 テーブルの複数の列を対象としたフルテキストインデックスを作成し、テスト用にデータを追加しました(図1)。

図1 図1 既定のフルテキストカタログにフルテキストインデックスを追加したところ

 作成したテーブルを対象として「sys.dm_fts_index_keywords」動的管理関数を出力します(図2)。引数として必要なデータベースIDとテーブルのオブジェクトIDは、DB_ID関数とOBJECT_ID関数で取得しました。

図2 図2 「sys.dm_fts_index_keywords」動的管理関数によりキーワードの一覧が出力された

 テーブルに作成されたフルテキストインデックスのキーワードの一覧と、キーワードを含むドキュメント数が出力されました。列が異なれば同じキーワードでも別の行に分かれて出力されるようです。

 出力された結果を確認すると、句読点がキーワードに含まれないことや、「今日」と「今日は」が区別されていそうなことが分かります(図3)。

図3 図3 「今日」をキーワードとして検索しても「今日は」を含むデータは検索されなかった

 「sys.dm_fts_index_keywords」動的管理関数をフルテキスト検索クエリで直接使用することはありませんが、このようにフルテキスト検索におけるキーワードの扱いの確認や、意図した結果が検索されないときの原因追及などの用途に使用することができそうです。

※本Tipsは、「Windows Server 2019」上に「SQL Server 2019」をインストールした環境を想定して解説しています。

筆者紹介

椎名 武史(しいな たけし)

日本ユニシス株式会社所属。Microsoft MVP for Data Platform(2017〜)。入社以来 SQL Serverの評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。SQL Serverのトラブル対応で社長賞の表彰を受けた経験も持つ。休日は学生時代の仲間と市民駅伝に参加し、銭湯で汗を流してから飲み会へと流れる。

伊東 敏章(いとう としあき)

日本ユニシス株式会社所属。入社以来SQL Server一筋で評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。社内のプログラミングコンテストで4回の優勝経験も持つ。趣味は輪行で週末は自転車を持っての旅行。目標は色々な日本百選を制覇すること。


Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。