フルテキストインデックスのキーワードと記載場所に関する情報を出力する:SQL Server動的管理ビューレファレンス(98)
「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、フルテキストインデックスのキーワードと記載場所に関する情報を出力する方法について解説します。
本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理関数「sys.dm_fts_index_keywords_position_by_document」における、フルテキストインデックスのキーワードと記載場所に関する情報を出力する方法について解説します。対応バージョンは、SQL Server(サポートされている全てのバージョン)です。
概要
SQL Serverではフルテキスト検索の機能を使用して、英語や日本語など、特定の言語の規則に基づいた言語検索を実行できます。フルテキスト関数を使用して大量のテキストデータを対象としたテキスト検索をする場合、全文検索をするLIKE句と比較して高速に実行できます。フルテキスト検索では、フォーマットされたバイナリデータ(Microsoft Wordドキュメントなど)を対象とすることもできます。
フルテキスト検索を使用するには、SQL Serverインスタンスに「検索のためのフルテキスト抽出とセマンティック抽出」機能を追加する必要があります。また、データベースにフルテキストカタログを作成し、対象のテーブルに対してフルテキストインデックスを作成する必要があります。
「sys.dm_fts_index_keywords_position_by_document」では、フルテキストインデックスのキーワードと記載場所に関する情報を出力します。
構文と引数
構文 sys.dm_fts_index_keywords_position_by_document(database_id, object_id)
列名 | データ型 | 説明 |
---|---|---|
database_id | int | 対象のデータベースID |
object_id | int | 対象のテーブルのオブジェクトID |
出力内容
列名 | データ型 | 説明 |
---|---|---|
keyword | nvarchar(4000) | 16進数で表されたキーワード |
display_term | nvarchar(4000) | 人間が判読できるキーワード |
column_id | int | キーワードが作成された列のID |
document_id | int | キーワードを含んでいるドキュメントまたは行のID |
position | int | ドキュメント内のキーワードの位置 |
動作例
テーブルの複数の列を対象としたフルテキストインデックスを作成し、テスト用にデータを追加しました(図1)。
作成したテーブルを対象として「sys.dm_fts_index_keywords_position_by_document」を実行すると、フルテキストインデックスのキーワードと記載場所に関する情報が出力されました(図2)。
「document_id」「column_id」「position」でソートすると、データがどのようにフルテキストインデックスのキーワードとして登録されているか確認しやすくなります。
※本Tipsは、「Windows Server 2019」上に「SQL Server 2019」をインストールした環境を想定して解説しています。
筆者紹介
椎名 武史(しいな たけし)
BIPROGY株式会社(ビプロジー)所属。Microsoft MVP for Data Platform(2017〜)。入社以来 SQL Serverの評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。SQL Serverのトラブル対応で社長賞の表彰を受けた経験も持つ。休日は学生時代の仲間と市民駅伝に参加し、銭湯で汗を流してから飲み会へと流れる。
伊東 敏章(いとう としあき)
BIPROGY株式会社(ビプロジー)所属。入社以来SQL Server一筋で評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。社内のプログラミングコンテストで4回の優勝経験も持つ。趣味は輪行で週末は自転車を持っての旅行。目標は色々な日本百選を制覇すること。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- SQL Serverの動的管理ビューとは?
「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。 - 「DMV(Dynamic Management View)」でパフォーマンス遅延の「原因」を調べる
本連載は、「Microsoft SQL Server」で発生するトラブルを「どんな方法で」「どのように」解決していくか、正しい対処のためのノウハウを紹介します。今回は、「処理遅延の原因を追求する“DMVの使い方”」を説明します。 - SQL Serverの動きを制御する「トレースフラグ」とは何か
「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「トレースフラグ」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。初回は「トレースフラグとはそもそも何か」を解説します。