連載
» 2022年04月19日 05時00分 公開

フルテキストインデックスの出力キーワードに関する情報を出力するSQL Server動的管理ビューレファレンス(103)

「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、フルテキストインデックスの出力キーワードに関する情報を出力する方法について解説します。

[椎名武史,@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

SQL Server動的管理ビュー一覧

 本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理関数「sys.dm_fts_parser」における、フルテキストインデックスの出力キーワードに関する情報を出力する方法について解説します。対応バージョンは、SQL Server(サポートされている全てのバージョン)です。

概要

 SQL Serverではフルテキスト検索の機能を使用して、英語や日本語などの特定の言語の規則に基づいた言語検索を実行できます。フルテキスト関数を使用して大量のテキストデータを対象としたテキスト検索をする場合、全文検索をするLIKE句と比較して高速に実行できます。フルテキスト検索では、フォーマットされたバイナリデータ(Microsoft Wordドキュメントなど)を対象とすることもできます。

 フルテキスト検索を使用するには、SQL Serverインスタンスに「検索のためのフルテキスト抽出とセマンティック抽出」機能を追加する必要があります。また、データベースにフルテキストカタログを作成し、対象のテーブルに対してフルテキストインデックスを作成する必要があります。

 格納されているデータにフルテキストインデックスを作成すると、「sys.dm_fts_index_keywords」などを使用して、どのようなキーワードが登録されているか確認できます。ただし、キーワードを確認するには、実際にフルテキストインデックスを作成する必要がありました。

 「sys.dm_fts_parser」では、引数で渡すクエリのフルテキストインデックスの出力キーワードに関する情報を出力します。

構文と引数

構文 sys.dm_fts_parser('query_string', lcid, stoplist_id, accent_sensitivity)

列名 データ型 説明
query_string nvarchar(4000) 解析するクエリ
lcid int 解析に使用するワードブレーカーのロケール識別子
stoplist_id int ストップリストのID
accent_sensitivity bit アクセントの区別制御

出力内容

列名 データ型 説明
keyword varbinary(128) 16進数で表されたキーワード
group_id int 論理グループを区別する整数値
phrase_id int 複合単語を区別する整数値
occurrence int 各単語の順序
special_term nvarchar(4000) 用語の特性に関する情報を格納する。次のいずれかになる
 Exact match
 Noise word
 End of Sentence
 End of paragraph
 End of Chapter
display_term nvarchar(4000) 人間が判読できるキーワード
expansion_type int 特定の用語の拡張の特性に関する情報を格納する。次のいずれかになる
 「0」=1つの単語の場合
 「2」=変化形の拡張
 「4」=類義語辞典の拡張と置換
source_term nvarchar(4000) 特定の用語の生成元または解析元になった用語

動作例

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。