「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、フルテキストインデックスの出力キーワードに関する情報を出力する方法について解説します。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理関数「sys.dm_fts_parser」における、フルテキストインデックスの出力キーワードに関する情報を出力する方法について解説します。対応バージョンは、SQL Server(サポートされている全てのバージョン)です。
SQL Serverではフルテキスト検索の機能を使用して、英語や日本語などの特定の言語の規則に基づいた言語検索を実行できます。フルテキスト関数を使用して大量のテキストデータを対象としたテキスト検索をする場合、全文検索をするLIKE句と比較して高速に実行できます。フルテキスト検索では、フォーマットされたバイナリデータ(Microsoft Wordドキュメントなど)を対象とすることもできます。
フルテキスト検索を使用するには、SQL Serverインスタンスに「検索のためのフルテキスト抽出とセマンティック抽出」機能を追加する必要があります。また、データベースにフルテキストカタログを作成し、対象のテーブルに対してフルテキストインデックスを作成する必要があります。
格納されているデータにフルテキストインデックスを作成すると、「sys.dm_fts_index_keywords」などを使用して、どのようなキーワードが登録されているか確認できます。ただし、キーワードを確認するには、実際にフルテキストインデックスを作成する必要がありました。
「sys.dm_fts_parser」では、引数で渡すクエリのフルテキストインデックスの出力キーワードに関する情報を出力します。
構文 sys.dm_fts_parser('query_string', lcid, stoplist_id, accent_sensitivity)
列名 | データ型 | 説明 |
---|---|---|
query_string | nvarchar(4000) | 解析するクエリ |
lcid | int | 解析に使用するワードブレーカーのロケール識別子 |
stoplist_id | int | ストップリストのID |
accent_sensitivity | bit | アクセントの区別制御 |
列名 | データ型 | 説明 |
---|---|---|
keyword | varbinary(128) | 16進数で表されたキーワード |
group_id | int | 論理グループを区別する整数値 |
phrase_id | int | 複合単語を区別する整数値 |
occurrence | int | 各単語の順序 |
special_term | nvarchar(4000) | 用語の特性に関する情報を格納する。次のいずれかになる Exact match Noise word End of Sentence End of paragraph End of Chapter |
display_term | nvarchar(4000) | 人間が判読できるキーワード |
expansion_type | int | 特定の用語の拡張の特性に関する情報を格納する。次のいずれかになる 「0」=1つの単語の場合 「2」=変化形の拡張 「4」=類義語辞典の拡張と置換 |
source_term | nvarchar(4000) | 特定の用語の生成元または解析元になった用語 |
Copyright © ITmedia, Inc. All Rights Reserved.