「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、フルテキストインデックスバッチの実行情報の一覧を出力する方法について解説します。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理ビュー「sys.dm_fts_outstanding_batches」における、フルテキストインデックスバッチの実行情報の一覧を出力する方法について解説します。対応バージョンは、SQL Server(サポートされている全てのバージョン)です。
SQL Serverではフルテキスト検索の機能を使用して、英語や日本語などの特定の言語の規則に基づいた言語検索を実行できます。フルテキスト関数を使用して、大量のテキストデータを対象としたテキスト検索をする場合、全文検索を行うLIKE句と比較して高速に実行できます。フルテキスト検索では、フォーマットされたバイナリデータ(Microsoft Wordドキュメントなど)を対象とすることもできます。
フルテキスト検索を使用するには、SQL Serverインスタンスに「検索のためのフルテキスト抽出とセマンティック抽出」機能を追加する必要があります。また、データベースにフルテキストカタログを作成し、対象のテーブルに対してフルテキストインデックスを作成する必要があります。
フルテキスト検索では、SQL Serverプロセス(sqlservr.exe)以外に、フィルターデーモンホストプロセス(fdhost.exe)が使用されます。フィルターデーモンホストプロセスは、SQLフルテキストフィルターデーモンランチャー(SQL Full-text Filter Daemon Launcher)サービスによって起動され、SQL Serverのフルテキスト検索でドキュメントからテキストを抽出するフィルター処理やテキストの単語区切り処理をします。
「sys.dm_fts_outstanding_batches」動的管理ビューでは、フィルターデーモンホストプロセスに要求されたフルテキストインデックスバッチ処理の実行情報の一覧を出力できます。
列名 | データ型 | 説明 |
---|---|---|
database_id | int | データベースID |
catalog_id | int | フルテキストカタログID |
table_id | int | フルテキストインデックスを含むテーブルのID |
batch_id | int | バッチID |
memory_address | varbinary(8) | バッチオブジェクトのメモリアドレス |
crawl_memory_address | varbinary(8) | クロールオブジェクトのメモリアドレス |
memregion_memory_address | varbinary(8) | フィルターデーモンホスト(fdhost)の送信共有メモリのメモリアドレス |
hr_batch | int | バッチの最新のエラーコード |
is_retry_batch | bit | これが再試行バッチであるかどうか 「0」=いいえ 「1」=はい |
retry_hints | int | バッチに必要な再試行の種類 「0」=再試行なし 「1」=マルチスレッドでの再試行 「2」=シングルスレッドの再試行 「3」=シングルスレッドおよびマルチスレッドでの再試行 「5」=マルチスレッドでの最終再試行 「6」=シングルスレッドでの最終再試行 「7」=シングルスレッドおよびマルチスレッドでの最終再試行 |
retry_hints_description | nvarchar(120) | retry_hintsの説明 NO RETRY MULTI THREAD RETRY SINGLE THREAD RETRY SINGLE AND MULTI THREAD RETRY MULTI THREAD FINAL RETRY SINGLE THREAD FINAL RETRY SINGLE AND MULTI THREAD FINAL RETRY |
doc_failed | bigint | バッチ内の失敗したドキュメントの数 |
batch_timestamp | timestamp | バッチの作成時に取得されたタイムスタンプ値 |
フルテキストカタログが構築中ではない状態で、「sys.dm_fts_outstanding_batches」動的管理ビューを出力します。結果のデータは表示されませんでした(図1)。
次に、フルテキストカタログを再構築中に「sys.dm_fts_outstanding_batches」動的管理ビューを出力します。結果が表示されました(図2)。
「database_id」列や「table_id」列が含まれますので、現在処理中のテーブルについて確認できます(図3)。そのため、「sys.dm_fts_outstanding_batches」動的管理ビューを出力することで、フルテキストカタログの再構築に時間がかかる原因となっているテーブルを特定できます。
「batch_id」列の値については、「sys.dm_exec_requests」動的管理ビューの「session_id」列などとの比較をしましたが、一致しそうな動的管理ビューの列は見つかりませんでした。フルテキストカタログを再構築するたびに値が増加したため、フルテキストインデックスバッチを区別する通し番号のようでした。
※本Tipsは、「Windows Server 2019」上に「SQL Server 2019」をインストールした環境を想定して解説しています。
BIPROGY株式会社(ビプロジー)所属。Microsoft MVP for Data Platform(2017〜)。入社以来 SQL Serverの評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。SQL Serverのトラブル対応で社長賞の表彰を受けた経験も持つ。休日は学生時代の仲間と市民駅伝に参加し、銭湯で汗を流してから飲み会へと流れる。
BIPROGY株式会社(ビプロジー)所属。入社以来SQL Server一筋で評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。社内のプログラミングコンテストで4回の優勝経験も持つ。趣味は輪行で週末は自転車を持っての旅行。目標は色々な日本百選を制覇すること。
Copyright © ITmedia, Inc. All Rights Reserved.