「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、PolyBaseデータ移動サービスのワーカー情報の出力について解説します。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理ビュー「sys.dm_exec_dms_workers」における、PolyBaseデータ移動サービス(DMS)のワーカー情報の出力について解説します。対応バージョンは、SQL Server 2016以降です。
PolyBase機能を使用した外部データソーステーブルを含むクエリの実行では、クエリはSQL Serverによって自動的に複数のステップに分割され、外部データを参照するクエリの一部はPolyBaseエンジンに渡されます。
PolyBaseエンジンは外部データに対するクエリを解析してクエリプラン(DMSプラン)を生成し、作業を実行するためにコンピューティングノード上のDMSに配布します。DMSは配布されたDMSプランを実行し、外部データソースとのデータ転送を行います。
「sys.dm_exec_dms_workers」動的管理ビューを使用することで、DMSプランを実行するワーカーに関する情報を確認できます。
実行されたPolyBaseクエリに関する情報を確認できる「sys.dm_exec_distributed_requests」動的管理ビューや、分割されたステップの情報を出力できる「sys.dm_exec_distributed_request_steps」動的管理ビュー、各ノードへ配布されたクエリの情報を出力できる「sys.dm_exec_distributed_sql_requests」動的管理ビューなどと組み合わせることで、詳細にPolyBaseクエリの実行状況を追跡できます。
列名 | データ型 | 説明 |
---|---|---|
execution_id | nvarchar(32) | このワーカーが含まれるクエリ要求のID |
step_index | int | このワーカーが含まれるクエリステップのID |
dms_step_index | int | このワーカーが実行するDMSプランのステップID |
compute_node_id | int | このワーカーが実行されているノード |
distribution_id | int | |
type | nvarchar(32) | このワーカースレッドの種類 |
status | nvarchar(32) | このワーカーが実行するステップのステータス |
bytes_per_sec | bigint | |
bytes_processed | bigint | このワーカーによって処理された合計バイト数 |
rows_processed | bigint | |
start_time | datetime | ステップの実行を開始した時刻 |
end_time | datetime | ステップの実行が完了、キャンセルまたは失敗した時刻 |
total_elapsed_time | int | ステップが実行されている合計時間(ミリ秒) |
cpu_time | bigint | |
query_time | int | |
buffers_available | int | |
dms_cpid | int | |
sql_spid | int | |
error_id | nvarchar(36) | |
source_info | nvarchar(4000) | |
destination_info | nvarchar(4000) | |
command | nvarchar(4000) | |
2つのノードでPolyBaseスケールアウトグループを構成し、SQL Server外部データソースおよび外部テーブルを作成しました(図1、図2)。
外部テーブルを集計するクエリを実行後に、「sys.dm_exec_dms_workers」動的管理ビューを出力します(図3、図4)。
「sys.dm_exec_dms_workers」動的管理ビューには、過去1000件のPolyBaseクエリの情報が表示されます。実行したクエリに該当する情報がどのデータに該当するかを確認するには、先にクエリの「execution_id」を特定する必要がありそうです。
実行したPolyBaseクエリの一覧を出力できる「sys.dm_exec_distributed_requests」動的管理ビューを出力して、クエリの実行時間などの情報から、先ほど実行したクエリの「execution_id」を特定します(図5)。
特定した「execution_id」を使用して「WHERE」句を追加し、「sys.dm_exec_dms_workers」動的管理ビューを一度出力します(図6)。
実行したクエリの情報のみに限定して出力できました。「step_index」ごとに各DMSで多数のワーカーが実行されていることが分かります。「source_info」列と「destination_info」列の値から、ワーカーの実行内容が推測できそうです。
各「step_index」の実行内容は「sys.dm_exec_distributed_request_steps」動的管理ビューを参照することで確認できます(図7)。
「sys.dm_exec_dms_workers」動的管理ビューには「step_index 5、6」のみが存在しているため、「location_type」がDMSとなっているステップの情報が「sys.dm_exec_dms_workers」動的管理ビューに出力されるようです。
※本Tipsは、「Windows Server 2019」上に「SQL Server 2019 RC1」をインストールした環境を想定して解説しています。
日本ユニシス株式会社所属。Microsoft MVP for Data Platform(2017〜)。入社以来 SQL Serverの評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。SQL Serverのトラブル対応で社長賞の表彰を受けた経験も持つ。休日は学生時代の仲間と市民駅伝に参加し、銭湯で汗を流してから飲み会へと流れる。
日本ユニシス株式会社所属。入社以来SQL Server一筋で評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。社内のプログラミングコンテストで4回の優勝経験も持つ。趣味は輪行で週末は自転車を持っての旅行。目標は色々な日本百選を制覇すること。
Copyright © ITmedia, Inc. All Rights Reserved.