PolyBaseデータ移動サービスのワーカー情報を出力するSQL Server動的管理ビューレファレンス(54)

「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、PolyBaseデータ移動サービスのワーカー情報の出力について解説します。

» 2021年10月25日 05時00分 公開
[伊東敏章@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

SQL Server動的管理ビュー一覧

 本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理ビュー「sys.dm_exec_dms_workers」における、PolyBaseデータ移動サービス(DMS)のワーカー情報の出力について解説します。対応バージョンは、SQL Server 2016以降です。

概要

 PolyBase機能を使用した外部データソーステーブルを含むクエリの実行では、クエリはSQL Serverによって自動的に複数のステップに分割され、外部データを参照するクエリの一部はPolyBaseエンジンに渡されます。

 PolyBaseエンジンは外部データに対するクエリを解析してクエリプラン(DMSプラン)を生成し、作業を実行するためにコンピューティングノード上のDMSに配布します。DMSは配布されたDMSプランを実行し、外部データソースとのデータ転送を行います。

 「sys.dm_exec_dms_workers」動的管理ビューを使用することで、DMSプランを実行するワーカーに関する情報を確認できます。

 実行されたPolyBaseクエリに関する情報を確認できる「sys.dm_exec_distributed_requests」動的管理ビューや、分割されたステップの情報を出力できる「sys.dm_exec_distributed_request_steps」動的管理ビュー、各ノードへ配布されたクエリの情報を出力できる「sys.dm_exec_distributed_sql_requests」動的管理ビューなどと組み合わせることで、詳細にPolyBaseクエリの実行状況を追跡できます。

出力内容

列名 データ型 説明
execution_id nvarchar(32) このワーカーが含まれるクエリ要求のID
step_index int このワーカーが含まれるクエリステップのID
dms_step_index int このワーカーが実行するDMSプランのステップID
compute_node_id int このワーカーが実行されているノード
distribution_id int  
type nvarchar(32) このワーカースレッドの種類
status nvarchar(32) このワーカーが実行するステップのステータス
bytes_per_sec bigint  
bytes_processed bigint このワーカーによって処理された合計バイト数
rows_processed bigint  
start_time datetime ステップの実行を開始した時刻
end_time datetime ステップの実行が完了、キャンセルまたは失敗した時刻
total_elapsed_time int ステップが実行されている合計時間(ミリ秒)
cpu_time bigint  
query_time int  
buffers_available int  
dms_cpid int  
sql_spid int  
error_id nvarchar(36)  
source_info nvarchar(4000)  
destination_info nvarchar(4000)  
command nvarchar(4000)  
※いくつかの列について名前から情報を推測できそうですが、情報がみつかりませんでした。

動作例

 2つのノードでPolyBaseスケールアウトグループを構成し、SQL Server外部データソースおよび外部テーブルを作成しました(図1、図2)。

図1 図1 2つの計算ノードが構成された
図2 図2 T-SQLでSQL Server外部データソースと外部テーブルを作成した

 外部テーブルを集計するクエリを実行後に、「sys.dm_exec_dms_workers」動的管理ビューを出力します(図3、図4)。

図3 図3 パーティション列ごとに条件を満たすデータをカウントするクエリを実行した
図4 図4 「sys.dm_exec_dms_workers」動的管理ビューには大量のデータが出力された

 「sys.dm_exec_dms_workers」動的管理ビューには、過去1000件のPolyBaseクエリの情報が表示されます。実行したクエリに該当する情報がどのデータに該当するかを確認するには、先にクエリの「execution_id」を特定する必要がありそうです。

 実行したPolyBaseクエリの一覧を出力できる「sys.dm_exec_distributed_requests」動的管理ビューを出力して、クエリの実行時間などの情報から、先ほど実行したクエリの「execution_id」を特定します(図5)。

図5 図5 「start_time」や「end_time」列の値などから「execution_id」を特定(QID1125)できる

 特定した「execution_id」を使用して「WHERE」句を追加し、「sys.dm_exec_dms_workers」動的管理ビューを一度出力します(図6)。

図6 図6 DMSワーカーの実行情報が出力された

 実行したクエリの情報のみに限定して出力できました。「step_index」ごとに各DMSで多数のワーカーが実行されていることが分かります。「source_info」列と「destination_info」列の値から、ワーカーの実行内容が推測できそうです。

 各「step_index」の実行内容は「sys.dm_exec_distributed_request_steps」動的管理ビューを参照することで確認できます(図7)。

図7 図7 「sys.dm_exec_distributed_request_steps」動的管理ビューで「step_index」を調べられる

 「sys.dm_exec_dms_workers」動的管理ビューには「step_index 5、6」のみが存在しているため、「location_type」がDMSとなっているステップの情報が「sys.dm_exec_dms_workers」動的管理ビューに出力されるようです。

※本Tipsは、「Windows Server 2019」上に「SQL Server 2019 RC1」をインストールした環境を想定して解説しています。

筆者紹介

椎名 武史(しいな たけし)

日本ユニシス株式会社所属。Microsoft MVP for Data Platform(2017〜)。入社以来 SQL Serverの評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。SQL Serverのトラブル対応で社長賞の表彰を受けた経験も持つ。休日は学生時代の仲間と市民駅伝に参加し、銭湯で汗を流してから飲み会へと流れる。

伊東 敏章(いとう としあき)

日本ユニシス株式会社所属。入社以来SQL Server一筋で評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。社内のプログラミングコンテストで4回の優勝経験も持つ。趣味は輪行で週末は自転車を持っての旅行。目標は色々な日本百選を制覇すること。


Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

4AI by @IT - AIを作り、動かし、守り、生かす
Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。