検索
連載

PolyBaseのワーカーごとの処理に関する情報を出力するSQL Server動的管理ビューレファレンス(56)

「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、PolyBaseのワーカーごとの処理に関する情報の出力について解説します。

Share
Tweet
LINE
Hatena

SQL Server動的管理ビュー一覧

 本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理ビュー「sys.dm_exec_external_work」における、PolyBaseのワーカーごとの処理に関する情報の出力について解説します。対応バージョンは、SQL Server 2016以降です。

概要

 PolyBaseが外部テーブルに対して処理を実行すると、ワーカーごとに処置が実行されます。複数の外部テーブルを使用するクエリが実行された場合、それぞれの外部テーブルへのアクセスには異なるワーカーが使用されます。

 「sys.dm_exec_external_work」を実行すると、PolyBaseのワーカーごとの処理に関する情報を出力します。

出力内容

列名 データ型 説明
execution_id nvarchar(32) 要求に関連付けられているID
step_index int 手順のシーケンス内の位置
dms_step_index int DMSのシーケンス内の位置
compute_node_id int ノードのID
type nvarchar(60) 作業の種類
work_id int 分割されたID
input_name nvarchar(4000) 読み取る入力の名前
read_location bigint 読み取り位置のオフセット
read_command nvarchar(4000) 送信されるクエリ
bytes_processed bigint 処理のために割り当てられた合計バイト数
length bigint Hadoopの分割またはHDFSブロックの長さ
status nvarchar(32) ワーカーの状態
start_time datetime 開始日時
end_time datetime 終了日時
total_elapsed_time int ミリ秒単位の合計時間
compute_pool_id int コンピューティングプールのID

動作例

 PolyBaseのスケールアウトグループを構成した環境で「sys.dm_exec_external_work」を実行すると、ワーカーごとの処理に関する情報が出力されました(図1)。

図1
図1 ワーカーごとの処理に関する情報が出力された

 SQL Server 2019では新たに「compute_pool_id」列が追加されています。ワーカーごとに出力されるため、1つのクエリで複数の外部テーブルを操作していた場合は、複数行出力されます。また、処理が完了しても再起動などを実施しない限り保存されるため、「read_command」列のクエリから調査したい「execution_id」を確認することもできます。

※本Tipsは、「Windows Server 2019」上に「SQL Server 2019 RC1」をインストールした環境を想定して解説しています。

筆者紹介

椎名 武史(しいな たけし)

日本ユニシス株式会社所属。Microsoft MVP for Data Platform(2017〜)。入社以来 SQL Serverの評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。SQL Serverのトラブル対応で社長賞の表彰を受けた経験も持つ。休日は学生時代の仲間と市民駅伝に参加し、銭湯で汗を流してから飲み会へと流れる。

伊東 敏章(いとう としあき)

日本ユニシス株式会社所属。入社以来SQL Server一筋で評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。社内のプログラミングコンテストで4回の優勝経験も持つ。趣味は輪行で週末は自転車を持っての旅行。目標は色々な日本百選を制覇すること。


Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る