PolyBaseでプッシュダウンした処理に関する情報を出力する:SQL Server動的管理ビューレファレンス(55)
「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、PolyBaseでプッシュダウンした処理に関する情報の出力について解説します。
本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理ビュー「sys.dm_exec_external_operations」における、PolyBaseでプッシュダウンした処理に関する情報の出力について解説します。対応バージョンは、SQL Server 2016以降です。
概要
「Hadoop」への操作では、プッシュダウンを使用してクエリの演算子でパフォーマンスを改善させることができます。「sys.dm_exec_external_operations」を実行すると、PolyBaseでプッシュダウンした処理に関する情報を出力します。
出力内容
列名 | データ型 | 説明 |
---|---|---|
execution_id | nvarchar(32) | 要求に関連付けられているID |
step_index | int | 手順のシーケンス内の位置 |
operation_type | nvarchar(128) | 外部の操作の種類 |
operation_name | nvarchar(4000) | 外部の操作の名前 |
map_ progress | float | マップジョブが入力したデータの割合 |
reduce_progress | float | reduceジョブが完了した割合 |
compute_pool_id | int | コンピューティングプールのID |
動作例
まず「sys.dm_exec_external_operations」を実行して出力される列を確認します(図1)。
SQL Server 2019では、新たに「compute_pool_id」列が追加されています。Hadoopに対してPolyBaseのスケールアウトグループを構成した環境で「sys.dm_exec_external_operations」を実行すると、PolyBaseでプッシュダウンした処理に関する情報が出力されます。
プッシュダウンには「=」や「<」などの比較演算子や、「+」や「-」などの算術演算子、「AND」や「OR」などの論理演算子を使用できます。クエリのオプションで「OPTION」(FORCE EXTERNALPUSHDOWN)を使用すると、プッシュダウンを強制できます。もし、プッシュダウンを使用したくない場合は、「OPTION」(DISABLE EXTERNALPUSHDOWN)の使用も可能です。
※本Tipsは、「Windows Server 2019」上に「SQL Server 2019 RC1」をインストールした環境を想定して解説しています。
筆者紹介
椎名 武史(しいな たけし)
日本ユニシス株式会社所属。Microsoft MVP for Data Platform(2017〜)。入社以来 SQL Serverの評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。SQL Serverのトラブル対応で社長賞の表彰を受けた経験も持つ。休日は学生時代の仲間と市民駅伝に参加し、銭湯で汗を流してから飲み会へと流れる。
伊東 敏章(いとう としあき)
日本ユニシス株式会社所属。入社以来SQL Server一筋で評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。社内のプログラミングコンテストで4回の優勝経験も持つ。趣味は輪行で週末は自転車を持っての旅行。目標は色々な日本百選を制覇すること。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
SQL Serverの動的管理ビューとは?
「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。「DMV(Dynamic Management View)」でパフォーマンス遅延の「原因」を調べる
本連載は、「Microsoft SQL Server」で発生するトラブルを「どんな方法で」「どのように」解決していくか、正しい対処のためのノウハウを紹介します。今回は、「処理遅延の原因を追求する“DMVの使い方”」を説明します。SQL Serverの動きを制御する「トレースフラグ」とは何か
「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「トレースフラグ」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。初回は「トレースフラグとはそもそも何か」を解説します。