列ストアインデックスの行グループ単位のアクティビティー統計に関する情報を出力する:SQL Server動的管理ビューレファレンス(111)
「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。今回は、列ストアインデックスの行グループ単位のアクティビティー統計に関する情報を出力する方法について解説します。
本連載では、「Microsoft SQL Server(以下、SQL Server)」で使用可能な動的管理ビューについて、動作概要や出力内容などを紹介していきます。今回は動的管理ビュー「sys.dm_db_column_store_row_group_operational_stats」における、列ストアインデックスの行グループ単位のアクティビティー統計に関する情報を出力する方法について解説します。対応バージョンは、SQL Server 2016以降、Azure SQL Database、Azure SQL Managed Instanceです。
概要
SQL Serverでは列ストアインデックスを使用して、列指向データ形式を使用したデータの格納や取得、管理が可能です。従来のインデックスである行ストア形式のインデックスは、データをシークして特定の値を検索するクエリや、狭い範囲の値でのクエリを実行する場合に最適なパフォーマンスを発揮します。列ストアインデックスは、大規模なテーブルで、大量のデータをスキャンする分析クエリを実行するときにパフォーマンスが高くなります。
列ストアインデックスでは、データは行グループ単位で管理されます。行グループは、同時に列ストア形式に圧縮される行のグループです。1つの行グループには、通常、行グループ当たりの最大行数である1,048,576行が含まれます。
「sys.dm_db_column_store_row_group_operational_stats」では、列ストアインデックスの行グループ単位のアクティビティー統計に関する情報を出力します。
出力内容
列名 | データ型 | 説明 |
---|---|---|
object_id | int | テーブルのオブジェクトID |
index_id | int | 列ストアインデックスのID |
partition_number | int | インデックス内のパーティション番号 |
row_group_id | int | 列ストアインデックスの行グループのID |
index_scan_count | int | インデックスがスキャンされた回数 |
scan_count | int | 行グループのスキャン回数 |
delete_buffer_scan_count | int | 行グループ内の削除された行の確認回数 |
rowgroup_lock_count | bigint | 行グループに対して行われたロック要求の累積数 |
rowgroup_lock_wait_count | bigint | 行グループのロックを待機した累積回数 |
rowgroup_lock_wait_in_ms | bigint | 行グループのロックを待機した累積ミリ秒数 |
returned_row_count | bigint | 返した行数 |
returned_aggregate_count | bigint | 返した集計数 |
returned_group_count | bigint | 返したグループ数 |
input_groupby_row_count | bigint | Group byの入力行数 |
動作例
列ストアインデックスを作成した直後に「sys.dm_db_column_store_row_group_operational_stats」を実行すると、列ストアインデックスの行グループ単位のアクティビティー統計に関する情報が出力されました(図1)。
作成直後では、アクティビティーの数値が「0」になっているため、別の列ストアインデックスを作成したり、列ストアインデックスに対する操作を実行したりしてから、再度「sys.dm_db_column_store_row_group_operational_stats」を実行しました(図2)。
列ストアインデックスを使用してデータを参照すると、「index_scan_count」列や「scan_count」列、「returned_row_count」列などが増加する様子が確認できます。この動的管理ビューはインスタンス全体での統計ではなく、データベース単位で出力されるため、データベースを指定して実行する必要があります。
また、インデックスの再構築やSQL Serverの再起動などを実行すると「sys.dm_db_column_store_row_group_operational_stats」の統計はリセットされるため、数値が「0」になったり、行が出力されなくなったりするため注意が必要です。
※本Tipsは、「Windows Server 2019」上に「SQL Server 2019」をインストールした環境を想定して解説しています。
筆者紹介
椎名 武史(しいな たけし)
BIPROGY株式会社(ビプロジー)所属。Microsoft MVP for Data Platform(2017〜)。入社以来 SQL Serverの評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。SQL Serverのトラブル対応で社長賞の表彰を受けた経験も持つ。休日は学生時代の仲間と市民駅伝に参加し、銭湯で汗を流してから飲み会へと流れる。
伊東 敏章(いとう としあき)
BIPROGY株式会社(ビプロジー)所属。入社以来SQL Server一筋で評価/設計/構築/教育などに携わりながらも、主にサポート業務に従事。社内のプログラミングコンテストで4回の優勝経験も持つ。趣味は輪行で週末は自転車を持っての旅行。目標は色々な日本百選を制覇すること。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- SQL Serverの動的管理ビューとは?
「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「動的管理ビュー」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。 - 「DMV(Dynamic Management View)」でパフォーマンス遅延の「原因」を調べる
本連載は、「Microsoft SQL Server」で発生するトラブルを「どんな方法で」「どのように」解決していくか、正しい対処のためのノウハウを紹介します。今回は、「処理遅延の原因を追求する“DMVの使い方”」を説明します。 - SQL Serverの動きを制御する「トレースフラグ」とは何か
「Microsoft SQL Server」が稼働するデータベースシステムを運用する管理者に向け、「トレースフラグ」の活用を軸にしたトラブル対策のためのノウハウを紹介していきます。初回は「トレースフラグとはそもそも何か」を解説します。