【Oracle Database】パフォーマンスダウンに備えて取得する「4つ」の重要情報：データベースサポート最前線の現場から（9）（1/3 ページ）

データベース管理システムの運用でトラブルが発生したらどうするか。データベースサポートスペシャリストが現場目線の解決Tipsをお届けします。今回は、Oracle Databaseのパフォーマンスダウンに備える「定常的に取得しておくべき4つの情報」を紹介します。

» 2017年03月03日 05時00分公開

[大野高志，株式会社アシスト]

※本連載は、アシストのデータベースサポートスペシャリストによる「Database Support Blog」より、提供社の許可の下、一部修正して転載するものです。

連載バックナンバー

　アシストのサポートセンターには「パフォーマンスダウンが発生したので原因を教えてほしい」という問い合わせがよくあります。しかし、その原因を特定をするための調査に必要な情報が不足しているケースが多く、解決が非常に難しい課題の1つです。

　調査を効果的に行うには、サーバ、データベース、プロセスそれぞれの情報を普段から取得している必要があります。今回は、データベースのパフォーマンスダウンが発生してしまった場合に、原因を特定する確率を上げ、さらに再発を防ぐために必要な「網羅的な情報取得方法」を紹介します。

パフォーマンスダウンの調査が難しい理由

　「パフォーマンスダウンが発生した」場合の対処には、まず何が、なぜ遅くなったのかを切り分けるところから始めます。大まかに分けると、以下のような状況が考えられます。

サーバレベルでのパフォーマンスダウン（OSコマンドの応答に時間がかかる）
データベースレベルでのパフォーマンスダウン（あらゆるSQLの応答に時間がかかる）
特定のSQLレベルでのパフォーマンスダウン（他のSQLは問題ない）
接続レベルでのパフォーマンスダウン（データベースにつなるまでに時間がかかる）

　サーバやデータベースのレベルでパフォーマンスダウンが発生していた場合には、サーバ再起動などの対処を行った（行ってしまった）後で、原因を特定するための問い合わせを頂くケースが大半を占めます。

　サポートセンターでは、発生時の状況を伺い、その上で当時の状況を確認できる情報の提供を依頼します。しかし、調査で有効となる情報がそろっていることは、実はまれです。

　実際のサポートの現場での例として、「データベースで全体的にパフォーマンスダウンが発生した。当方はvmstatを定期的に取得している。それによると、該当時間帯ではCPU使用率が高かったようだ」と状況報告を頂くケースがあります。確かにvmstatから、パフォーマンスダウンが発生していた時間帯でCPU使用率が高かった事実は確認できます。しかし、どのプロセス／処理がCPU負荷を上げていたのかまでは分かりません。

　このケースでは、「プロセス単位の情報や該当時間帯のデータベースの稼働状況が分かる情報」も取得しておかなければなりません。それがなければ、該当時間帯に動作しているジョブや、過去の対応などからの推測をお伝えするにとどまり、解決のためには「再現時に備えた情報取得」を依頼することになります。この「再現時に備えた情報取得」とは、「もう1度その問題を発生をさせてください」と“その環境に不利益が発生することを承知の上”でお願いすることになります。個人的に、サポートをしていく上で最も避けたい回答の1つです。

トラブル解決につながる「取得しておくべき4つの情報」

「新機能」「廃止機能」「サポート状況」から見たユーザーにとってのOracle Database 12c
Oracle Database導入を実施ならびに支援するサービスプロバイダという筆者の立場から、ユーザーにとっての新バージョンの意義を考えながら、新機能や廃止された機能などを紹介します。
オラクルが確約した「クラウド6箇条」と「Database 12c R2」の気になるトコロ
米オラクルのラリー・エリソンCTOが、同社の年次イベントで今後のクラウド事業の行方を確約する「Oracle Cloud、6つの設計目標」を掲げました。同時に発表された基幹製品「Oracle Database 12c」の次期バージョンのポイントと共に、そこにどんな狙いがあるかを振り返ります。
オラクルのエリソン会長、「Oracle Database」最新版や多数のクラウドイノベーションを発表
米オラクルのラリー・エリソン氏は「Oracle OpenWorld 2016」の開幕基調講演を行い、同社のクラウドコンピューティングプラットフォーム全般にわたる多くのイノベーションを披露した。
【Oracle Database】忘れていませんか？「アラートログ調査」に必要な、たった3つのキホン
データベース管理システムの運用でトラブルが発生したらどうするか。データベースサポートスペシャリストが現場目線の解決Tipsをお届けします。今回は基本編として「アラートログの調査で押さえるべき3つのポイント」を解説します。【Oracle Database 12c対応版】
Oracle運用の基本「ログ」を理解しよう
本連載では、Oracle Database運用の鍵となるトラブル対処法について紹介していきます。第1回、第2回では情報収集の要となるログについて見ていきます。ログの出力情報は10gと11gとでは大きく異なる点がありますので、それぞれについても確認しておきましょう。
カーソル・エラーとオブジェクトの問題切り分け
Oracleデータベースの運用管理者は、突発的に直面するパフォーマンス障害にどうやって対処したらよいか。本連載は、非常に複雑なOracleのアーキテクチャに頭を悩ます管理者に向け、短時間で問題を切り分け、対処法を見つけるノウハウを紹介する。対象とするバージョンはOracle8から9iまでを基本とし、10gの情報は随時加えていく。（編集局）
IF文のネスト地獄から抜け出せるMERGE文