【PostgreSQL】本番稼働中のPostgreSQLシステムで押さえておくべき「3つ」の監視項目:データベースサポート最前線の現場から(10)(2/2 ページ)
データベース管理システムの運用でトラブルが発生したらどうするか。データベースサポートスペシャリストが現場目線の解決Tipsをお届けします。今回は、監視ツールを活用してPostgreSQLを監視する際に最低限押さえておくべき「監視項目」を紹介します。
- (方法2)PostgreSQL標準ログ以外を使用する
もう1つは、「syslog」や「rotatelogs」などの外部のログローテーションツールを使う方法です。
syslogを使用する場合は、「PGDATA/postgresql.conf」の以下2つのパラメーターを変更し、「pg_ctl reload」コマンドで設定を反映します。
log_destination='stderr,syslog'
log_destination='syslog'
rotatelogsを使用する場合は、サーバの標準エラー出力をパイプでrotatelogsコマンドに渡すようにします。
$ pg_ctl start | rotatelogs /var/log/pgsql_log 86400
3:「ディスク空き容量」の監視
監視目的と監視対象
ディスクの空き容量は、データ破損やデータベースの異常停止を予防するために監視します。
まず、PGDATA、TABLESPACE機能やアーカイブWAL(Write Ahead Log:ログ先行書き込み)ファイルで使用しているディスクの空き容量を監視するとよいでしょう。これらで使用するディスクの空き容量が不足すると、データやWALファイルが破損するリスクが高まるためです。また、WALファイルを格納するファイルシステムが容量不足になると、データベースサーバは「PANIC」のメッセージレベルで異常停止してしまいます。
ディスク空き容量監視の「しきい値」について
ディスク容量は「どれだけ残っていれば大丈夫」なのでしょう。もちろん、システムの規模や重要度、監視ツールから警告を検知した後の処理内容によって、アラートを出すしきい値の設定は変わります。例えば、ディスク空き容量が「残り1%」でアラートを認識したとしても、対処が間に合わずに枯渇してしまっては意味がありません。
1つの指針としては、「アラートが出て、対処が完了するまでの時間」を考慮した値にすることです。足りなくなった容量への対処として、ストレージ装置を手配して、設置し、運用が開始されるまでの時間なども含めて考えるということです。
今回は、PostgreSQLの動作状況を監視するのに最低限必要となる「プロセス」「ログファイル」「ディスク空き容量」の項目を解説しました。これらの情報を監視ツールを用いながら適切に監視することで、データベースの障害や障害につながる問題をより早く対処できます。ぜひこの機会に今回紹介した監視項目の設定が正しく行われているかを確認してみてください。
筆者紹介
家島拓也
2007年アシスト入社。オラクル製品やPostgreSQL/EDB Postgres製品のサポートに従事。最前線のサポート対応で得た知識や知見を元に、顧客が困ることの多い問題/課題や各製品の新機能に関する検証結果に関する情報発信も行っている
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 「新機能」「廃止機能」「サポート状況」から見たユーザーにとってのOracle Database 12c
Oracle Database導入を実施ならびに支援するサービスプロバイダという筆者の立場から、ユーザーにとっての新バージョンの意義を考えながら、新機能や廃止された機能などを紹介します。 - オラクルが確約した「クラウド6箇条」と「Database 12c R2」の気になるトコロ
米オラクルのラリー・エリソンCTOが、同社の年次イベントで今後のクラウド事業の行方を確約する「Oracle Cloud、6つの設計目標」を掲げました。同時に発表された基幹製品「Oracle Database 12c」の次期バージョンのポイントと共に、そこにどんな狙いがあるかを振り返ります。 - オラクルのエリソン会長、「Oracle Database」最新版や多数のクラウドイノベーションを発表
米オラクルのラリー・エリソン氏は「Oracle OpenWorld 2016」の開幕基調講演を行い、同社のクラウドコンピューティングプラットフォーム全般にわたる多くのイノベーションを披露した。 - 【Oracle Database】忘れていませんか? 「アラートログ調査」に必要な、たった3つのキホン
データベース管理システムの運用でトラブルが発生したらどうするか。データベースサポートスペシャリストが現場目線の解決Tipsをお届けします。今回は基本編として「アラートログの調査で押さえるべき3つのポイント」を解説します。【Oracle Database 12c対応版】 - Oracle運用の基本「ログ」を理解しよう
本連載では、Oracle Database運用の鍵となるトラブル対処法について紹介していきます。第1回、第2回では情報収集の要となるログについて見ていきます。ログの出力情報は10gと11gとでは大きく異なる点がありますので、それぞれについても確認しておきましょう。 - カーソル・エラーとオブジェクトの問題切り分け
Oracleデータベースの運用管理者は、突発的に直面するパフォーマンス障害にどうやって対処したらよいか。本連載は、非常に複雑なOracleのアーキテクチャに頭を悩ます管理者に向け、短時間で問題を切り分け、対処法を見つけるノウハウを紹介する。対象とするバージョンはOracle8から9iまでを基本とし、10gの情報は随時加えていく。(編集局) - IF文のネスト地獄から抜け出せるMERGE文