ログローテーションとAnalogの導入:ApacheによるWebサーバ構築(14)(1/3 ページ)
前回、ログを記録する方法を紹介したが、記録しただけでは役に立たない。今回は、ログファイルの管理方法と、ログの分析手段として「Analog」の導入・運用方法を紹介する。
前回は、Apacheが記録するアクセスログやエラーログの設定について紹介した。いうまでもないと思うが、ログというものはただ記録しただけでは何の意味もない。それどころか、ログの管理を怠るとディスク容量を圧迫するだけの無用の長物になりかねない(これを「ディスクの肥やし」などという)。
そうしたことが起こらないよう、定期的に管理・運用するのも管理者の務めである。そこで、今回はログの定期的なローテーションとその内容分析について紹介する。
ログファイルのローテーション
先述したように、ログファイルを放っておくとディスクを圧迫することになりかねない。それだけでなく、ログファイルのサイズが大きくなれば、ログの解析にも悪影響を及ぼす。サイズが大きいと、ファイルを開くこと自体が困難になるし、問題の個所を発見しづらくなる。
そこで、最低でも週に1度くらいの割合で、ログファイルのローテーションを行う(図1)。このようにファイルをローテーションすることで、ファイル1つ当たりのサイズと含まれる情報を必要最小限に抑える。また、過去のログは何世代分か前のものまで保持し、必要に応じて過去にさかのぼれるようにするのである。
この方式は時間をきっかけにローテーションするから、ファイル1つ1つのサイズは予測できない。それに、管理対象世代を過ぎたログは、自動的に削除されてしまう。従って、ログを残しておきたい場合は削除される前にテープ装置などでバックアップしなければならない。それでもログのサイズが大きくなり過ぎるようなら、ローテーションのタイミングや管理する世代数を見直さなくてはならない。このように、多少の工夫や配慮は必要になるものの、この方式は柔軟性も高く運用も容易である。そのため、Linuxや商用UNIXではログの管理にこの方式を用いることが多い。
ログローテーションを行う2種類のプログラム
最近のLinuxディストリビューションには、このログをローテーションするためのプログラムが初めから含まれている。それが「logrotate」である(注)。これは、通常「/usr/sbin」以下に用意されていて、「/etc/logrotate.conf」の内容に従って動作する。ただし、/etc/logrotate.confの設定を書き換えただけではlogrotateは動かない。実際にログをローテーションさせるためには、cronなどを使ってlogrotateを定期的に呼び出してやる必要がある。とはいえ、Linuxを導入した時点でcronの設定も行われているから心配は要らない。
注:ちなみに、Solarisでは/usr/lib/newsyslogがこれに相当する。
logrotateでApacheのログをローテーションさせるなら、/etc/logrotate.confに設定を追加するだけでOKだ。しかし、Apacheにはログローテーションを行う独自のプログラムが付属している。それが「rotatelogs」である。
rotatelogsは、Apacheのバイナリが格納されているディレクトリ(通常は/usr/local/apache/bin)に用意されており、その設定はhttpd.confで行う。具体的には、次のように「TransferLogディレクティブ」を使う。
TransferLog "|/usr/local/apache/bin/rotatelogs /usr/local/apache/logs/access_log 86400" TransferLog "|/usr/local/apache/bin/rotatelogs /usr/local/apache/logs/error_log 86400"
TransferLogディレクティブの設定値は、3つのパートから成る。
- ログをローテーションする「rotatelogs」のパスとファイル名
- ローテーションするログのパスとファイル名
- ローテーションするまでの間隔(秒単位)
である。
上記の設定例の場合、access_logとerror_logのそれぞれを24時間(8万6400秒)ごとにローテーションする。ローテーション間隔は、必要に応じて長くしたり短くしたりすればよい。
logrotateとrotatelogsの違い
logrotateとrotatelogsには、重要な違いが2つ存在する。切り出したログの履歴管理方法と、切り出し後のログファイルの扱い方である。
logrotateは、logrotate.confで指定した世代数(rotateで指定)を超えると、それより古いものは自動的に削除する。それに対し、rotatelogsは管理する世代数を設定しない。そのため、切り出したログファイルは管理者の手で消されるまでディスク上に保存されることになる。2つ目の違いは、logrotateが切り出し後のログファイルをクリアするのに対し、rotatelogsはログファイルをクリアしないことである。
この違いを踏まえて考えると、Apache標準のrotatelogsにはメリットもあればデメリットもある。メリットは、頻繁にログを切り出してもログが消えてしまう心配がないこと。デメリットは、切り出したログを整理しないと、ディスクの領域を浪費することだ。
Apacheのログを分析もせずに捨てるのは、あまり褒められることではない。有益な情報が多数記録されているからである。かといって、切り出した分のログがクリアされないのも、ディスク領域のことを考えれば問題となる。もしrotatelogsを使うのであれば、切り出した分のログをクリアする方法も併せて検討する必要がある。筆者は、シェルスクリプトを作って、切り出した分のログは余裕を持って削除していた(1日に1度、自動的に切り出し、2日前までのログを消していた)。
これらの問題を考慮すると、切り出されたログをちゃんと管理するという前提でlogrotateを使う方をお勧めしたい。
コラム Apache 2.0正式版リリース
ご存じの方も多いと思うが、Apache 2.0の正式版である2.0.35の配布が開始された。多くのApacheユーザーにとって、これは久々のビッグニュースといえるだろう。
Apache 2.0については、Apache 2.0の新機能とその実力で詳しく紹介しているが、メジャー・バージョンアップにふさわしく、大幅な改良が加えられている。使い方については従来の知識が通用するから恐れる必要はないが、いきなりバージョンアップするのは控えたい。まずはテスト用の環境を使って、新機能や改良点を確認しつつ、本番環境へ適用すべきだろう。
今後、どこまでApache 1.x系のメンテナンスが行われるのかは定かでないが、いまのところはApache 2.0と並行して、Apache1.xもメンテナンスと配布が行われている。Apache 2.0がもう少し枯れるのを待つも良し、早々に試すも良しだろう。
Copyright © ITmedia, Inc. All Rights Reserved.