ログローテーションとAnalogの導入:ApacheによるWebサーバ構築(14)(2/3 ページ)
前回、ログを記録する方法を紹介したが、記録しただけでは役に立たない。今回は、ログファイルの管理方法と、ログの分析手段として「Analog」の導入・運用方法を紹介する。
Analogの導入によるアクセスログの分析
「ログの分析」とは、記録されたテキストをある一定の基準で集計することにほかならない。たまたまテキストファイルだからそれが難しくなってしまうが、これがデータベース上のデータであればSQLで簡単にできることだし、表計算ソフトであればもっと簡単だ。もちろん、UNIXのコマンドに精通した人であれば、ある程度の分析(集計)は簡単にこなしてしまうだろう。
例えば、記録された行を数えれば「ヒット数」が分かる。これは、UNIXのwcコマンドで簡単にできる。しかし、そこから先はどんどん難しくなっていくし、それぞれの基準で集計コマンドをいくつも走らせるのは面倒だ。おまけに、結果をひと目で見ることもできないから、集計結果から何かを得るのが難しい。
そこで、こうした操作を自動化し、結果を見やすく編集するツールのニーズが生まれる。こうしたツールは多数用意されており、その機能も千差万別だ。高機能なものはWebサイト内の人気ランキングだけでなく、そこからどのページに移動する人が多いのか、どのサイトから移動してくるユーザーが多いのかなども容易に把握できる。
専門的かつ高機能なツールは、商用サイトのアクセスログの分析に用いられているが、価格も相応に高価である。その点、ここで紹介する「Analog」は、必要十分な機能を満たしているうえに無償であることから、多くのサイトで愛用されている。高価なツールほどの機能は求めないものの、ログを分析して情報を把握したい、といった向きにはぴったりだろう。
無償だから、まず試してみて不足を感じる部分を探してみるといい。そのうえで、不足している部分を補ってくれる市販のツールを探せばいいからだ。
Analogの導入
Analogのインストールは、だれにでも実に簡単に行える。Analogの公式サイト(http://www.analog.cx/、日本語はhttp://www.jp.analog.cx/)では、過去のバージョンも含め、多くの環境向けのファイルが配布されている。Linux用は、ソースコードのほかにRPMも用意されているから、RPMを使うのもいいだろう(編注)。
編注:5.21以前のAnalogにはセキュリティホールがあることが確認されている。必ず最新版(2002年4月現在は5.22)を使用すること。
この手のツールはオプションをあれこれと指定することもない。従って、筆者もこの手のツールに関しては、RPMを積極的に利用している。ちなみに、RPMでソフトウェアをインストールする手順は以下のとおりだ。
- rootユーザーになる
- 「rpm -ivh RPMファイル名」でインストール
- 念のために「rpm -q パッケージの名前」で確認
無事にインストールされると、「/usr/local/bin/analog」や「/etc/analog.cfg」といったファイルが作られる。
Analogの出力とログファイルの関係
結果のサンプルは、筆者の実験機では自分のアクセスしかなくて参考にならないし、筆者の顧客のものを出すわけにもいかない。申し訳ないが、Analogの公式サイトに掲載されているもの(http://www.statslab.cam.ac.uk/webstats/stats.htmlあるいはhttp://www.jp.analog.cx/501/sjis/outsjis.html)を参考にしてほしい。
結果サンプルを見ると分かるとおり、Analogはログファイルに記録された情報を可能な限り個別の切り口に分けて集計する。このサンプルに掲示されている情報に限らず、設定のカスタマイズによってほかの情報(例えば使っているWebブラウザの種類など)を見ることもできる。
重要なのは、Analogが分析して表示できるのは分析対象としたログファイルの範囲に限られるということだ。これは当たり前のことだが、日別に切り出したログを分析させれば、その日の分だけを対象に分析が行われる。すなわち、ほかの日との比較は、出力結果を自分で見比べるしかないということである。必要であれば、分析対象とするログファイルを複数にすればよい。ただし、あまり多くのログ(例えば1年分)を分析させると、それだけ時間もかかる。どの単位で分析するか、試しながら調整していくしかないだろう。
Copyright © ITmedia, Inc. All Rights Reserved.