- PR -

ログ解析に必要な情報(収集しておいた方がよいデータ)は?+α

1
投稿者投稿内容
めぐりん
会議室デビュー日: 2004/10/01
投稿数: 5
投稿日時: 2004-10-09 17:40
お世話になります。質問がいくつもありますがよろしくお願い致します。

1.ログ解析に必要な情報は?
→今、ログ解析ツールもどき?を作っているのですが、ログ解析をするに
あたり、収集しておいた方が良いと思われる情報を教えて頂きたいのです。
どんなことをするのかにもよるかと思うのですが、自分が作ろうとしてい
るのは、よく無料とかで利用されるようなごくごく一般的な?解析です。
日別・時間別・曜日別・週別・月別のアクセス数の集計やリンク元サイトの
ランキングなど…。他にもありますが、まだやり方が分かりません(ーー;)

2.ログ解析の仕方
→例えば時間別のアクセス数の集計をしたい場合、今は時間を2通りで取得
(何時何分何秒・何時のみ)しているのですが、何時何分何秒を取得してお
けば時間別の集計ってできるんでしょうか?なんかまわりくどいやり方をし
ているような気がするんです。(前者は生ログ閲覧のために取得・後者はも
ちろん時間別のアクセス数の集計をするために取得)
またuser-agentを取得することにより、クライアントの使用しているOSや
ブラウザの判断もできると思うのですが、羅列した文字列の中からどうやっ
て参照→判断したらいいんでしょうか?(初心者な質問で申し訳ありません)

3.収集したログ情報のファイル化?
→収集したログ情報は、MySQLを利用してデータベース化しているのですが、
延々とデータベースに書き込んでもいいんでしょうか?ある程度たまったら
(一ヶ月とか)ファイル化?した方が良いのでしょうか?そもそもこの考え
方自体が間違っているんでしょうか?

4.できれば…
→上述しているように、初心者なため的を得ない質問をしていたらすみませ
ん。
できることなら行動履歴?ページ到達率?とかも解析したいのですが、どな
たかやり方でなくてもヒントなど教えて頂けると有難いです。(すみません、
わがままで…)

5.ログ解析とは関係ないんですけど…
→自分の借りているレンタルサーバーでJSPやServletを使用する際、

 |−java
 |  |−WEB-INF
 |  |  |ーclasses←servletはここ
 |  |←JSPはここ
 |  |−フォルダ
 |  |
 |−public_html←普通のhtmlファイルはここ

と設置しなくてはならないのですが、ローカル上でeclipseを利用して
作成しているのと同じように
・/java/フォルダ(eclipse上のプロジェクト名)/WEB-INF/classesの
servletで認識して欲しい
・/java/フォルダ/…を、/フォルダ/…というバスで認識させたい
・フィルタをjava配下及びpublic_html配下全てに適用させたい
のです。
おそらく、これらのことを実現させるにはserver.xml(context.xml?)
もしくはweb.xmlを記述(加工?)してどこかに置けばいいと思うんで
すが、書き方もどこに置くかも分かりません。どなたか教えて頂けない
でしょうか?(レンタルサーバーのサポートに聞いた方がいいのかもし
れないんですけど…)


以上、ほんとに質問ばかりで恐縮ですが何卒よろしくお願い致します。
未記入
常連さん
会議室デビュー日: 2004/08/21
投稿数: 41
投稿日時: 2004-10-15 09:43

ホスト名、どこのリンクからやってきたか、エージェント、日付などを収集しておいた方が良いのではないでしょうか。
日付はDBに保存するときにString型で20041015071522などで取得しておけば後から色々と加工できてよいのではないかと思います。
DB&JSPで作成するのならSQL文で月別、日別、時間別、エージェント別...などで取り出せばアクセス解析らしくなると思います。
リレーショナルデーターベースを使用しているのなら数万件保存していても大丈夫だと思います。(検索条件に使用する列にはインデックスを張っておいた方が良いと思いますが)
行動履歴はCookieを使用するらしいです。ページ到達率は良く分かりません。
ディレクトリ構成を同じにしたいという件はWEB-INF直下に自作Web.xmlを置いて自分で設定すればできたと思います。たしか
いくつかあいまいな部分もありますが参考になればと思います。
1

スキルアップ/キャリアアップ(JOB@IT)