データ分析の形態は図1のようにピラミッドの構造で表すことができます。上に行くほど情報の専門性が高くなり、データ分析の要素が重要になってきますが、利用者の絶対数は多くありません。また、下に行くほど、情報は定型化されて一般ユーザーにも開放されるようになり、利用者は多くなります。このように1つの会社の中でも役割により、データの分析手法は異なります。利用者層に合わせた分析手法と分析ツールを選択することが重要です。
データマイニング
統計学のアルゴリズムを用いて、ツールが情報の中に隠れている潜在的なパターンや相関関係を発見したり、将来起こり得る事象を予測する仮説発見型の分析です。代表的な例としては、「日曜日に紙おむつを購入する人はビールも同時に購入するケースが多い」という傾向を割り出した、米ウォルマート社の事例があります。
多次元分析
分析者があらかじめ仮説を立てて、それを検証する分析です。複数の分析視点(次元)を組み合わせて分析できるために“多次元分析”と呼ばれています。売り上げデータの分析を例にしてみましょう。
多次元分析は、このように複数の次元を切り替えて、さまざまな角度で分析できるのが特徴です。また、多次元分析では分析するために集計したデータを格納する「キューブ」という独自のデータベースを構築します。
非定型検索
出力項目、出力形式、条件項目などを任意に設定してレポートを作成します。
定型検索
出力項目、出力形式、条件項目は固定で、条件の値を変えてレポートを作成します。
レポート参照
ほかのユーザーが作成したレポート(多次元分析やマイニングなど作成したレポート)を閲覧します。
Copyright © ITmedia, Inc. All Rights Reserved.