連載
» 2006年12月09日 00時00分 公開

ビジネスインテリジェンスとは何かSQL Server 2005で学ぶデータ分析(1)(2/3 ページ)

[高橋恭之,日本ユニシス株式会社]

データ分析の手法と利用者層

 データ分析の形態は図1のようにピラミッドの構造で表すことができます。上に行くほど情報の専門性が高くなり、データ分析の要素が重要になってきますが、利用者の絶対数は多くありません。また、下に行くほど、情報は定型化されて一般ユーザーにも開放されるようになり、利用者は多くなります。このように1つの会社の中でも役割により、データの分析手法は異なります。利用者層に合わせた分析手法と分析ツールを選択することが重要です。

図1 分析の手法と利用者層 図1 分析の手法と利用者層

データマイニング

 統計学のアルゴリズムを用いて、ツールが情報の中に隠れている潜在的なパターンや相関関係を発見したり、将来起こり得る事象を予測する仮説発見型の分析です。代表的な例としては、「日曜日に紙おむつを購入する人はビールも同時に購入するケースが多い」という傾向を割り出した、米ウォルマート社の事例があります。

多次元分析

 分析者があらかじめ仮説を立てて、それを検証する分析です。複数の分析視点(次元)を組み合わせて分析できるために“多次元分析”と呼ばれています。売り上げデータの分析を例にしてみましょう。

  1. 売り上げが伸びない原因が商品か店舗にあると仮定して、店舗、商品、期間という複数の次元を用意します。
  2. 最初は、期間別/店舗別で特定の期間で売り上げが低い店舗を洗い出します。
  3. 次に、店舗別/商品別で分析して、どの商品の売り上げが伸びていないのかを把握します。
  4. 最後に期間別/商品別で全店舗での商品の売り上げを見ることで、商品の問題か、店舗の問題かを切り分けできます。

 多次元分析は、このように複数の次元を切り替えて、さまざまな角度で分析できるのが特徴です。また、多次元分析では分析するために集計したデータを格納する「キューブ」という独自のデータベースを構築します。

非定型検索

 出力項目、出力形式、条件項目などを任意に設定してレポートを作成します。

定型検索

 出力項目、出力形式、条件項目は固定で、条件の値を変えてレポートを作成します。

レポート参照

 ほかのユーザーが作成したレポート(多次元分析やマイニングなど作成したレポート)を閲覧します。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。