ビジネスインテリジェンスとは何か:SQL Server 2005で学ぶデータ分析(1)(2/3 ページ)
ビジネスインテリジェンス(BI)の概要を解説した記事が多くのメディアで取り上げられるようになり、その基本的な理解は深まったと思われる。このような現状を踏まえ、本連載ではさらに一歩踏み込んだ内容として、データ分析の手法や注意点に焦点を絞った実践的な解説を展開する。(編集部)
データ分析の手法と利用者層
データ分析の形態は図1のようにピラミッドの構造で表すことができます。上に行くほど情報の専門性が高くなり、データ分析の要素が重要になってきますが、利用者の絶対数は多くありません。また、下に行くほど、情報は定型化されて一般ユーザーにも開放されるようになり、利用者は多くなります。このように1つの会社の中でも役割により、データの分析手法は異なります。利用者層に合わせた分析手法と分析ツールを選択することが重要です。
データマイニング
統計学のアルゴリズムを用いて、ツールが情報の中に隠れている潜在的なパターンや相関関係を発見したり、将来起こり得る事象を予測する仮説発見型の分析です。代表的な例としては、「日曜日に紙おむつを購入する人はビールも同時に購入するケースが多い」という傾向を割り出した、米ウォルマート社の事例があります。
多次元分析
分析者があらかじめ仮説を立てて、それを検証する分析です。複数の分析視点(次元)を組み合わせて分析できるために“多次元分析”と呼ばれています。売り上げデータの分析を例にしてみましょう。
- 売り上げが伸びない原因が商品か店舗にあると仮定して、店舗、商品、期間という複数の次元を用意します。
- 最初は、期間別/店舗別で特定の期間で売り上げが低い店舗を洗い出します。
- 次に、店舗別/商品別で分析して、どの商品の売り上げが伸びていないのかを把握します。
- 最後に期間別/商品別で全店舗での商品の売り上げを見ることで、商品の問題か、店舗の問題かを切り分けできます。
多次元分析は、このように複数の次元を切り替えて、さまざまな角度で分析できるのが特徴です。また、多次元分析では分析するために集計したデータを格納する「キューブ」という独自のデータベースを構築します。
非定型検索
出力項目、出力形式、条件項目などを任意に設定してレポートを作成します。
定型検索
出力項目、出力形式、条件項目は固定で、条件の値を変えてレポートを作成します。
レポート参照
ほかのユーザーが作成したレポート(多次元分析やマイニングなど作成したレポート)を閲覧します。
Copyright © ITmedia, Inc. All Rights Reserved.