大量のデータから知見を得る「データマイニング」を理解する:「データベーススペシャリスト試験」戦略的学習のススメ(29)
あの“津崎さん”も保有する難関資格「データベーススペシャリスト」。本企画では、データベーススペシャリスト試験 午前/午後試験対策のための「基礎知識」を抜粋してお届けします。今回は「データマイニング」の基礎を解説します。
書籍の中から有用な技術情報をピックアップして紹介する本シリーズ。今回は、秀和システム発行の書籍ポケットスタディ データベーススペシャリスト [第2版](2015年12月22日発行)』からの抜粋です。
ご注意:本稿は、著者及び出版社の許可を得て、そのまま転載したものです。このため用字用語の統一ルールなどは@ITのそれとは一致しません。あらかじめご了承ください。
※編集部注:前回記事「「データウェアハウス」「OLAP」「データマート」を理解する」はこちら
データマイニング
出題頻度 午前II:●-- 午後I:--- 午後II:---
●--:過去14年間での過去問出題数が1〜9回
●●-:過去14年間での過去問出題数が10〜19回
●●●:過去14年間での過去問出題数が20回以上
Key Word
●データマイニング、ニューラルネットワーク、統計的処理、デシジョンツリー、マーケットバスケット分析、クラスタリング
データマイニング
データベースに蓄積された大量のデータから、項目間の規則性や相関関係を分析・発見する手法をデータマイニングと呼びます。「おむつを買う人はビールを買う傾向がある」という米国での分析事例(下表、マーケットバスケット分析の例)が非常に有名ですが、このような情報を店舗の棚割りの検討時に役立て、売上向上などを図ります。その他、優良顧客の分析、ECサイトのリコメンデーションエンジンなどのCRM分野などに活用されています。
データマイニングの代表的な手法を以下に示します。
データマイニング手法 | 説明 |
---|---|
ニューラルネットワーク | 脳や神経系の仕組みを応用したモデル。人間が経験をする事で一定のパターンを見つけ出すように、過去のデータから一定の関数を発見し未来を予測する |
統計的処理 | 実績データを統計学的に処理し、過去から未来を予測 |
デシジョンツリー (決定木) |
決定木を用いて、データの持つ様々な条件を階層的に順次判断し、そのデータがどのような振る舞いをするものであるか予測する |
マーケットバスケット分析 | POSデータやECサイトの取引データを分析し、「一緒に買われる商品」の組み合わせを発見する分析手法 |
クラスタリング | データの集合を「似ているデータ」「似ていないデータ」という観点でクラスタと呼ぶグループに分類する |
データマイニングの説明として正しいものを選ぶ問題は、ほぼ毎年出題されます。この際、次の例のようにデータウェアハウス等を意味する紛らわしい内容が選択肢の中に巧みに盛り込まれているので、油断して流し読みをせず、よく考えることでケアレスミスを防いで下さい。
設問での問われかた | 意味する言葉 | |
---|---|---|
大量に蓄積されたデータに対して統計処理などを行い、法則性の発見を支援すること | データマイニング | |
集計データを迅速かつ容易に表示するなどの分析機能を提供する | データウェアハウス | |
企業内で発生する情報を主題毎に蓄積することで、既存の情報システムでは得られない情報を提供する | ||
販売実績などの時系列データを大量に蓄積したデータ保存手法 | ||
データ処理対象を元に規定したデータの構造、意味、枠組み | ||
スライシング・ダイシングなどによってインタラクティブにデータを分析すること。 | 多次元分析 | |
ユーザの利用目的に合わせて、部門別データベースを作る技術 | データマート |
本試験過去問題による類題演習 | |
---|---|
□H16 午前問14 | データマイニングの説明 |
□H18 午前問14 | データマイニングの説明 |
□H19 午前問13 | データマイニングの説明 |
□H20 午前問14 | 顧客区分毎の発生頻度で商品購入を予測するデータマイニング手法 |
Chance問題
Point check
データマイニングに関する説明として、適切なものはどれか。
(H26春DB午前II問18)
ア 基幹業務のデータベースとは別に作成され、更新処理をしない時系列データの分析を主目的とする。
イ 個人別データ、部門別データ、サマリデータなど、分析者の目的別に切り出され、カスタマイズされたデータを分析する。
ウ スライシング、ダイシング、ドリルダウンなどのインタラクティブな操作によって多次元分析を行い、意思決定を支援する。
エ ニューラルネットワークや統計解析などの手法を使って、大量に蓄積されているデータから、顧客購買行動の法則などを探し出す。
解答 Point check エ
*囲み内をクリックすると解答を表示します(表示後ページをリロードすると、再び非表示になります)
Copyright © ITmedia, Inc. All Rights Reserved.