業務を遂行することを目的とした「業務系システム」に対して、情報を分析するためのシステムは「情報系システム」と呼ばれます。類語が複数あってややこしいですが、後者の情報系システムが「Business Analytics」のためのシステムといえます。
図1は筆者の考える「情報系システム」の全体像です。個人でこれら全体のアーキテクチャを把握することは、小規模な人数で行われるBusiness Analyticsの分野において非常に重要です。図1は代表的なソフトウェア名を記載して、イメージしやすいようにしています。ここで挙げているソフトウェアは全てオープンソースの廉価版や無償版が存在します。
オープンソース製品を図に入れているのには以下の2つの理由があります。
もちろんこれらの製品を用いる必要はなく、他のシステムとの兼ね合いで商用サポートの付く製品が必要であれば、必要に応じて切り替えることは問題ありません。しかしながら「情報系システム」では、先のような制約により、無料や低価格で使用可能なオープンソースが主要な役割を担うと予想されます。本連載では、これらの製品に1つずつ着目して、これらの技術についての入門的な解説を行っていく予定です。
これまでの話で「ビッグデータ」や「Hadoop」などのキーワードが登場していないので気になっていた方がいらっしゃるかもしれません。実際にデータ解析といえば非構造化データやソーシャルメディアなどを対象とするイメージがあるように思います。特にITエンジニアやITベンダの立場からはこれらの技術に着目したいという気持ちはよく理解できます。しかし、筆者は以下のような理由から、多くの企業において必要とされるものではないと同時に、多くのITエンジニアにとっても重要なスキルではないと考えています。
筆者は、企業におけるデータ活用では構造化データの活用が基本にあり、その延長として非構造化データや大規模データの活用があると考えています。本稿で紹介した技術は基本に相当するものです。Business Analyticsでは多くの場合、基本の実装がうまくできていないので、延長の段階に踏み入るのは時期尚早であると考えています。
Copyright © ITmedia, Inc. All Rights Reserved.