データウェアハウス最前線(1)

アプライアンスの登場で身近になるDWH

吉村 哲樹
2010/11/2

ハード価格の下落がデータウェアハウスの普及を後押し

 一方、技術面でもBIとDWHの普及を後押しするいくつかの要因があった。最も大きかったのは、ハードウェアの価格下落である。BIのデータ基盤となるDWHは、トランザクションデータを長期間に渡って保管するために大容量のストレージ装置を必要とする。小規模なDWHでも10Tbytes以上、大規模なものになるとPbytes級のストレージが必要だ。かつては、これだけの容量のストレージ装置を調達するには膨大なコストが掛かったが、2000年代前半からのハードディスクの価格が急速に下落し、導入のハードルが一気に下がった。

 また、大量データを対象とした複雑なデータマイニングの処理には、大量のCPUリソースが必要になる。この点は、主にIntel製CPUの高性能化で問題にならなくなった。そして、メモリ価格の下落もDWHの導入コストを大きく下げる要因の1つだ。大量のデータに対する非定型クエリを高速に処理するには、大量のメモリが必要になるのだ。

 ちなみに「非定型クエリ」とは、アプリケーションがデータベース内のどのレコードのどの項目を参照するか、あらかじめ決まっていない状態でのデータ問い合わせのことを指す。これは、基幹系システムのデータベースに対して実行する「定型クエリ」と比較してみると理解しやすい。

 基幹系システムでは、アプリケーションがデータベース内のどのレコードのどの項目を参照するか、あらかじめほぼ決まっている。アプリケーションの仕様に合わせて、データベース構造を設計し、最適化しておけば、ある程度の性能を確保できるわけだ。

 しかし、DWHではそうはいかない。さまざまなデータ項目を自由に組み合わせてデータを分析できるようにするのがDWHの目的だ。例えば、ある人は商品名と地域を切り口に分析を試みるかもしれないし、別の人は商品グループと価格を切り口にするかもしれない。従って、常に同じデータ項目を決まったパターンで参照・更新するOLTP(オンライン・トランザクション処理)型のアプリケーションとは、DWHは根本的に用途が異なるのだ。

 また、データレコードの保管方式も根本的に異なる。基幹系アプリケーションのデータベースでは通常、古いデータを新しいデータで更新する。しかし、DWHは蓄積しておいた過去のトランザクションデータを分析する。従って、古いデータも時系列に沿ってすべて保管しておく必要がある。そうなると当然、データベースの構造も異なってくる。

 このように、基幹系システムのOLTP型アプリケーションのデータベースと、BIで使用されるDWHでは、その目的・用途の違いから異なる構造をとる必要があるのだ。

導入・運用に掛かる工数の削減が課題

 こうして2000年代後半から現在に至るまで、BIを実際に導入する企業が一気に増えた。かつては「経営者の高価なオモチャ」などと揶揄されたBIだが、今や企業規模を問わず多くの企業がDWHのデータベースを構築し、BIアプリケーションを積極的に活用するようになっている。

 BIベンダの合従連衡も急速に進んでいる。2007年にはSAPがBIベンダのビジネスオブジェクツを買収、同じ年にIBMはコグノスを、オラクルはハイペリオンを買収している。主要ITベンダ各社も、BIを大きなビジネスチャンスととらえているのだ。

 こうしてBIの普及が進むとともに、そのデータ基盤となるDWHも急速に普及した。しかし急速に普及することで、これまでのDWHが抱えていたいくつかの問題点が浮き彫りになった。その1つが、導入にかかる期間とコストだ。

 先述したように、ハードウェア価格の下落によってDWH導入のハードルは一気に下がった。しかし、システム構築には依然としてかなりの工数が掛かった。その主な理由の1つは、汎用のRDBMS製品がDWHに最適化されていないことが挙げられる。先に説明したように、OLTP型アプリケーションのデータベースとDWHでは、データ参照の方法がまったく異なる。汎用のRDBMS製品はどちらかというと前者の用途を前提にしているため、DWHで実用に耐えるだけの性能を確保するには入念なデータベース設計とチューニング作業が必要になる。もちろん、事前にしっかりと時間をかけて性能を検証する必要もある。

 また、システムを構築した後もデータが増え続けるため、継続的なチューニング作業が欠かせない。そのため、運用にも相当のコストが発生する。DWHが有用であることが社内で認識され、多くのユーザーが使うようになると、それまでにはなかったさまざまなパターンでのデータ参照が発生し、また追加のチューニングが必要になる。その結果、活用すればするほど運用コストがかさむことにもなりかねないのだ。

 こうしたDWHの欠点を補うために登場したのが、冒頭で紹介したDWHアプライアンスだ。

大きな可能性を秘めるDWHアプライアンス

 DWHアプライアンスは、データベースソフトウェアを稼働させるサーバとDWHのデータベースが一体となったアプライアンス製品である。その最大の特徴は、ソフトウェアとハードウェアともに、DWHの用途に完全に特化されている点である。

 DWHアプライアンスの多くは、汎用DBMS製品ではなくDWH専用のデータベースソフトウェアか、もしくは汎用製品にDWH向けのチューニングを施したものを搭載している。初めからDWHで使うことを前提に開発・チューニングしてあるため、汎用DBMSよりも性能が高い。

 さらに、ハードウェア構成もDWH使うことを前提に設計してあるため、システム全体として見たとき、汎用DBMSと汎用サーバを組み合わせて構築したDWHよりもはるかに高い性能を発揮することが多い。多くのDWHアプライアンスベンダは、「10倍〜100倍」のパフォーマンス向上が見込めると謳っている。

 また、多くのDWHアプライアンスでは自律的にチューニングする機能も備えている。導入・運用に掛かる工数の多くを占めるチューニング作業が不要になれば、大幅なコスト削減が見込める。

 こうしたメリットが知られるようになった結果、現在DWHアプライアンスはユーザーとベンダ双方から注目を集めている。近年DWHアプライアンスをめぐるベンダの動きが活発化している状況は冒頭で紹介した通りだが、Extract/Transform/LoadツールやレポーティングツールといったDWHの周辺ソフトウェアも相乗効果で脚光を浴びている。

 実際にDWHアプライアンスを導入する企業も増えている。特に今後は、DWHアプライアンスのコストメリットに着目した中堅企業による導入が進むのではないかと見られている。先ほど、ネットビジネスにおけるBI導入のメリットについて述べたが、DWHの導入ハードルが大幅に下がった現在、さらに広い範囲で流通業、サービス業を中心に中堅企業による導入が広がっていくと予想される。

 また先進的な企業では、すでにBI用途に限らずさまざまな形でDWHを活用している。例えば、社内で情報を共有するための共通データ基盤としてDWHを利用したり、あるいはBIを使わずともエンドユーザーがMicrosoft Office Accessなどのアプリケーションを使って直接DWHのデータを分析・加工しているような例もあると聞く。これまで「大企業のもの」「経営層のためのもの」と見なされてきたDWHだが、今後は企業規模の面でもユーザー層の面でも、大きな広がりを見せていくものと思われる。

前のページへ 2/2  

Index
アプライアンスの登場で身近になるDWH
Page 1
急速に拡大するデータウェアハウス市場
過去データから新たな知見を引き出すためのデータ基盤
データウェアハウスとBIの切っても切れない関係
→ Page 2
ハード価格の下落がデータウェアハウスの普及を後押し
導入・運用に掛かる工数の削減が課題
大きな可能性を秘めるDWHアプライアンス
【筆者プロフィール】
吉村 哲樹(よしむら てつき) 早稲田大学政治経済学部卒業後、メーカー系システムインテグレーターにてソフトウェア開発に従事。 その後、外資系ソフトウェアベンダでコンサルタント、IT系Webメディアで編集者を務めた後、現在はフリーライターとして活動中。



Database Expert フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Database Expert 記事ランキング

本日月間