必要なものはすべて揃っている!IBMのDWHアプライアンスの魅力に迫る |
過熱するDWHアプライアンス市場。各ベンダは性能を競っているが、DWHアプライアンスは性能だけで選択してはいけない。今回は日本アイ・ビー・エムの「IBM Smart Analytics System」の特徴を解説する。 |
オールインワンのDWHソリューションでSIリスクを最小化 |
||
データウェアハウス(以下、DWH)の世界は現在、「DWHアプライアンス」という製品ジャンルの興隆で一大転機を迎えている。DWHアプライアンスとはその名の通り、DWHシステムの構築に必要なハードウェアとソフトウェアをすべてオールインワンにパッケージングしたアプライアンス製品である。
現在、さまざまなベンダが続々とDWHアプライアンス製品の提供をはじめている。中でも、日本IBMは非常にユニークなアプライアンス製品「IBM Smart Analytics System」を提供している。他社が提供しているDWH用データベースとハードウェアに加え、フロントエンドのBIツールやデータマイニングツール、さらにIBMの長年の経験を踏まえたDWH用データモデルとサンプルレポートまで含めたオールインワンの製品である。具体的には、BIツール「Cognos 8 Business Intelligence」、データマイニングツールを含むDWHソフトウェアパッケージ「InfoSphere Warehouse」、DWH汎用モデルである「InfoSphere Warehouse Pack」を統合した形で提供する。また、データマイニングで高い実績を誇る「SPSS」と併用することで、高い相乗効果を生む連携機能を備えている。(図1)。
図1 IBM Smart Analytics Systemの構成図。DWHソフトウェアだけでなく、BIツールなども統合している |
同社は、なぜこのようなユニークな形のソリューションを展開しているのだろうか?日本IBM ソフトウェア事業 インフォメーション・マネジメント事業部 InfoSphere営業部の部長を務める森英人氏は、次のように語る。
「現在、他社のDWHアプライアンス製品はひたすら高性能をアピールしているが、性能はお金をつぎ込めばいくらでも手に入る。最も気に掛けるべきは性能ではなく、DWHを構築する際のシステムインテグレーションのリスクとコストだ」
DWH導入時に最も気を付けなければいけないことは、システム構築にかかる期間とコストだと語る森氏 |
今日、ビジネスを取り巻く環境は極めて複雑化している。かつてのように、経営者の経験則に従っていれば着実に収益を上げられた時代は終わり、経済に影響を与える要因は極めて多様化、複雑化している。このような状況では、もはや経験則だけでは正確な意思決定を下すことはできない。客観的な判断材料が必要になるのだ。そして、ITの力を使って過去に蓄積したデータから客観的な判断材料を抽出する技術が、BI(Business Intelligence)である。
しかし日本IBMでは現在、BIのさらに先を行くコンセプトを提唱している。それが「New Intelligence」だ。
「BIのコンセプトは、過去のでき事を分析した結果を元に行動を起こすということ。それに対してNew Intelligenceは、将来に対する洞察と予測を元に動くことを提唱している。そしてITを使ってそれを実現するためには、従来のBIよりもはるかに細かい粒度のデータを取得する必要がある」(森氏)
例えば、これまでは月ごとに統計データとして採取していた情報を、週別、日別、さらには時間別と、より細かい粒度で取得する必要がある。さらには、取得するデータの種類も増える。例えば、これまでは顧客の名前とメールアドレスしか管理していなかったとすると、これからは年齢や性別、勤務先なども収集しなければならなくなる。こうなると、データ量はこれまでとは比べものにならないほど増える。これは2倍、3倍などという増え方ではない。100倍、1000倍のレベルである。
大量のデータを処理して、客観的な判断材料を提示するために、DWHアプライアンスは従来のDWHシステムの100倍、1000倍にもなる大量のデータを扱えるほど性能が上がっている。しかし、アプライアンスだけでは判断材料となるデータを導き出すことはできない。実際には、BIツールやマイニングツール、Extract/Transform/Loadなど、さまざまな要素を組み合わせることで、ようやくシステムは成り立つ。これらもDWHに合わせて100倍、1000倍のワークロードに対応できるようにしなければ、システムはまともに動作しないのだ。実際にDWHシステムの構築を経験したことがある方なら、これが途方もなく困難な仕事であることは容易に想像できるだろう。
BIツールやデータマイニングツールとのシームレスな連携 |
||
IBMは、こうしたシステムインテグレーションのリスクこそが、DWHを構築する上で最大の課題になると見ている。そこで同社では前述した通り、あらかじめIBM Smart Analytics SystemにCognos 8 Business Intelligenceなどの周辺システムを統合し、最適な状態で提供している。これにより、例えば大量ワークロードが発生した場合、本来はCognos 8 Business Intelligenceがすべき処理の一部(多次元キューブの構築など)を一時的にDWHサーバ側で処理できる。また、膨大なデータ量を対象としたデータマイニングの場合でも、データベース外部へ大量のデータを取り出す必要はなく、IBM Smart Analytics System内部での高速処理が可能だ。IBM製品間の連携も強化されており、SPSS Modelerと連携した透過的なマイニング処理を実現している。
もちろん、こうしたチューニングは、それぞれの製品をバラバラに買ってきて自前で行うことも「技術的には」可能だ。しかし、それを実際にするとなると、膨大な工数と開発リスクを背負い込むことは火を見るより明らかだ。これがIBM Smart Analytics Systemであれば、すべてセットアップ済みの状態で提供されるのだ。さらには、DWHの物理データモデルやCognos 8 Business Intelligenceのサンプルレポートなどをセットにした「InfoSphere Warehouse Pack」というアドオン製品も同社では用意している。
また、DWHの運用には定常的な性能チューニングが欠かせないものだが、IBM Smart Analytics Systemはこの点でも優れている。同製品が搭載するデータベースソフトウェアは、「IBM DB2」をDWH用にチューニングした「InfoSphere Warehouse」である。もともとIBM DB2が非常に優れたワークロード制御機能を備えているため、あるユーザーが重い処理を行っている途中でも、ほかのユーザーからのリクエストに反応しなくなるようなことはない。DWHはOLTPとは異なり、多くのユーザーから非定型のクエリーが投げ込まれるため、インテリジェントなワークロード制御が不可欠だ。これをすべて自前のチューニングで対応するとなると、やはり長期に渡って多大なコストと運用リスクを背負い込むことになるだろう。
さらにIBM Smart Analytics Systemの特徴として、特殊なハードウェアを一切使っていない点も挙げられる。DWHアプライアンスは、DWH用途に特化した専用ハードウェアを使ってこそ性能を確保できると思われがちだが、IBMはなぜそれに反して汎用製品にこだわるのだろうか?
「他ベンダの製品は、ソフトウェアアーキテクチャの欠点を補うために特殊なハードウェアを採用していることが多い。しかしIBM Smart Analytics Systemは、もともとDB2が持っている機能だけで十分な性能を確保できる。それに、特殊なハードウェアは将来メンテナンスを続けられるかどうか不安がある。実際、ほんの短期間でハードウェアプラットフォームを切り替えてしまったベンダもある。IBMは、そうしたリスクをお客様が絶対に抱え込まないよう、腐心している」(森氏)
DB2の並列処理技術が支える高性能 |
||
「簡単に導入できる」「汎用製品のみで構成」と聞くと、性能面に疑念を抱く方もいるかもしれない。しかし前述した通り、IBM Smart Analytics Systemは性能の高さも大きな強みの1つなのである。
事実、TPC(Transaction Processing Performance Council)が実施しているDWH処理性能のベンチマークテスト「TPC-H」において、IBM Smart Analytics Systemの前身「IBM Balanced Warehouse」は、「IBM System p 570」の32ノード・MMP(超並列処理)構成で10Tbytesのデータを1時間40分でロードし、堂々トップの成績を挙げている(2010年9月14日時点)。さらにOLTP処理能力を測る「TPC-C」ベンチマークでも、InfoSphere Warehouseは業界新記録となる性能を達成している(2010年9月14日時点)。
「高性能を売りにするDWHアプライアンスは多いが、ベンダの宣伝文句に惑わされずに、こうした客観的なデータを基に製品を選定しないと、実力を見誤る可能性がある」と森氏は指摘する。
このような高い性能を実現する上で重要な役割を果たしているのが、IBM Smart Analytics Systemが備える超並列アーキテクチャだ。同製品の内部では、それぞれのデータベースインスタンスは完全に分割され、並列に動作するため、インスタンスを増やすことでリニアに性能が向上していく。
これはいわゆる「Shared Nothing」と呼ばれるアーキテクチャだ。他社の製品の中には、データベースソフトウェアがリソース共有型の「Shared Everything」にしか対応しないため、特殊なハードウェア構成で疑似的な「Shared Nothing」アーキテクチャを取らざるを得ないものもあるという。
IBM Smart Analytics Systemはほかにも、「レンジパーティション」や「多次元クラスタリング」といった、性能向上に寄与する機能を備えている。さらに、重複排除技術を使ったデータ圧縮技術を駆使して、検索対象データを大幅に絞り込んで、処理性能を大幅に向上させる機能も搭載している。特に多次元クラスタリング機能は、IBM独自の大変ユニークな機能だ。これは、頻繁に利用するディメンジョンをあらかじめ定義し、クラスタ化しておくことによって、大幅にデータ照会の処理性能を向上させる技術だ。
最小構成で400万円台から導入可能 |
||
IBM Smart Analytics Systemは、同社の長い実績の中で培われた数々の機能により、極めて高い性能を発揮する。しかし、IBM Smart Analytics Systemの特徴は性能の高さだけではない。低価格な製品も用意していることも大きな特徴だ。
一般的に高性能を謳うDWHアプライアンス製品は高価だ。現在さまざまなベンダが提供しているDWHアプライアンス製品を見ると、1億円前後の価格が付いているものも決して珍しくない。IBMでも同社のメインフレーム「IBM System z」をプラットフォームにしたDWHアプライアンス製品「IBM Smart Analytics System 9600」を提供している。これはIBM製のメインフレームをベースにしているだけあり、圧倒的な性能とほぼ無限のスケール性を誇る。
しかし同時に、IBMが400万円台という破格の値段でDWHアプライアンス製品を提供していることを知っている人は、果たしてどれだけいるだろうか? 「4000万円台の間違いではないのか?」。そういぶかる読者も中にはいるかもしれない。しかし事実、同社はx86サーバ「IBM System x」をベースにしたDWHアプライアンス製品「IBM Smart Analytics System 1050」(図3)を、449万1800円(最小構成時)で提供している。
図2 IBM Smart Analytics System 1050。上位製品と同じソフトウェアを搭載している |
こう聞くと、今度は「廉価版だから、機能や性能に制限があるのでは?」と考えたくもなるだろう。しかし、同社のDWHアプライアンスは高額な製品から低価格のものまで、搭載しているソフトウェアはすべて共通だという。上位機種から順番に、IBM System zをベースとした「IBM Smart Analytics System 9600」、IBM Power Systemsをベースにした「IBM Smart Analytics System 7700」、そしてx86サーバであるIBM System xをベースにした「IBM Smart Analytics System 1050/2050/5600」の5種類があるが、どの機種も、これまで紹介してきた統合ソリューションや並列アーキテクチャなどの特徴をすべて備えている。
どの企業でもコスト削減が声高に叫ばれている昨今、DWHが有用であるということは理解できても、1億円近いIT投資には誰しも二の足を踏むだろう。しかし「IBMが400万円台からDWHアプライアンス製品を提供している」となれば、導入してみたいと考える方もいるのではないだろうか。この価格帯であれば、まずは安価で小規模な製品を部門単位で導入してみて、その有用性を検証してから上位製品にステップアップするようなスモールスタート型の導入も可能だ。
これまで「DWHはしょせん大企業のもの」と、DWHの導入をあきらめていた中堅企業であっても、これなら十分身近にDWHをイメージできるのではないだろうか。
|
提供:日本アイ・ビー・エム株式会社
アイティメディア営業企画
制作:@IT 編集部
掲載内容有効期限:2010年12月15日
オフィシャルサイト
ホワイトペーパー
オールインワンの分析アプライアンスが分析&BI環境構築を変える 低コストでハイバリューな分析、BIソリューションへの需要が高まる中、「分析アプライアンス」による環境構築が注目を集めている。 |