Loading
|
@IT > Oracle Database 10gの機能群 |
Oracle Database 10g Release 2には、データ・ウェアハウスに向けた新機能 が多数盛り込まれている。このような機能の中から大規模データ・ウェアハウス を構築・運用するための注目技術を探る。
現在の企業活動環境は、競争の激化や市場動向の変化の加速、法規制の強化や環境問題対応など、さまざまなプレッシャーに曝されている。そこで、日々的確な意志決定を行なう必要に直面する経営陣をIT側から支援するツールとして、データ・ウェアハウスが改めて注目されている。初期のデータ・ウェアハウスは夜間バッチでデータを用意し、翌日以降参照できるようになる、といった形の比較的ゆったりした処理で実現されていたが、現在の経営環境はそうした悠長な処理では到底対応できず、膨大なデータの変化をリアルタイムに捉え、そこから瞬時にインテリジェンスを抽出することが求められている。それができて初めて変化に即応する意志決定支援ツールといえるのである。 これまで、データ・ウェアハウスといえばエグゼクティブ・ダッシュボードなど、ITに詳しいとは言えない経営層にいかに使いやすく直感的なインターフェイスを提供するか、という点に関心が集中しがちだったが、データ・ウェアハウスの本質は当然ながら大量のデータを的確に収集し、高度な分析処理を通じてインテリジェンスを導き出す部分にある。変化に即応するという目標から、このコアとなる処理の部分に関しても、新しい発想に基づく機能強化が求められている。つまり、データ量の増大と処理時間の短縮という、相反する2つの要素に同時に対処する必要に直面しているのである。そこで、データ・ウェアハウスのコア部分に新たな技術革新が必要となっているのである。 Oracle Database 10g Release 2はRDBMSで、データ・ウェアハウス専用のシステムに比べると見劣りがすると思われているかもしれないが、そうではない。最新世代のデータベース・エンジンとして、大規模データ・ウェアハウスを効率的に実現するために有効なさまざまな新機能が盛り込まれているのである。
パーティショニングは、データベースの表領域を分割し、アクセスを分散することで処理の高速化を図る手法だ。データベースのチューニングとしてはごく標準的なものといえ、今時差別化要素とはならないと考えられるかもしれない。しかし、単にパーティショニングが可能、というレベルに留まらず、どのようなパーティショニング手法が利用できるのかというところまで掘り下げてみると、実装の違いが明確になってくる。 Oracle Database 10g Release 2では、パーティショニング手法として「レンジ・パーティショニング」「ハッシュ・パーティショニング」「リスト・パーティショニング」といった基本的な分割手法に加え、複数の分割手法を組み合わせる「コンポジット・パーティショニング」をサポートしている。
データ・ウェアハウスでの利用を前提に考えてみよう。レンジ・パーティショニングは例えば売上データを四半期ごとに分割するといった場合に有効となる。ハッシュ・パーティショニングはデータをランダムに分散し、平均的にアクセスさせる効果があるので、大規模なデータ・セットに高速にアクセスしたい場合に有効だ。リスト・パーティショニングは地域別など、ユーザーが設定したリストに従って分割できるので、ユーザーが必要とする属性に従った分割が可能だ。 さらにコンポジット・パーティショニングでは、例えばレンジ・パーティショニングとハッシュ・パーティショニングを組み合わせ、「四半期ごとに分割したデータ・セットをさらにハッシュして多数のディスクに振り分けることでアクセス時間を平均化し、最大パフォーマンスを引き出す」ことが可能になる。また、レンジ・パーティショニングとリスト・パーティショニングを組み合わせ、「四半期ごとのデータ・セットを営業地域別に分割する」といった手法も考えられる。このように、特定四半期の特定地域の情報を分析する場合、アクセス先が局所化されるため、他の地域の分析にはまったく影響を与えることなく時間の掛かる分析処理を進めることが可能となる。 Oracle Database 10g Release 2ではさまざまなパーティショニング手法をデータの特性に応じて使い分けることができ、チューニングの幅が大きい点がメリットとなる。
表領域のデータを圧縮格納し、ディスク消費量を削減することを主目的にした機能。大量のデータを扱う場合、ディスク消費量を節約できる点がメリットだが、単にディスク容量だけの問題ではなく、ディスクI/Oのボトルネックを回避することでパフォーマンス向上にも寄与する。 現在のコンピュータ・システムでは、プロセッサの処理性能は順調に向上を続けている一方、I/Oパフォーマンスはプロセッサほどの大幅な向上は実現できず、年々性能差が拡大している状況だ。そのため、データの圧縮/伸張にプロセッサの処理能力をいくばくか割いたとしても、圧縮によってデータ量が削減されることでI/O負荷が低減される効果の方が大きくなり、結果としてパフォーマンスが向上する可能性がある。この効果は特にデータ量が多くなり、大量のデータを常時出し入れする必要がある大規模なデータ・ウェアハウスでは大きな効果を生むことになる。副次的な効果ともいえるが、大規模データ・ウェアハウスを支える重要な機能拡張だと言えるだろう。
差分データ抽出とも言われる機能で、表データに対する変更/追加/削除といった処理のうち、データ・ウェアハウス更新に必要なデータだけをリアルタイムに収集・蓄積する機能。さらに、収集された更新データの中から、必要な範囲(期間)のデータだけを参照できるビューを作成する機能も備える。 この機能がデータ・ウェアハウスに有用なことは言うまでもないだろう。現在のデータ・ウェアハウスの大目標とも言える「大量のデータをリアルタイムに分析してインテリジェンスを導く」ためには、無駄を省き必要最小限の処理でデータ・ウェアハウスの更新が可能になっていなければならない。本来の業務処理のパフォーマンスに影響を与えるようでは本末転倒だが、かといってデータ・ウェアハウス更新に何時間もかかるようではリアルタイム性を実現できたことにはならない。最小限の負荷で必要な更新だけを確実に実行できるようになっているからこそ、こまめなデータ・ウェアハウス更新が実現でき、時々刻々変化するビジネス状況に即応する意志決定が可能となるのである。
こうしたデータベース内部の機能に加え、Oracle Database 10g Release 2にはグリッドコンピューティング機能が備わっていることもよく知られているところだ。この機能を活用すれば、コンピューティング・リソースを柔軟に拡張でき、動的に割り当てを変更して利用効率を最適化することが可能になる。従来の手法では、業務システム、ETLシステム、データ・ウェアハウス・システムをそれぞれ別個に用意し、さらに各システムはそれぞれの最大ピーク負荷に合わせたリソースを確保する必要があったため、遊休リソースが発生してしまい、ITシステム全体のROIを引き下げてしまうことにも繋がっていた。Oracle Database 10g Release 2ではグリッド構成をサポートし、ピーク時間が重ならない処理をまとめることでリソースの確保量を節減し、効率的に利用することを可能にする。 さらに、このようなインフラ側でのサポートを踏まえ、Oracle Database 10g Release 2を利用することで実現可能となるのが「全社基盤として活用できる全体最適化されたBIシステム」である。従来、部門ごとに小規模なデータマートを個別に用意して利用するケースがよく見られたが、これは分散化にメリットがあると言うよりは、技術的な制約で統合が困難だったためのいわば問題回避策にすぎない。 こうした個別最適のデータマートを統合して全体最適化されたデータ・ウェアハウスとすることで、より多くのデータに基づく高精度なインテリジェンスが利用できるようになり、同時にITインフラ・コストの削減も可能になる。さらに、統合されて豊富なインテリジェンスを抽出可能となったデータ・ウェアハウスからは各種の業務に必要な情報を引き出せるため、部門間の連携や高度な情報共有など、企業全体の活動に大きく寄与することが期待できる。従来のように、できのよいデータマートを整備した特定の部門の業務だけが効率化される、といったまばらな効果ではなく、企業全体の業務品質を一括して引き上げることが可能になるわけだ。 オラクルでは、グリッド・インフラの上に構築された全社統一のデータ・ウェアハウスを「ウェアハウス・グリッド」と呼んでいる。そして、ウェアハウス・グリッドによる全社統一の情報基盤から得られるインテリジェンスに基づいて適切な意思決定を実行できる企業の姿を“The Insight-Driven Enterprise”と位置づけている。 Oracle Database 10g Release 2は、The Insight-Driven Enterpriseに移行するために必要な機能を備えたデータベース・エンジンであり、現代の企業に必須のITインフラを提供するものだといえるだろう。 提供:日本オラクル株式会社 企画:アイティメディア 営業局 制作:@IT編集部 掲載内容有効期限:2007年5月31日 |
|