アットマーク・アイティ @IT@IT情報マネジメント@IT自分戦略研究所QA@ITイベントカレンダー  
 
 @IT > 革新的アルゴリズムでデータベースのボトルネックを解消
 
@IT Special

 

PR

革新的アルゴリズムで
データベースのボトルネックを解消

  〜 オンメモリデータベース「Oh-Pa 1/3」 〜
情報量が飛躍的に増大した現在、従来型のデータベースシステムでは、DWHを利用する情報検索・分析システムや更新系バッチ処理などで、パフォーマンス不足が深刻な問題となっている。そこで注目を浴びているのは、オンメモリデータベース「Oh-Pa 1/3」である。その革新的なアルゴリズムとデータ構造を紹介していこう。
RDBMSの弱点が企業システムを直撃

 本来、リレーショナル・データベース(以下、RDBMS)は定型データを大量に蓄積し、レコードのごく一部を参照する処理に適したデータベースである。この特性が基幹系データ処理と非常に良くマッチしていたため、RDBMSは企業システムの定番データベースとして広く普及するに至った。

 ところが現在、企業のデータ処理ニーズは“蓄積”だけに留まらず、顧客データや販売管理データなどを縦横に分析して経営に役立てる情報系データ処理の重要度が高まってきた。こういった情報系システムでは、複数のデータベースを横串で検索・分析するアプリケーションのパフォーマンス不足が大きな問題となっている。例を挙げると、データウェアハウス(以下、DWH)の参照用データ作成業務(データマートやキューブの作成など)に時間がかかり過ぎる、あるいは大量データのソートを伴うクエリのレスポンスが遅過ぎるといった現象だ。

 現行のデータベースが抱えるもう1つのパフォーマンス不足は、大量のデータを更新するバッチ処理でも顕在化している。RDBMSはデータ格納効率を上げるために正規化を行い、検索性能を向上させるための索引を多く持つ。このためデータの挿入/更新処理は検索速度に比べて大幅に劣化する。日次あるいは月次で大量のレコードを一気に更新するような処理で、夜間バッチが時間内に終わらないというケースは、データ処理量が肥大化する今日では決して珍しい話ではなくなった。

オンメモリデータベース「Oh-Pa 1/3」はなぜ高速なのか
株式会社 富士通ビー・エス・シー
ビジネスサポート本部
ODB推進統括部
担当部長 白桃昌樹氏

 こういった従来型データベースの弱点を補い、画期的なパフォーマンス改善を実現する製品として注目されているのがオンメモリデータベース「Oh-Pa 1/3」(オーパ・ワンサード)である。同製品の開発責任者である富士通ビー・エス・シー ビジネスサポート本部 ODB推進統括部 担当部長 白桃昌樹氏は「Oh-Pa 1/3はデータをレコード形式では持たず、『FAST』(Filter Array Structure)構造に分解してメモリ上に展開するところが、従来のRDBMSと決定的に違う点です。さらにFAST構造の検索・ソート・JOINなどを効率良く行う独自のデータ処理アルゴリズム『LFM』(Linear Filtering Method)を使うことにより、RDBMSの苦手としていたデータマート作成やバッチ処理の処理速度が圧倒的に改善されます」と語る(図1)。

図1 Oh-Pa 1/3のFAST構造とLFMアルゴリズム
RDBMSではレコード単位でデータを格納するのに対し、FAST構造ではデータを「順序(ROT)」「位置(VNo)」「値(VL)」に分解してメモリ上に展開する。「値」ではユニークデータを昇順に管理しており、クエリは(1)「値」にマッチする「位置」を取得し、(2)それに対応する「順序」を取得し、(3)その「順序」に該当するほかの「値」を取得してレコードを再構築する、というLFMアルゴリズムを採用している。事実上、全データにインデックスを作成したのと同等の検索速度が得られ、しかも手動でインデックスを作成する管理コストはまったく不要となる。

 実際にOh-Pa 1/3を導入した事例を紹介しよう。富士通株式会社の生産管理システムでは、3つのデータソース(関連マスタ類、部品表、オーダー)からBOM(Bill Of Materials)展開処理に、従来のRDBMSでは58分を要していたものが、6.9秒(504倍)に改善された。また、BOM展開処理された中間ファイルに在庫・注残データをマージする調達引き当て処理では、32分だった処理時間が2.7秒(711倍)と、驚くほどの改善が見られた(図2)。

図2 導入事例(富士通株式会社) 生産管理システム

(1)BOM展開処理:58分→6.9秒(504倍
(2)調達引き当て処理:32分→2.7秒(711倍

【実施環境】
Oh-Pa 1/3(DayDa.Laboo)
  ・CPU:Pentium III 1GHz × 1
  ・RAM:1Gbytes
RDBMS
  ・CPU:Pentium III 550MHz × 4
  ・RAM:2Gbytes

 上記富士通株式会社の事例は、株式会社ターボデータラボラトリの「DayDA.Laboo」によるデータ。株式会社富士通ビー・エス・シーは、株式会社ターボデータラボラトリが保有する高速データ処理を実現する特許技術の実施権と同社が開発したオンメモリデータ処理エンジン「DayDa.Laboo」(D2L)のソースプログラムと改版権を獲得。Oh-Pa 1/3は、OSの64bit化に伴う大容量メモリ時代に対応し、D2Lを基盤にさまざまな機能強化を図った製品である。


64bitマシンの登場は、
オンメモリデータベース時代の到来を告げる

 さらに白桃氏は、64bitマシンの普及が「オンメモリデータベースにとって追い風となるだろう」と指摘する。OSの管理できるメモリサイズは4Gbytesから一気にテラバイト級まで拡大するため、巨大なDWHを丸ごとメモリ上に展開するのも夢ではなくなった。「しかし、いくらメモリアクセスが高速だからといって、RDBMSのレコード形式でデータを管理していては、やはりソートやJOINといった処理でボトルネックが生じてくるでしょう。Oh-Pa 1/3の独自アルゴリズムを用いることで、64bitのメリットを最大限に引き出せるのです」(白桃氏)。

株式会社 富士通ビー・エス・シー
公共・サービスシステム本部
営業統括部 サービス営業部
チーフ 一原潔則氏

 一方、32bitマシンであってもOh-Pa 1/3を導入するメリットは大きいと、同社 公共・サービスシステム本部 営業統括部 サービス営業部 チーフ 一原潔則氏は指摘する。

 「RDBMSのパフォーマンス不足を抱えるお客さまには、ハードウェアの増設によって対症療法的な手当をしているところもありますが、Oh-Pa 1/3を導入することでサーバマシンの台数とRDBMSのライセンス料を減らし、大幅なコストダウンを実現できます。64bitマシンはまだ先の話だというお客さまも、サーバ統合によるシステム全体のコスト削減にOh-Pa 1/3を注目しています」。

 オンメモリデータベースは新しい技術ではないが、Oh-Pa 1/3の持つ独自技術(FAST構造、LFMアルゴリズム)は従来のオンメモリデータベースとは比較にならない大きな可能性を秘めていることは理解していただけただろう。“使い慣れているから”という消極的な理由であらゆるシステムにRDBMSを採用して苦労を背負い込むより、柔軟な発想を持って適材適所のデータベースを導入してみてはいかがだろうか。


提供:株式会社富士通ビー・エス・シー
企画:アイティメディア 営業局
制作:@IT 編集部
掲載内容有効期限:2006年3月31日
 
関連リンク
富士通ビー・エス・シー

Oh-Pa 1/3 トップページ

Oh-Pa 1/3 コンセプト


Oh-Pa 1/3 製品概要
 
Oh-Pa 1/3 導入効果(DWH)

Oh-Pa 1/3 導入効果(更新バッチ)

Oh-Pa 1/3 動作環境

Oh-Pa 1/3 ホワイトペーパー


 
@ITトップ@IT Special インデックス会議室利用規約プライバシーポリシーサイトマップ