オラクルがIn-Memory DatabaseとBig Data SQLで示す「データベースの未来」：Oracle DBaaS & Big Data Summit基調講演レポート（3/4 ページ）

» 2014年08月20日 07時00分公開

[PR／＠IT]

Oracle Big Data SQLにより、RDBMSとNoSQL、Hadoopが1つのクエリ言語で操作可能に

　シェトラー氏は続いて、米国で7月にリリースされたOracle Big Data SQLを紹介した。これはOracle Databaseで使われているOracle SQLの適用範囲を、従来のRDBMSだけでなくNoSQLデータベースやHadoopにまで広げる新製品だ。

　企業のRDBMSに格納される機密情報が増加する一方で、Webサービスの提供で使用する顧客のプロファイル情報などはNoSQLデータベースに、大規模なJSONデータなどはHadoopに保管するといったケースが増えてきている。Oracle Big Data SQLを使えば、こうしたさまざまなデータソースの操作を、1つのクエリ言語（Oracle SQL）によって行えるのだという。

　「Oracle Big Data SQLにより、多様なデータソースを使ったデータ分析などがOracle SQLによって高速に行えるようになります。しかも、Oracle Databaseで使われている洗練されたセキュリティ機構などが、NoSQLデータベースやHadoopでも利用可能となります。ビッグデータ時代のデータ活用では、各データソースを分断されたサイロのままにしておくのではなく、統一された方法で迅速に扱えるようにする必要があります。それを実現するのがOracle Big Data SQLなのです」（シェトラー氏）

大量データの超高速な処理を実現するOracle Database In-Memory

　シェトラー氏は、今回のイベントの目玉の1つであるOracle Database In-Memoryにも言及した。氏によれば、同製品の開発には「3つのゴール」があったという。それらのゴールとは、「リアルタイム分析の高速化」「OLTPの高速化」「既存アプリケーションとの完全な互換性」だ。このうち、「リアルタイム分析の高速化」と「OLTPの高速化」を両立するために、これまでとは異なるアーキテクチャを開発する必要があった。

　従来のデータベースでは、処理方式として行単位でのデータ処理に適した「ローフォーマット」と、列単位での処理に適した「カラムフォーマット」のいずれかを選択する必要があった。ローフォーマットは受注オーダーの挿入や検索といったOLTP処理を高速に行うことができ、カラムフォーマットは地域ごとの売上合計レポートのような分析系の処理を得意とする。データベース構築時には、どちらのフォーマットを使うのかを事前に決めた上で適したデータベース製品を選び、想定外の使い方をする場合には大幅なパフォーマンス低下を覚悟しなければならない。同じデータを両方のフォーマットで使う場合は、それぞれのフォーマットのデータを別々に持ち、管理するという煩わしさもあった。

　これらの問題を解消するために、Oracle Database In-Memoryでは「デュアルフォーマットデータベース」と呼ばれる新方式を採用している。この方式では、表をローとカラムの両方のフォーマットでメモリ内に保持する。それぞれのフォーマット間の一貫性は保証されており、分析系の処理にはカラムフォーマットを、OLTP系の処理にはローフォーマットをといった具合に、各業務処理に最適な方式を使い分けることができる。この仕組みにより、Oracle Database In-Memoryはどちらの用途においても、極めて高速なデータ処理を可能にしている。もちろん、アプリケーションの側からは、どちらのフォーマットにアクセスするのかを意識する必要はない。

　シェトラー氏は、Oracle Database In-Memoryで特に高速化されるのは、分析系の処理で使われるカラムフォーマットに対するデータスキャンだと説明する。その理由は、Oracle Database In-Memoryでは、CPU内に実装されている複数のコアが同時並行で複数のカラムデータをスキャンするためだ。主に科学技術計算向けに設計され、CPUに実装されたSIMDベクトルインストラクションを使うことで、1CPUコア当たり毎秒数十億行のスキャン処理が可能だという。

　また、従来のデータベースでは、分析計処理を高速化するために多用されるインデックスが、OLTP処理の遅延要因となっていた。Oracle Database In-Memoryでは、実データへの超高速なアクセスが可能なためインデックスが不要となり、分析系処理とOLTP系処理が混在した複合ワークロードにおいても、それぞれの処理で極めて高い性能が得られるのである。

　なお、複数のサーバーを使ったスケールアウトやメモリ増強によるスケールアップといった拡張性、および可用性や耐障害性を確保するためにOracle Databaseで使われていた技術は、Oracle Database In-Memoryでもそのまま利用することが可能だ。

　このように主な特徴を説明すると、シェトラー氏は最後にOracle Database In-Memoryのデモンストレーションを披露した。このデモは、Wikipediaの検索ワードのトレンドをアドホッククエリで集計するというものだ。その実行基盤として使用するのは、Oracle ExadataとOracle SuperCluster M6-32である。

　Oracle Database In-MemoryをOracle Exadata上で稼働させるデモでは、過去1カ月分の検索ワードデータに当たる約338億のローデータを1秒以内にスキャンし、さらに6年分に当たる1兆ローのデータも、わずか数秒でDRAMとストレージに保存して検索可能な状態を作った。また、Oracle Database In-MemoryをOracle SuperCluster M6-32で稼働させるデモでは、同じく1兆のローデータを全てメモリ上に展開し、瞬時に検索と集計処理を行って見せた。シェトラー氏自身が「あまりにも速すぎて、これがライブで行っているデモだとは信じられないかもしれませんが……」と心配するほどの圧倒的な性能である。

次世代のデータウェアハウス基盤はOracle Exadataで！：「データ活用のリアルタイム化」「OLTPとの統合」を可能にする性能の秘密に迫る

IT部門が直面する“現実”と“イノベーション創出”のギャップを埋める

前のページへ 1|2|3|4 次のページへ

提供：日本オラクル株式会社
アイティメディア営業企画／制作：＠IT 編集部／掲載内容有効期限：2014年9月17日

オラクルがIn-Memory DatabaseとBig Data SQLで示す「データベースの未来」：Oracle DBaaS & Big Data Summit基調講演レポート（3/4 ページ）

Oracle Big Data SQLにより、RDBMSとNoSQL、Hadoopが1つのクエリ言語で操作可能に

大量データの超高速な処理を実現するOracle Database In-Memory

関連記事

関連情報

Oracle Exadata Infowall - 情報ポータル

Pick UP

楽天市場を支える基幹データベースがOracle Exadataに移行──さらなる成長に向けてバッチ処理時間と運用管理コストを半減

もうデータベースアップグレードは怖くない！「Oracle RAT＋Oracle Cloud」で簡単、省コストにテストする

Oracle Databaseをこれから導入。11gにするか？それとも12cか？データベースクラウド構築時のバージョン選定の指針

サーバ仮想化で運用コストは本当に減らせるの？データベース運用の効率化は“サービス”視点で考えよう！

新着記事

ビジネス部門も大満足、ジャックスが選んだ“安定して高性能”なデータ活用基盤

NTT西日本に学ぶDB刷新、“クラウドの利便性”と“安定・安全”を両立する秘訣

ワコールがオムニチャネル戦略、コスト削減に向けて「Oracle Exadata X6-2」を2台導入した理由

最高レベルの性能、可用性、セキュリティ、管理性、操作性を提供し続ける「Oracle Exadata」と「Oracle Database」――それぞれの進化のポイント

システムを止めない、ビジネスを止めないためのベストプラクティスを探る――「Oracle Private Cloud Infrastructure」がもたらすインパクト