ビッグデータのマネジメントには、これまでのデータマネジメントと大きく異なることが一つある。それは、データストアとして、Relational Database(RDB)とNoSQL、Hadoopのそれぞれの特性を踏まえ、使い分けていく必要があることだ。このとき、多くの企業がジレンマを感じるのが、それぞれのデータストアに格納されたデータへのアクセス方法が異なるという点である。
「今、企業にとってビッグデータ活用の大きな障壁となっているのが、データソースごとに異なるアクセス方法を使わなければならないということです。具体的には、RDBならSQLを使い、NoSQLに対しては基本的にAPIを通じてアクセスします。Hadoopでは従来、MapReduceが使われていましたが、今日ではApache SparkやHadoop Hiveも使用されています。このように異なる手段を使い分けなければならないことは、企業にとって大きなジレンマとなります。どのデータストアを使うかにより、データアクセスの手法や使用するツールが変わるからです」(テュークスベリー氏)
この問題を解消するためにオラクルが開発したのが「Oracle Big Data SQL」である。これはNoSQLやHadoopのデータに対しても、RDBと同様にSQL(Oracle SQL)によるアクセスを可能にするソリューションだ。これにより、データストアの種類を問わず、アプリケーションからは一つの方法によってアクセスできるようになる。
「これまでは、データストアごとに異なる方法で個別にアクセスし、それぞれから得た結果を何らかの形で比較/統合するために多くのコストや手間を要していました。Oracle Big Data SQLを使えば、それらが一切不要となり、ビッグデータをより扱いやすくなるのです」(テュークスベリー氏)
オラクルは、Hadoopによるデータ処理に特化したエンジニアドシステムズとしてOracle Big Data Applianceを提供している。エンジニアドシステムズとは、ハードウエアとソフトウエアを高度に融合したシステム基盤であり、全てが事前にセットアップ済みの状態で購入企業に納入され、導入後はすぐに使い始められるというメリットがある。
「これまで、汎用サーバーとソフトウエアを独自に組み合わせた“DIY(Do It Yourself)方式”でビッグデータ環境を作り、その構築や保守に掛かるコスト/手間の多さに苦しんできた企業は少なくありません。そうしたお客さまにOracle Big Data Applianceを紹介すると、その価値をすぐにご理解いただけます。Oracle Big Data Applianceを使えば、Hadoop環境の構築に際して多くの工数やコストを掛ける必要がないため、初期導入コストの面でも大きな成果が得られます。さらには、ノード追加などの拡張設定やアップグレードがコマンド一つで実施可能なため、運用コストも削減できるのです」(テュークスベリー氏)
テュークスベリー氏によれば、Oracle Big Data Applianceの機能は間もなく、オラクルのパブリッククラウド(Oracle Cloud)でも利用可能になるという。
「間もなく『Oracle Big Data Cloud Service』の提供を開始する予定です。これはオンプレミスのOracle Big Data Applianceと同じアーキテクチャで提供されるビッグデータ活用サービスであり、オンプレミスと同じソフトウエア環境を、同じスキルによって使うことができます。一時的に大量のビッグデータデータを高速に処理したい、Oracle Cloudをはじめとするパブリッククラウド上の他のアプリケーションと連携させて使いたい、オラクルのビッグデータ環境を試用してみたいといったお客さまに最適なサービスだといえるでしょう。オンプレミスとパブリッククラウド上のビッグデータ環境は、統合管理ツールの『Oracle Enterprise Manager 12c』によって一元的に管理することも可能です」(テュークスベリー氏)
ビッグデータ活用では、「収集したデータの分析」を行うステップが肝になる。しかし、現状では分析の前処理であるデータクリーニングに約8割の時間が費やされており、分析作業で使える時間は2割程度にすぎないといわれる。テュークスベリー氏は、そうした現状を指摘した上で、この問題を解消するソリューションとしてOracle Big Data Discoveryを挙げる。
「Oracle Big Data Discoveryのコンセプトは、『データのクリーニングで8割、実際の分析処理で2割』というこれまでの時間配分を逆転することです。機械学習のテクノロジを積極的に導入したことで、データの自動分類が可能になった他、高度な視覚化の機能を備えており、データ分析の作業を効率的に進めることができます。リリースから間もない製品ですが、既に多くのお客さまに引き合いをいただいています」(テュークスベリー氏)
Copyright © ITmedia, Inc. All Rights Reserved.
提供:日本オラクル株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2015年10月13日
驚異的なパフォーマンス、優れた運用効率、最高の可用性とセキュリティ、クラウド対応を実現するOracle Exadataとの統合、クラウド、可用性や運用管理など、次世代データベース基盤構築のために参考になる必見資料をまとめてご紹介いたします。