データベースバックアップ専用マシン、GISデータ分析をウォッチ:Database Watch(2014年10月版)(2/2 ページ)
米国サンフランシスコで開催した「Oracle OpenWorld」からほぼ1カ月。日本へのフィードバックとして恒例になっている「Oracle Days Tokyo」が開催されました。オラクルの技術的なハイライトの他、「Zero Data Loss Recovery Appliance」の仕組みを見ていきます。
データベースのバックアップに特化した「Zero Data Loss Recovery Appliance」
それではあらためて「Zero Data Loss Recovery Appliance」を見ていきましょう。Oracle Days Tokyoに先駆け、2014年10月21日には記者向けに製品の説明会が開かれました。解説はアンディ・メンデルソン氏と日本オラクル データベース事業統括 専務執行役員 三澤智光氏(写真)です。
システムでバックアップが重要なことはいうまでもありません。どのようなシステムでも業務を支える物であれば何らかの形でバックアップをしているはずです。
しかし、日々更新されるデータベースのバックアップとリストアは、そう簡単でお手軽ではありません。ハードウェアの調達、多様化・複雑化する環境への対応、運用コストの問題、本番環境にかける負荷など、課題を挙げれば枚挙にいとまがないように思えます。しかし、リレーショナルデータベースならではの根源的な問題もあります。
メンデルソン氏は「従来のバックアップ装置はデータベース保護に適していません」と断じます。多くがファイルコピーで済ませているからです。単なるファイルコピーでは復旧できるのはバックアップを実行した段階までです。もちろん、データベースの信頼性を保護するログデータとの整合性も重要です。
またデータ破損も起き得ます。日本のOracle Databaseのユーザーからも、まれにデータ破損の報告があるそうです。原因はネットワークカードやストレージ装置など、サーバー周辺のハードウェアのトラブルによります。もし、データ破損が起きたら、いくらストレージを二重化していても、データを守れないどころか破損したデータを拡散させてしまうリスクがあります。
三澤氏は「多くのバップアッププロセスでRTO(目標復旧時間)が重視されているが、一方でRPO(目標復旧時点)は見過ごされがち。データ破損対策につながるRPOも重視するべき」と強調していました。
今回オラクルが発表した「Zero Data Loss Recovery Appliance」はデータ損失をなくすこと、データ破損を起こさず確実に復旧させること、本番環境に影響を与えないこと、拡張性を持つシステムにすることなどを目指しています。
種明かしをすると、ソフトウェア的な仕組みは「Oracle Data Guard」の技術を流用しています。それゆえに処理はOracle Data Guardと同様と考えてよいでしょう。ポイントはREDOログを転送することでデータ破損を防ぐ点です。
両者の違いは目的の違いです。Oracle Data Guardは災害対策(ディザスタリカバリ)を目的とした製品ですから、そもそも遠隔地に複製を作ることを想定しています。「Zero Data Loss Recovery Appliance」はあくまでもデータベースの確実なバックアップと復旧を目的としています。そのため、REDOログ転送過程では内容をチェックするため、トランザクション整合性を保ったデータを転送できます。これにより、破損データがバックアップや複製先に波及することを防ぎます。
一方で、本番環境への負荷を最小限に抑えるため、処理は可能な限りオフロードして行います。本番環境ではRMAN(Recovery Manager)が唯一のDBエージェントとなり、メモリからREDOログをリアルタイムに転送するようになっています。フルバックアップは最初だけで、以降は永遠に差分のみのバックアップで済みますので、転送データ量やシステム負荷も最小限に抑えられるようです。
Zero Data Loss Recovery Applianceでは「Delta Push」「Delta Store」という仕組みでバックアップを実施する(米オラクルのDelta Push and Delta Store資料より引用)
さらにエンジニアドシステムですから、ハードウェア的にもパワフルです。フルラック1台当たりの場合、フルバックアップとそれ以降の差分を合わせた「仮想バックアップ」は時間当たり最大120TB、リストアは時間当たり最大12TB。18ラックまで拡張可能です。
データベースだけでなく、クラウドでトップに――「Oracle Days Tokyo」
Oracle Days Tokyoの冒頭では日本オラクル 取締役 代表執行役 社長兼CEO 杉原博茂氏が登場し、中期経営計画「VISION 2020」の方針をあらためて来場者に説明しました。
この計画では、東京オリンピックが開催される2020年までにデータベースだけではなく、クラウドの分野でもトップを目指すことを掲げています。
実際に、直近の技術的なトピックはクラウドへとつながるものばかり。オラクルは今年を「クラウドにおけるイノベーションの年」と位置付けているそうです。後から振り返れば今年が転換点となるのかもしれませんね。
SAP InfiniteInsight 7.0では対応データベースが増加
2014年9月25日、SAPジャパンは予測分析ソリューションの最新版となる「SAP InfiniteInsight 7.0」の提供開始を発表しました。
SAPが持つ分析ソリューションの中でも、SAP InfiniteInsightは高度な予測分析を担うものです。ちなみにその他のラインアップとしては、手軽なデータ可視化向けの「SAP Lumira」、エンタープライズBI向けの「SAP BusinessObjects」があります。
SAP InfiniteInsightは、従来手作業で行っていたデータ準備作業とモデル構築・検証のデータマイニング作業を自動処理化するのが大きな特徴です。
これまで数週間かけていた作業を数時間〜1日程度へと短縮できます。データ加工のプロセスはGUIツールで実施できるため、プログラミングの知識が不要です。分析モデル検討では、機械学習を使ってベストのモデルに近づくように精度を高めていくことができます。また、作成したモデルからC、Java、SQLなどのコードを生成できるため、業務分析や、ログデータを利用したセキュリティ対策などのシステムに組み込むことも可能です。
最新バージョンの特徴は三つあります。サポートするデータベースの追加、予測モデルの精度向上、地理情報への対応です。
サポートされるデータベースは従来の「SAP HANA」「SAP Sybase IQ」「MySQL」などに加え、新たに「Hadoop Hive 11」と12(厳密にはHadoopはデータベースではないという解釈もありますが、そこはさておき)と「Greenplum 4.2」です。また、予測モデルでは、合成変数の作成や回帰モデルの精度を高めています。
最近、業務システムなどでも重要視されているのが地理情報です。売り上げや交通量などの情報を実際の地図データの上に重ねることで、地域ごとの傾向を理解しやすくなるなどの利点があります。SAP InfiniteInsightでは分析結果を「Google Earth」上に重ねて表示するようなことができます。
記者会見の場で行われたデモは、観光客の動きを地図上に表示するもの。「直近1週間しかデータがないユーザー」を条件にデータを抽出することで、観光客を推定、その位置や移動行程などを視覚化していました。
「直近1週間しかデータがないユーザーはこのエリアに居住・勤務している人ではないから観光客」というデータ抽出方法になるほどなと思いました。そうやって想像力を働かせながらデータを読み解いていくのですね。
Copyright © ITmedia, Inc. All Rights Reserved.