欧州宇宙機関が進める“恒星マップ”プロジェクトを支える技術その数10億超!宇宙の星を地図にする

10億個の星を計測するという壮大なプロジェクトが2013年、スタートする。膨大なデータを限られた時間内で格納・処理するために、欧州宇宙機関が選んだシステムとは?

» 2012年11月01日 10時00分 公開
[PR/@IT]
PR

 欧州宇宙機関が進めている「ガイア計画」をご存じだろうか? 人工衛星「衛星ガイア」を打ち上げ、銀河にある約10億個の恒星の位置情報を計測し、正確な立体地図を作るための基礎データを5年掛かりで取得するというプロジェクトだ。衛星は2013年の打ち上げを予定している。

「ガイア計画」を紹介する欧州宇宙機関のWebサイト。ここに掲載されている衛星が2013年にも打ち上げられる

 1恒星当たり100程度の観察項目があり、1観察項目当たりのデータ量は600Bytesにもなる。全体では60TBものボリュームになる。衛星は軌道上を回るため、データ送信はストアして定期的に送る方法をとる。送られてきたデータの検証は1週間以内に行う必要があるため、データ格納に使える時間は1日程度に制限されることになる。このデータ格納や分析で採用されているのが、インターシステムズが提供するCachéである。

 「ある商用RDBで検証したところ、1週間たってもデータ格納が終わらなかったそうです。同じ条件で、Cachéを使ってベンチマークを行ったところ、半日で完了したのです」

 そう語るのは、インターシステムズジャパン ビジネスディベロップメント シニア・マネージャー 佐藤比呂志氏だ。

「No.1のデータベース技術で顧客に価値を届ける」

 米インターシステムズは、1978年、MITやハーバード大学などがある米国マサチューセッツ州ボストンで創業、今年で35年を迎える。創業の地は学際都市であり、大学発のベンチャーなどが多数拠点を置くことでも知られる。IT系、先端医療の研究開発も非常に盛んだ。

 現在同社のシステムは世界100カ国以上で導入されている。「システムの導入数は把握できないほどの数に昇るが、10万は下らないサイトで利用されている」(佐藤氏)という。

インターシステムズジャパン ビジネスディベロップメント シニア・マネージャー 佐藤比呂志氏

 日本法人は2003年2月に設立、来年2月には設立10年と節目の年を迎える。東京および大阪に拠点を置いており、国内では既に4000サイト以上の導入実績を持っている。60%は医療系、それ以外の一般産業にも広く利用されているという。

 今回取材を受けていただいた(佐藤氏)は「当社は非公開企業。それゆえに長期的視座に立った開発計画を立てられる」と技術指向の企業であることを強調する。

 「シェアNo.1データベースベンダではなく、No.1のデータベース技術を持つ企業であり続けることを信条にしている。とはいえ自己満足的な技術ではなく、顧客満足を高めるための技術を追求する情熱を忘れてはならない、というのが企業ポリシー」(佐藤氏)

 同社の主力製品は、データベース製品「Caché」である。オブジェクトデータベース、ビットマップインデックスを採用している点が特徴だ。製品の最大の強みは、一般的なリレーショナルデータベースと比較してパフォーマンスが圧倒的に高い点にある。

11ラックを2ラックにリプレイスして月次処理は4分の1。応答は0.3秒

 佐藤氏は、同社の国内顧客企業の一例として、流通業界大手のイオンの事例を披露してくれた。

 イオンは、商品の物流情報を、商用リレーショナルデータベース製品をベースにしたWMS(物流センター構内システム)アプリケーションで管理していた。その際のシステム投資と比較して、Caché製品群に移行したことで、「1サイトあたりのサーバ台数は70%、ストレージは4分の1程度」(佐藤氏)に削減できたという。

 現在は部分的な移行であるが、今後国内外にある多数の物流拠点全てを同社製品に移行した場合、全体としてのハードウェア投資額は大幅に削減できる見込みだという。

 事例は他にもある。

メディパルホールディングスグループの中核企業に位置付けられるメディセオは、国内大手の医薬品卸業を営む。2009年には、パルタックの医療用医薬品卸売事業を統合している。このメディセオの営業支援システムにはCachéをはじめとするInterSystems製品が採用されている。

 パルタックではもともとCachéを使った物流システムを持っていたこともあり、統合に際してパフォーマンスが評価されたことから、統合後もCachéを採用する決定が下されたという。まず、パイロットシステムとして営業支援システムのリプレイスが行われた。

 「具体的には、個々の営業担当者の月次の進捗状況や販社別の売り上げ動向などを分析するようなDWH的な使い方をするものでした」(佐藤氏)

 この営業支援システム、以前は11ラックを丸々使ったUNIXメインフレーム機で動作していた。

 「バッチ処理にしてもトランザクションに変更があればその都度、メンテナンスをしなければならず、非常に大きなコストの掛かる"お化けシステム"でした」(佐藤氏)

 これを、Caché製品群でリプレイスした結果、11あったサーバラックは2ラックに削減、丸一日掛かっていた月次処理は4分の1の6時間で完了するようになったという。オンラインでの問い合わせへの応答には1件当たり5秒だったものが、わずか0.3秒で済むようになったことで、業務効率は格段に向上したという。

 このパフォーマンスは、金融機関でも注目されている。

 「Cachéの場合は、パフォーマンスの優位はもちろんだが、データが永続化して記録されることから、インメモリデータベースに匹敵するパフォーマンスを実現しつつ、万一の問題が発生したとしてもデータを失うことがない」(佐藤氏)

 こうした技術的優位性のため、実際にある著名な海外の証券会社の自社顧客同士での株式売買システムであるプライベートトレーディングシステムにも採用されているという。

いま求められているのは「ブレークスルーアプリケーション」

 ここまでで、同社製品の高いパフォーマンスを活用した事例を幾つか見てきた。しかし、データベースアプリケーションに求められるものは、速さだけではない。

 「現代のアプリケーションでは、データ分析だけでなく、分析した結果に基づいたアクションを導くものが求められている」といって、佐藤氏は1つの調査資料を示した。

 ブロワリサーチが2011年に発表した「ブレークスルーアプリケーションの構築」という調査資料である。約めていうと、アプリケーションに求められるものが変容してきていることを示す内容だ。単純な既存業務プロセスの置き換えでなく、利用者により高い次元の価値をもたらすことのできるアプリケーションのあるべき姿を定義している。資料ではこれを「ブレークスルーアプリケーション」と名付けている。以下でその要件を抜粋しよう。

ブレークスルーアプリケーションの要件

1:マスパーソナライゼーション

マルチデバイスからのアクセス。人間活動を制限しない方法でのデータアクセスが可能であること。情報表現をマルチデバイスにする。データ表示を美しく分離できるアーキテクチャが必須である

2:全てのデータの開放

従来、ビジネス上で使われるデータは構造化したものだった。これは一方で、フォーマットに即した情報しか得られない、という制約になる。非構造データやフォーマットの異なるデータの中にある有益な情報を活用できる仕組みが必要である

3:情報に基づくアクションを示唆する

遅延なく、リアルタイムで分析できる仕組みがあること。また、アクションそのものもシステム上で自動的に示唆できる仕組みが必要である


 こうした「ブレークスルーアプリケーション」への市場の要請に対して同社は、「システム連携、データの蓄積、データ分析、分析結果のフィードバックまでを1社垂直統合型で提供する」(佐藤氏)ことに、アドバンテージを見ている。

 同社では、データベース製品Cachéを中心にシステム間連携のインターフェイスである「Ensemble」も提供しているが、近年、さらに周辺領域の機能を拡充させている。非構造データから構造を解析していくためのセマンティックエンジンである「iKnow」や、リアルタイムでの多次元データ分析エンジンである「DeepSee」である。

 特にDeepSeeは、トランザクションデータをリアルタイムで蓄積しながら多次元分析ができる仕組みに特長がある。

 「これは当社が持つデータインデクシングの特性がよく生きるポイント。Cachéは高速でフットプリントが小さなビットマップインデックス技術を使うことで、オンライントランザクションのデータに対して分析用インデックスを作れる技術を持っている」(佐藤氏)

 同社ではこの技術を“Active Analysis”と表現している。

iKnowのセマンティック分析エンジンを使った特集誌 PCS Knowledgeでは、格納済みの過去のコンテンツから記事や誌面の半自動生成を行っている。誌面は英国王子の婚礼を特集したもの。記事要約なども半自動で生成できるため、制作期間は半日程度だったという。辞書によるオントロジを利用しなくても分析できるのが特徴だ。将来的には日本語環境への対応も視野に入れているという

全ての製品で全ての分析エンジンが使える「ユニバーサルリッチプラットフォーム」

 「われわれは「ユニバーサルリッチプラットフォーム」という考え方で製品を提供している」(佐藤氏)というように、ソリューションとしてはCaché、Ensembleのほか、「HelthShare」の3製品を展開しているが、これらには、前述のデータ分析エンジンDeepSee、セマンティクス分析エンジンiKnowが基本的には標準で含まれている。

 ソフトウェアスタックの積み重ねで提供されるオープン系システムの構築や運用が煩雑になりがちなのと比較して、プラットフォーム全体を単一提供できるシンプルさも、同社製品群によるアプリケーション開発の容易性に寄与しているという。

インターシステムズが提供しているアプリケーションおよび開発環境のイメージ ソフトウェアスタック型のアプリケーションでは実現が難しい、技術要素同士を密に連携させたスマートな開発が可能だ

 アイデアがあれば、ブレークスルーアプリケーションは作り出せる。宇宙にある10億の星の情報から、新しい発見を導き出そうとしているガイア計画のように、例えば、大量のデータを多次元で分析して新しい相関関係を見つけられるかもしれない。また、多数の非構造データを有機的に解釈するセマンティック分析によって、思いがけない発見があるかもしれない。幸い、道具は既に揃っているようだ。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:インターシステムズジャパン株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2012年12月31日

関連記事(@IT)

知っているようで知らないオブジェクトデータベース。その定義と必要条件から、RDBとの違いを解説します

この仕組みの特長は、エンジニアのスキルでコーディングの差が出ないこと。それを受発注システムで体感しましょう

インターシステムズジャパンは10月23日、アプリケーション組み込み型ビジネスインテリジェンス(BI)ソフトウェア「InterSystems DeepSee」を発表した。同社主軸製品であるオブジェクトデータベース「Cache」との連携を前提とするが、一般的なRDBMSであってもCacheのRDBMS向けインターフェイス経由で接続して利用できる。

 「エンジニアはみんなオブジェクト指向言語を使っているのに、なぜオブジェクトデータベースを使わないんだろう? まるで、高級なポルシェに乗っているのに、ガレージではバラバラに分解して格納しているみたいだ」――そんなジョークが社内ではやっていると話すのは、インターシステムズソフトウェア開発担当副社長 ロバート・ネーグル(Robert Nagle)氏だ

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。