多くの読者にとって、バズワード「ビッグデータ」は食傷気味のきらいがあるだろう。しかし、ブームに踊らされることなく、サーバベンダ各社はリアリティあるデータ活用のあるべき姿を提示し始めている。特集では最新の動向を紹介する。
ビッグデータという言葉は多くの読者が食傷気味なのではないだろうか。
確かに、FacebookやTwitterといった巨大なユーザーを抱えるソーシャルサービスは、個々のユーザーが日々大量の情報を更新しており、そのボリュームは恐ろしく多い。AmazonのようなECサービスにおいても、ユーザーの行動履歴やレコメンドなどといった新しいサービスの開発も大量データの処理ができなければ対応できないものだ。また、M2MやGISデータを駆使したシステムも実現しつつあるが、これも例えばロジスティクスなどで使えるかもしれないが、あくまでも、既存の情報に追加的に活用されるいわば「周縁」に位置するシステムだろう。
コンピュータシステムのほとんどは、こうしたソーシャルな情報「以外」のデータを管理している。それゆえに、多くの読者にとって「ビッグデータ革命」といっても、そのインパクトは実のところ大きくはなかったはずだ。
特に、基幹系のシステムのように、定型のデータを扱う部署にとっては、直近の決算処理をエラーなく正しく返すことの方がよほど重要な関心事だろう。
基幹系システムに求められる要素は、前述の、多少のデータ欠落も笑って許せるような周縁的なコミュニケーションツールとはまったく異なる要件のものだ。いくらFacebookが巨大なデータセンターを運用しているといっても、「多少のノードダウンが許される要求レベルではないか」と感じるはずだ。
多くの企業がグローバル化やコスト削減を前提に企業システムのクラウド活用を推進するといっても、本社の重要な基幹システムについては、オンプレミスないしは物理的に独立させてデータセンターに預ける決断をする。基幹システムが扱う情報は企業活動の核心部分であり、そこにこそ、その企業の価値がある。とはいえ、近年の企業情報システムには、多くのほころびが出てきているのも事実だ。
例えば、特定の事業所における過去数年間の販売動向を分析する場合を考えてもらいたい。おそらく、分析系のシステムは別システムになっており、夜間バッチなどでデータウェアハウスなどのシステムに送っていることだろう。そこで、専門の担当者に作業依頼を出し、結果をレポートとして入手する。ユーザー側の視点からすると、週次の会議体で議案が上がり、次週の会議までにレポートすることが求められるだろう。ユーザーは会議後に分析部門に依頼を出し、1週間後にひとそろえのレポートを受け取る、という流れになっている。この間のタイムロスは1週間あることになる。1週間、問題を把握できずに、ただただ時間を費やしていることになる。
こうしたタイムロスの根本的な原因は、従来の業務系システムが分析系のシステムを内包できないことにあった。
多くのITベンダがこうした課題に対してまさに「ソリューション」として解決策を提案しつつある。いずれもビッグデータブームに踊らされない、企業情報システムの次の一手になり得る提案だ。
例えば、クラウド型DWHという提案がある。データ分析に関わるシステムを外部の分散処理環境に渡してしまおうという取り組みだ。一方で、データベースシステムそのものを高速化し、その中でOLAPもOLTPも両方の処理をリアルタイムで実現しようという企業がある。後者のアプローチにはさらにいくつかに分類できる。独自のハードウェアをチューニングするアプローチや、高速化を求める部分のみをハードウェア論理回路に落とし込んでみようという試みなどだ。
以前からハイエンドサーバ機ラインアップを持つ富士通も同様に、後者のアプローチから基幹業務システム向けサーバ製品の高速化を図り、企業システムの硬直化を打破しようとする試みをスタートさせている。プロセッサを自前で作る技術力のある企業が提案する基幹システム改革の方向性は、前述のベンダの動向に一石を投じる動きとして興味深い。
富士通のアプローチのポイントは、さまざまな技術を駆使した処理速度の高速化と集約、分析向けのハードウェア・ソフトウェア横断的な取り組みに集約できよう。
本稿では、SPARCプロセッサを軸に基幹システムの変革を狙う富士通 プラットフォーム技術本部 プロダクトソリューション技術統括部 部長 志賀真之氏にその目指すところと狙いを聞いた。連載第1回では、まず処理の高速化と集約についての富士通のアプローチを、第2回では、同社が「Software on Chip」と称する技術革新を中心に紹介する。
富士通は2013年1月18日に最新のSPARCチップを搭載した「SPARC M10」を発表した(関連記事)。富士通が提供するSPARC64チップ搭載UNIXマシンには、高スループットを特徴とするTシリーズとミッションクリティカル系システム向けの信頼性を特徴とするMシリーズがあり、M10はこの高信頼性を特長とするラインアップの最新機に当たる。OSにUNIX系OSであるOracle Solarisを採用している。
従来のSPARC64チップを踏襲する高い信頼性と、最大1024コアのプロセッサ、32TBの高速メモリ、高速インターコネクト、コア・アクティベーションなど、目新しいキーワードに包まれたUNIXマシンだ。SPARC M10については、既に幾つかの国内大手企業でβ機を使った評価が実施されており、富士通によると製品発表時点(2013年1月)で100件を越える商談が進んでいるという。
チップの中にメモリコントローラやシステムコントローラに相当する回路を持つSPARC64 Xの各コアは、おのおのが独立したノードとして機能することが可能だ。これは、Googleなどが複数のPCノードを接続して実施している分散・並列処理の仕組みを、1基のMPUで実現するということを意味する。しかも、システムとして高信頼性を担保する実装になっていることから、GoogleなどがPCサーバを並べて実施する内容を、より確実に効率よく実行できるわけだ。
「おそらく、PCサーバでグリッドコンピュータのように並列処理向けの環境を組んだとしても、計算性能だけなら同様のことはある程度できるでしょう。ただし、ノード間の通信はどうでしょう? せいぜいInfiniBand接続でしょう? SPARC64 XではCPUに高速シリアルインターフェイスを直接組み込んでいますからレスポンスも信頼性も、格段に高くできるのです」(志賀氏)
SPARC 64 Xの開発陣はスーパーコンピュータ「京」の設計にも携わったチームだ。富士通が理化学研究所と共同で手掛けたスーパーコンピュータ「京」では、処理高速化・スケーラブル化を目指した新しいインターコネクト「Tofu」を採用している。6次元のメッシュ/トーラス構造で、リンク当たり5Gバイト/秒の転送速度を実現する(Tofuの実装についてはリンクで詳細情報を確認できる)。
「京で開発したこのインターコネクトの技術はSPARC M10に搭載しているSPARC64 Xでもより汎用的な形で受け継がれています」(志賀氏)
Copyright © ITmedia, Inc. All Rights Reserved.