DC間も自動複製、Yahoo! JAPANとIDCフロンティアが提供する分散ストレージサービスとは?:3重化 x 2データセンターで6重の冗長化
IDCフロンティアとYahoo! JAPANは、複数拠点へのデータの自動分散を基本機能として備える「IDCフロンティア 分散ストレージサービス powered by Yahoo! JAPAN」(以下、分散ストレージサービス)の提供を開始する。サーバーの障害や大災害発生時においてもデータが消えることはなく、止まらない耐障害性、耐災害性に優れた、信頼性の高いサービスを目指す。Amazon S3 APIと互換性の高いWeb APIを備え、共通のツールを活用できる。価格では競合サービスより安価な設定を予定しているという。
データを自動分散する機能を標準装備することで堅牢性・可用性を高めた「分散ストレージサービス」が、今春より正式に提供開始となる。Yahoo! JAPANがクラウドインフラの技術面で支援し、ヤフー株式会社の100%子会社のIDCフロンティアがサービスを販売する。今回のサービスは両社のノウハウを持ち寄ったもので、共同でサービスを展開していくという。
この分散ストレージサービスの最大の特長は堅牢性・可用性である。「データが消えない・止まらない」サービスを目指し、自動分散機能をサービスの基本機能として備える。
もう1つの大きな特長が、クラウドストレージのサービスとして有力なAmazon S3 APIとの高い互換性を備えることだ。S3用のユーティリティやツール類などS3エコシステムの多くの部分をそのまま活用できることから、S3を対象に構築した既存システムの移行先候補ともなる。さらにパフォーマンスや価格についても、Amazon S3を始めとする競合サービスよりも優位性を出していくという。
企業ユーザーが利用する場合、ユーザーのインフラ環境と当サービスの間を、セキュリティ上のリスクを少なく低遅延の専用回線で結ぶことも可能だ。
以下、「分散ストレージサービス」の内容を見ていくことにしよう。
データが消えない、サービスが止まらない堅牢性と可用性を自動分散で実現
「分散ストレージサービス」の最大の特長は堅牢性・可用性である。書き込まれたデータを冗長化して保存するのは、クラウドサービスの基本だが、地理的に隔たったデータセンター間で自動的にレプリケーションを保持する、というのが大きな特徴だ。サービスを開発した2社は、こうしたデータの自動分散の機能を備えた商用サービスは日本では初ではないかとしている。
自動分散の機能を実現するための基盤技術として、米Basho Technologies社が開発した「Riak CS」を活用した。Riak CSは分散型のNoSQLデータベース(分散KVS)の「Riak EDS」上に構築した分散ストレージプラットフォームであり、インフラレベルでのデータの自動複製と分散化を実現する。Riak EDSは単一障害点(Single Point of Failure、SPOF)を持たず、耐故障性がある。また、Riak EDSはパフォーマンスに優れる分散NoSQLデータベースである。なお、IDCフロンティアとRiak開発元のBasho Technologies社とは、資本を含む提携関係にある(参考記事:分散ストレージのBashoが日本法人設立で提携業務を本格化:IDCF、RiakでAmazon S3型ストレージ提供へ - @IT)。
一般的に分散ストレージといった場合、同一データセンター内でクラスタを用意し、クラスタ内の複数ノードに同時書き込み、読み込みを行うことで冗長化や高速化を行う。一定数までならノードがダウンしたり障害が発生しても可用性が保たれるが、データセンター全体に対する障害には無力だ。
一方、IDCフロンティアとYahoo! JAPANが提供する「分散ストレージサービス」では、データを複数サーバーからなるクラスタに分散するだけにとどまらず、複数のデータセンターへ分散する。これにより、大規模災害など、データセンター自体がダメージを受けるような場合であっても稼働し続けるほどのデータの冗長化も実現しているのが特長だ。具体的には、東日本拠点と西日本拠点の複数拠点のデータセンターにデータの複製を自動的に配置する。データの複製はデータセンター1拠点当たり3個作られ、さらにそれと同じものが2拠点に作られる。合計すると6重化の冗長性を持つことになる。
従来のサービスの場合では、データを複数拠点に自動的に分散する仕組みを独自で構築したとしても、それを24時間365日の無停止運用することは簡単ではなかった。この「分散ストレージサービス」では、複数拠点への自動分散を基本機能として備えており、東西拠点計6重の冗長化により、24時間365日の無停止運用が実現可能となっている。
東西拠点間での6重化の結果として、堅牢性、すなわちデータが消失しない確率が99.99999999999999999%(19ナイン)、可用性、すなわちサービスが止まらない確率が99.9999%(6ナイン)という数字を公表している。まさにデータが消えることがなく、かつ止まらないサービスを実現しているのである。これらの確率は、サーバーマシンの稼働率、データを自動的に複数のサーバーからなるクラスタ上に分散配置して冗長化すること、さらに同じクラスタが2拠点のデータセンター分散配置されていることから計算した理論値である。Amazon S3など他のクラウドサービスに比べても、文字通り桁違いに高い数字だ。
単に堅牢性・可用性が高いというだけではない。巨大地震のような大規模災害により、もしデータセンター上のデータが損なわれる非常事態に陥ったとしても、遠隔地にあるもう1カ所のデータセンターを利用してサービスを継続することが可能だ。つまり災害復旧(Disaster Recovery、DR)や事業継続計画(Business Continuity Planning、BCP)に求められる機能を、サービスの基本機能の範囲でカバーしているのである。
下図は、同一データセンター内でRiak CSがクラスタ内でのデータの複製(レプリケーション)を実行するとともに、2拠点のデータセンターの間でも複製を作成する様子を示したものだ。もちろんこれらの内部構造をユーザーは意識する必要はなく、単一のサービスとして利用することが可能となっている。
この「分散ストレージサービス」の設計や運用などでは、高い安定性を誇る日本最大級のインターネットサービスであるYahoo! JAPANのクラウドインフラのノウハウが注ぎ込まれている。そして、Yahoo! JAPANは「止まらないインフラ」を必要としているため、今後の新たなサービス開発の基盤として当サービスを活用していく方針という。Yahoo! JAPANのクラウドサービスを支えられるような基準を満たしているのが、今回の「分散ストレージサービス」なのだ。
パフォーマンスでも競合サービス以上を目指す
同サービスは、ストレージサービスという性格上、画像、ドキュメント、動画データなど、あらゆる形式のファイルを保存できる。
パフォーマンスは競合サービスと「同等かそれ以上」を確保したという。負荷も含めて考慮したテストでの実測結果は、ファイルサイズが小さいほど優れた結果が出ている。「例えば、写真のサムネイルを並べるようなサービスでは非常に良好な性能が出せる」という。
Amazon S3 APIと高い互換性を備えており、既存のSDKやツール群も利用可能
この「分散ストレージサービス」のもう1つの大きな特長が、Amazonが提供するクラウドストレージAmazon S3と互換性の高いWeb API(RESTful API)を備える点である。従って、S3のエコシステムがそのまま使えるということになる。
具体的には、S3のために作られたツール、ユーティリティの多くが利用可能であるという。例えば、オープンソースソフトウエアとして提供されているコマンドラインS3クライアント「s3cmd」や、FUSEベースのファイルシステムとしてマウントできる「s3fs」が利用可能である。
つまり、Amazon S3上に作り上げた既存システムの移行先として「分散ストレージサービス」を利用する使い方も可能である。すでにS3上に作り上げたシステムを運用している場合であっても、コストやパフォーマンス、安定性、堅牢性などを比較した上で移行することも可能で、新たな選択肢ができることになる。
ところで、Amazon S3はクラウド上のコンピューティングサービスAmazon EC2と共に使われる事例が多い。S3の活用法として、EC2のマシンイメージをS3で保存する、つまり疎結合で連携する事例が多いことから、IDCフロンティアは同社が提供するクラウドサービスの「クラウド セルフタイプ」、また、「クラウド マネージドタイプ」と、この「分散ストレージサービス」を併用する使い方も提案していく。
専用回線を提供、セキュリティと帯域・低遅延を確保
クラウドサービスの本格活用では、回線も問題となる。IDCフロンティアでは、顧客のデータセンターと同社のクラウドサービスの間を、インターネット経由ではなく専用回線で結ぶ「ダイレクト接続」サービスを提供する。閉域網による接続であることから、セキュリティ面でのリスクはインターネット経由のVPNなどに比べはるかに低い。さらに、インターネットを経由しないことによりホップ数が減り、低遅延になるメリットも得られる。企業ユースでの活用を狙う。
価格は競合サービスより安く設定
「分散ストレージサービス」は、現在先行提供中の段階だが、今春より正式にサービスを開始する予定である。同時に価格体系も発表する。「東西2拠点で1GB当たり10円/月を切る価格での提供を目指している」という。さらに、データの転送量に対するトラフィック課金が発生する。アップロードに対しては無料分を設定し、ダウンロードに関しては従量課金となる。このトラフィック課金を含めても、競合サービスとなるAmazon S3に比べて安価となる見込みという。
堅牢性・可用性が高く、価格も既存サービスより安価であり、Amazon S3 APIとの互換性も高いため、多くの企業ユーザーにとって、次世代のクラウドストレージである「分散ストレージサービス」は要注目といえそうだ。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:ヤフー株式会社・株式会社IDCフロンティア
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2013年4月28日