EMCジャパンは2016年3月2日、新ジャンルのオールフラッシュストレージ「DSSD D5」、および「VMAXオールフラッシュ」を発表した。本記事ではDSSD D5の詳細について、EMCアジア太平洋および日本 DSSD部門 セールス&事業開発ディレクター、マイケル・レオン(Michael Leon)氏の説明に基づき紹介する。
EMCジャパンは2016年3月2日、新ジャンルのオールフラッシュストレージ「DSSD D5」、および「VMAXオールフラッシュ」を同日提供開始したことを発表した。2製品は米国で2月29日に発表されている。本記事ではDSSD D5の詳細について、EMCアジア太平洋および日本 DSSD部門 セールス&事業開発ディレクター、マイケル・レオン(Michael Leon)氏の説明に基づき紹介する。
DSSD D5は、ネットワーク接続型のオールフラッシュストレージでは満たせない高速/低遅延を実現するため、PCIeフラッシュと共用ネットワークストレージの「いいところ取り」をするべく5年にわたり開発されてきた製品。同社はこの製品を「ラックスケールフラッシュ」と呼んでいる。
サーバのPCIeバスに直結するPCIeフラッシュカードは高速なストレージアクセスを提供できるが、これでは搭載できるフラッシュの容量が限られるし、データの共有ができない。また、PCIeフラッシュカードに障害が発生すると、データが失われてしまう。
そこでDSSDは、サーバから独立した、オールフラッシュストレージ装置でありながら、PCIeケーブルで複数のサーバと接続。各サーバはSAS/SATAよりも高速なストレージアクセスプロトコルであNVMeを使い、DSSDを内蔵ストレージであるかのように考えて、データの読み書きを行う。サーバはDSSD上のデータを共有できるとともに、この製品の可用性向上機能を活用できる。
EMCは、DSSDの性能関連のスペックとして1000万IOPS、帯域幅100GB/秒、遅延100マイクロ秒という数値を示している。容量については、物理容量144TB、72TB、36TB(実効容量100TB、50TB、25TB)のモデルがある。
「DSSD D5」シリーズの「D5」という名称は、「DSSD」の「D」、そして「5U」の「5」から来ているという。
DSSD D5はサーバ接続用に、96のポートを備える。そして、各サーバと2本のNVMe PCIeケーブルで接続する。1サーバ当たり2ポートを使うため、最大48台のサーバを接続できる計算になる(1サーバと4本のケーブルでつなぎ、帯域幅を広げる構成も可能という)。DSSD側の各ポートはPCIe Gen3(4レーン)であり、各サーバに対する2本の接続はアクティブ―アクティブであるため、理論的には各サーバと8Gbpsで接続できることになるという。
DSSD D5は36の独自開発フラッシュモジュールを搭載。このモジュールはホットスワップが可能となっている。また、2つのコントローラモジュールおよび2つのI/Oモジュールを備えている。
DSSDでは、コントローラはI/Oパスに介在しない。コントローラを経由するとボトルネックになってしまうからだ。レオン氏が@ITにしてくれた説明によると、サーバからの書き込みデータはI/Oモジュールが受け、これをPCIeマルチキャストという手法で、2つのフラッシュモジュールとコントローラへ同時に送るようになっている。つまり、DSSDのフラッシュチップは事実上、サーバのソフトウェアと直接通信しているという。
可用性を確保する機能として、DSSDは同社が「CUBIC RAID」と呼ぶ、独自のRAID機能を備えている。これは36基のフラッシュモジュールにまたがるパリティ計算と、単一フラッシュモジュール(上のフラッシュチップ)を32のグループに分け、これらにまたがるパリティを計算するものとを組み合わせた機能だという。これにより、他のRAIDアルゴリズムに比べて2倍の信頼性を確保できていると、レオン氏はいう。
RAIDのパリティ計算はコントローラが実行するが、上記の仕組みにより、この作業がフラッシュチップへのデータ書き込みとは別に行われるため、パフォーマンス低下をもたらすことはないという。
DSSD D5へのアクセス方法を、EMCは3種類用意している。ブロックドライバ、EMCが「Flood Direct Memory API」と呼ぶAPI、そしてプラグインだ。
ブロックドライバはサーバに装着する専用NVMe PCIeカードを経由して、DSSDをLinuxブロックデバイスとして見せるもの。Flood Direct Memory APIではアプリケーションがOSスタックを回避し、ダイレクトメモリアクセスでDSSDのフラッシュチップを直接利用できるため、従来と異なるレベルの低遅延を実現したい場合、EMCはこれを推奨している。プラグインは、アプリケーションの改変を避けられるよう、EMCあるいはパートナーが一般的なアプリケーションについて、そのストレージアクセス手法と、Flood Direct Memory APIとの翻訳を行うソフトウェアを開発するものだ。現時点では、HadoopのHDFSに対応したプラグインが提供されている。
レオン氏は、ゲノム解析などの用途特化型アプリケーションをはじめ、不正検知やリスク分析、リアルタイム分析などで、DSSDの性能が生きるという。さらには一般のデータベースで、高速化のためにテーブルのパーティショニングをはじめとした様々な工夫を凝らしている場合、DSSDの性能によってこうした作業を不要にすることができると話している。
あるテストでは、Oracle RACとDSSDの組み合わせで、8KBのデータについて530万IOPSを達成したとレオン氏は話した。他のソリューションのどれよりも3倍以上高速で、TCOも3分の1に低減できるという。
Copyright © ITmedia, Inc. All Rights Reserved.