キーワード

最新ストレージ動向を理解するためのキーワード

デジタルアドバンテージ
2002/08/21


 数年前までは、サーバのストレージというと、本体に内蔵されたRAID構成のディスクかSCSIによる外付型のディスク・ユニットが一般的であった。しかし現在では、ハードディスクの大容量化や、インターネットの急速な普及・高速化など、サーバのストレージを取り巻く環境が大きく変わりつつある。例えば、ネットワークに直接接続してファイル・サービスのみを行うNAS(Network Attached Storage)といったものが登場したのは、ここ数年の話だ。また、IDEハードディスクの大容量化や低価格化は、これまでSCSIハードディスクの独壇場であったサーバの市場にもIDEハードディスク化を促し始めている。特にエントリ・サーバでは、いまやIDEハードディスクによるRAID構成を採用するのが一般的になりつつある。こうした新しい形態のストレージ機器の出現やIDEハードディスクの台頭、ハードディスクの新しいインターフェイス規格「シリアルATA」の登場などにより、サーバを取り巻くストレージ環境は大きく変化しつつある。そこで、ここではストレージ関連の用語を集め、そこから最新の動向を探ってみることにする。

注目のネットワーク・ストレージ

 ネットワークの普及やデータセンターなどの大規模なサーバ・システムの登場により、ストレージ環境が大きく変化しつつある。これまで、ストレージというと、サーバに内蔵もしくは外付型でも直接SCSIなどのインターフェイスで接続されたものであった。しかし、最近ではネットワークで接続するNASや、ストレージ専用のネットワーク環境を構築するSANなど、複数のサーバで共有するような形態のストレージ・システムが普及し始めている。NASやSANが本格的に普及するのかどうか、また新たな形態のストレージ・システムが登場するのか、今後に注目したい。

■NAS(Network Attached Storage)
 ネットワークに直結してファイル共有サービスなどをネットワーク・クライアントに提供するストレージ機器。アプライアンス・サーバの1種である。
 通常、ハードディスクやテープ・ドライブといった単体のストレージ機器をネットワークで共有するには、PCサーバにストレージを接続し、PCサーバにセットアップされたネットワークOSの機能により、ネットワークにストレージを公開する。これに対しNASは、PCサーバとネットワークOSが持つネットワークへのファイル共有サービス機能を内包しており、PCサーバなしで直接ネットワークに接続してストレージをネットワーク・クライアントに公開できる。
■SAN(Storage Area Network)
DELL | EMC FC5300
DELLとEMCのダブル・ブランドでデルコンピュータが販売しているSAN製品のエントリ・モデル。最大1.8Tbytesのディスク容量が確保できる。
 LANとは独立したストレージ専用のネットワーク環境に大容量ハードディスクやテープ・ドライブのようなバックアップ・デバイスを接続し、複数のサーバでストレージを共有可能にするデータ管理システム。
 ストレージやサーバとの相互接続には、高速なファイバ・チャネルを使用し、これらをファイバ・チャネル・ハブ(FCハブ)またはスイッチング・ハブ(FCスイッチ)によって接続する。比較的小規模なSANなら、低価格なFCハブを使用すればよい。しかし大規模なSANでは、ストレージとサーバ間でのより効率的なデータ転送を可能にするために、FCスイッチを使用するのが一般的だ。またFCスイッチを利用すれば、遠距離(数km〜10km)にあるサーバとストレージをSANで接続できるようになるというメリットもある。
■iSCSI(Internet Small Computer System Interface)
アダプテックのiSCSIアダプタ「ASA-7211」
ギガビット・イーサネット対応のiSCSIアダプタ。専用ASICにより、プロトコル処理を行うため、ホスト・プロセッサの負荷を少なくできるのが特徴。
 コンピュータとストレージ間のデータ通信を、IPパケットで包んだSCSIコマンドを使ってIPネットワーク上で行うためのプロトコル規格。iSCSIでは、ストレージ機器で一般的なSCSIコマンドを採用したことにより、既存のアプリケーションとの高い互換性を維持したまま、ネットワーク・ストレージへの対応が行えることを特徴としている。
 これまでのSCSIでは、各種制御やデータ転送のためのコマンドとともに物理的な伝送路も規定されていたが、iSCSIではSCSIのコマンド部分を取り出し、伝送路にIPネットワークを採用することで汎用性を高めている。iSCSIを採用することで、現在SANの伝送路として一般的に利用されているファイバ・チャネルの代わりとして、安価なイーサネット用のスイッチング・ハブやルータなどを使ってサーバとストレージの接続が行えるようになる。また、既存のネットワーク技術と管理手法が利用できるため、導入・管理コストが安価になることもメリットとして挙げられている。さらに伝送路にIPネットワークを用いるため、インターネットを使って遠隔地にあるストレージにデータをバックアップするディザスタ・リカバリといった用途にも応用可能だ。
 iSCSIでは、このように既存のSCSI技術とIP/イーサネット技術のメリットを活かした規格化が行われており、ストレージ・プロトコルの新たな標準規格としてサーバ/ストレージ業界の期待が集まっている。なおiSCSIは、現在IETF(Internet Engineering Task Force)でドラフト規格が公開されており、標準化作業が進められている。ドラフト規格に準拠した製品も、IBMやAdaptecなどからすでに発表されている。
 
関連リンク:iSCSIのドラフト規格
 
■DAFS(Direct Access File System)
 データセンターやクラスタ環境に最適化したファイル・アクセスと管理のためのプロトコル。VI(Virtual Interface:仮想インターフェイス)アーキテクチャをベースとした共有ファイル・アクセス・プロトコルである。DAFSでは、ネットワーク・ノード間で交換されるデータが、アプリケーションのメモリ領域に直接書き込まれるため、カーネルのバッファやコンテキスト変換処理が不要になる。そのためDAFSの導入によって、高速で低遅延なファイル・アクセスが可能な、サーバからローカル・ファイル・システムと同等に見える共有ファイル・システムが実現できる。
 
関連記事:Master of IP Network 特別企画:「DAFS」技術解説
関連リンク:DAFSの規格
 
■VI(仮想インターフェイス)アーキテクチャ(Virtual Interface Architecture)
 クラスタ内のサーバおよびストレージ間でレイテンシ(遅延)の少ない広帯域の通信を行うためのインターフェイス規格。VIアーキテクチャでは、VI対応のネットワーク・インターフェイス・カードやOSにVI Kernel Agentなどを組み込むことにより、高い性能と信頼性を持ったクラスタリングを可能にする。1997年12月にIntel、Compaq、Microsoftが規格化した。

普及が進むIDE RAID

 RAIDは、サーバに限らずワークステーションやハイエンド・デスクトップPCでも、ディスク・サブシステムの信頼性や耐障害性の向上を目的として、標準で搭載する機種が増え始めている。また、これまではディスク・インターフェイスとしてSCSIを採用したRAIDシステムが一般的であったが、ここ1〜2年で、低価格なIDEハードディスク/インターフェイスを採用したIDE RAIDシステムが、エントリ・サーバを中心に採用されるケースが増えてきたのも特徴して挙げられるだろう。これは、IDEハードディスクが安価なだけではなく、単体で160Gbytesといった大容量になってきたことも、その要因と考えられる。IDEハードディスクでも、容量100Gbytes以上のものを2台用いてRAID 1を構築すれば、比較的低予算でワークグループ・サーバでも十分な容量のRAIDシステムが構築できるからだ。

 IDE RAIDは、IDEハードディスクの大容量・高性能化に伴い、エントリ・サーバからミッドレンジ・サーバ・クラスにまで採用されることになるだろう。また現在、規格が策定中のシリアルATA IIにより、IDEハードディスク(「シリアルATAハードディスク」というべきか)も単体でホットスワップ機能などに対応するため、よりサーバでの利用に向いたものとなる。

■RAID 0
 「ストライピング」とも呼ばれ、2台以上のハードディスクに対してデータを分割して同時に読み書きすることにより、データ転送の高速化を実現する技術である。複数のハードディスクを単一の大容量ドライブとして利用可能になるのも、RAID 0のメリットとして挙げられる。半面、冗長性はまったくないうえ、複数のハードディスクに分割してデータが記録されることから、1台の故障ですべてのデータが失われることになる(故障していない残りのハードディスクに格納されていたデータも無意味なものになってしまう)。つまり、ハードディスク1台の運用よりも、RAID 0の方が信頼性という点ではむしろ劣ることになる。
 

RAID 0の動作原理
RAID 0では、ハードディスクの台数に合わせてデータを分割して、各ハードディスクに格納する。例えばデータ・ブロック1/2/3の組を読み出す場合、各ハードディスクに並行してアクセスすることで、ほぼ同時に1/2/3それぞれのデータ・ブロックを読み出すことが可能になるため、読み出し速度の高速化が実現できる。
 
■RAID 1
 「ミラーリング」とも呼ばれ、2台以上のハードディスクに対しまったく同じデータを書き込むことで、信頼性を向上させる技術である。1台のハードディスクが故障しても、残りのハードディスクが同一データを保存しているため、データは完全に保証されるほか、データの供給を継続して実行できる。半面、2台以上のハードディスクが必要なのに、その1台分の容量しか利用できないという利用効率の悪さがデメリットとなる。
 
RAID 1の動作原理
RAID 1では、データが書き込まれる際、ディスク・アレイ内の各ハードディスクにまったく同一のデータが書き込まれる。1台のハードディスクが故障した場合でも、残りのハードディスクが稼働し続けることで、データは失われずに済む。ただし、利用可能な容量はその分少なくなる。
  
■RAID 0+1
 RAID 0+1あるいはRAID 1+0、RAID 10、RAID 01は、RAID 0とRAID 1を組み合わせた技術である。これは、最低4台のハードディスクで構築し、RAID 0を構築したセットをRAID 1により複数構築する(あるいは、逆にRAID 1を構築したセットをRAID 0により複数構築する)というものだ。RAID 0でデータ転送の高速化を実現し、また複数のハードディスクを単一ドライブとして活用できるうえ、RAID 1により冗長性も確保できるというメリットがある。ただ、RAID 0+1の場合も、RAID 1と同様、ハードディスクの利用効率は半分以下に下がることになる。
 
RAID 0+1の動作原理
データを分割してハードディスクに格納する点は、RAID 0と同じだが、RAID 1によって2台以上のハードディスクに対して、まったく同一のデータを書き込む点が異なる。こうすることによって、RAID 0の単一の大容量ドライブを活かしながら、RAID 1によって冗長性の確保も可能になる。ただ、ハードディスクの利用効率は図のように半分以下に下がることになる。なお、図はRAID 1で構成されたハードディスク・アレイを複数台使ってRAID 0を構築した例である。
 
■RAID 5
 「分散データ・ガーディング」とも呼ばれ、ハードディスクの故障時に記録データを修復するための「パリティ」と呼ばれる冗長コードを、全ハードディスクに分散して保存する技術である。RAID 5では、データをハードディスクに記録する際、RAID 0と同じ原理で、複数のハードディスクにデータを分散して書き込む。それと同時に、パリティも計算・生成する。パリティ用ハードディスクは特に決まっておらず、全ハードディスクに分散して書き込まれる。これにより、パリティ専用ハードディスクのみに負荷(アクセス)が集中し、性能が低下することを防いでいる。また、どれか1台のハードディスクが故障しても、それ以外のハードディスクのデータとパリティ情報から、元の完全なデータを修復できる。ただし、修復可能なのは1台のディスクが故障したときまで、同時に2台以上が壊れると修復できない。
 パリティの保存に必要なのは、全ハードディスク台数に関係なくハードディスク1台分の容量である。従ってハードディスク台数が多いほど容量の利用効率も向上することになる。RAID 1(ミラーリング)と比較した場合、この利用効率の高さがRAID 5のメリットだ。RAID 5の性能については、ハードディスクからの読み出し時には、複数のディスクから同時並行読み出しが可能なので高速化できる。しかし、パリティを生成するオーバーヘッドから、書き込み性能は決して高くはない。

 
RAID 5の動作原理
データを分割して各ハードディスクに格納するという原理はRAID 0(ストライピング)と同じ。異なるのは、データ・ブロックの組ごとにパリティが生成される点である。たとえ1台のハードディスクが壊れても、残りのハードディスクに格納されたデータとパリティから、失われたデータを修復することができる。
 
■シリアルATA (Serial AT Attachment)
 IDE(ATA)の後継として開発されている次世代ディスク・インターフェイス。シリアルATAでは、その名のとおりデータ転送にシリアル伝送方式を導入しているのが大きな特徴である。現行のIDEと比べ、シリアルATAではケーブルやコネクタなどの物理的な仕様が大きく変更されている。まず、伝送方式が16bitデータ幅のパラレルからシリアルに変わったのに伴い、信号ケーブルは従来の40/80芯フラット・ケーブルから7芯となり細くなったほか、最大ケーブル長は457mmから1000mmに延長された。また、従来は1本の信号ケーブルに最大2台までドライブを接続していたが、シリアルATAでは1台のみ、つまりPCとドライブは1対1に信号ケーブルで接続される。もちろんコネクタ形状も変わっており、3.5インチ幅と2.5インチ幅それぞれのハードディスクで、コネクタ形状が統一された。
 最大転送速度は、従来のIDE(Ultra ATA/100)が100Mbytes/sなのに対し、シリアルATAでは150Mbytes/sに向上している。また、従来のIDEでは、フラット・ケーブルの電気的な特性などにより、転送速度はほぼ物理的限界に達しており、性能向上が困難なのに対し、シリアルATAでは同じケーブルとコネクタのまま2倍(300Mbytes/s)の性能向上が予定されている。
■シリアルATA II (Serial AT Attachment II)
 シリアルATAを主にサーバ向けに拡張した規格。シリアルATA 1.0に対して、2段階に分けて機能の拡張を予定している。
 第1段階では、コマンド・キューイングやアウトオブオーダ実行などの機能拡張による性能向上、冷却ファンの制御や温度の検知などディスク・ユニットの管理機能、ホットプラグの対応などが図られる予定だ。2002年後半には規格化を行い、2003年中ごろまでに対応製品の出荷が行われることが期待されている。
 第2段階では、データ転送速度をシリアルATA 1.0の150Mbytes/sから300Mbytes/sへ2倍に高速化することや、ドライブ接続数の拡張などが行われる。2003年後半に規格化を行い、2004年中ごろまでに対応製品の出荷が行われるという。

 今回は、ネットワーク・ストレージとRAIDを中心にキーワードを広い集めてみた。次回は、光ディスクやバックアップ・ドライブなどを取り上げる予定だ。記事の終わり

  関連リンク 
iSCSIのドラフト規格
特別企画:「DAFS」技術解説
DAFSの規格
 
 
 「System Insiderのキーワード」


System Insider フォーラム 新着記事
  • Intelと互換プロセッサとの戦いの歴史を振り返る (2017/6/28)
     Intelのx86が誕生して約40年たつという。x86プロセッサは、互換プロセッサとの戦いでもあった。その歴史を簡単に振り返ってみよう
  • 第204回 人工知能がFPGAに恋する理由 (2017/5/25)
     最近、人工知能(AI)のアクセラレータとしてFPGAを活用する動きがある。なぜCPUやGPUに加えて、FPGAが人工知能に活用されるのだろうか。その理由は?
  • IoT実用化への号砲は鳴った (2017/4/27)
     スタートの号砲が鳴ったようだ。多くのベンダーからIoTを使った実証実験の発表が相次いでいる。あと半年もすれば、実用化へのゴールも見えてくるのだろうか?
  • スパコンの新しい潮流は人工知能にあり? (2017/3/29)
     スパコン関連の発表が続いている。多くが「人工知能」をターゲットにしているようだ。人工知能向けのスパコンとはどのようなものなのか、最近の発表から見ていこう
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

System Insider 記事ランキング

本日 月間