バックアップを効率化する重複排除テクノロジ

バックアップを効率化する重複排除テクノロジ(2)

重複排除のさまざまな形態


株式会社シマンテック
プロダクトマーケティング部 プロダクトマーケティングマネージャ
浅野 百絵果
2010/7/2

 重複排除の最適な適用方法

- PR -

 このように、重複排除を適用する手法は、実行されるタイミングによる方式と、ハードウェアまたはソフトウェアによる実装から選択することになる。新たに環境を構築するのか、既存の設備を流用するのか、またネットワーク経由でバックアップするのかなどによって最適な実装方法は異なる。ここからは、どのようなシーンでどのタイプの重複排除が最適となるのか考えてみよう。

既存の環境に重複排除機能を追加する場合

 バックアップ対象となるシステムは既存のもので、運用コストの削減やデータ増加の対応のために重複排除の採用が必要になったとしよう。バックアップは、ITシステムの中では裏方的な役割を果たしている。積極的にサービスを提供しているわけではないが、何かあったときにはひっそりと、しかし確実にその役割を全うしなくてはいけない。このため、バックアップのために既存のシステムを変更してサービスが停止することは避けたい。その場合は、ハードウェアによる重複排除が最適なソリューションとなるだろう。ただし、専用のディスクストレージの購入が必要となるので、それなりの初期投資は覚悟しなくてはいけない。

既存のストレージを活用して重複排除機能を追加する場合

 重複排除にはコスト削減の効果がある。またこれが導入の契機になることも多い。したがって、既にディスクベースのバックアップストレージを使用している場合は、節約のためにこれを無駄なく流用したい。この場合は、ソフトウェアでの重複排除が最適である。また、ソフトウェアの重複排除にはメディアサーバによるもの、またはバックアップクライアントによるものがあるが、より効果が高いのはバックアップクライアントでの重複排除である。より少ないデータがバックアップ処理の対象となるため、バックアップ時間の短縮も期待できるためである。ただし、業務サーバに追加の負荷をかけたくない場合には、メディアサーバでの重複排除が適切である。

ネットワーク経由でバックアップする場合

 通常のバックアップ運用では、定期的にフルバックアップの実施が求められる。つまり1TBのデータ量をバックアップするためには、毎日ではないとしても、1週間に一度またはそれに近い頻度で1TBのデータ転送が必要である(非圧縮の場合)。そのため社内LANやWANなどの既存のネットワークを流用してのバックアップは難しいケースもある。このような場合は、通常、業務サーバをメディアサーバと兼ねて、直接ストレージを接続し、スタンドアロンでバックアップを実施するということになる。ただし、スタンドアロンでのバックアップでは、それぞれの業務サーバにそれぞれ専用のメディアを接続することになるので、無駄が多い。できればストレージを集中させて共有したほうが、領域を無駄なく使うことができる。これはクライアントでの重複排除を使うことにより解決することができる。

 クライアントでの重複排除では、変更ブロックだけが転送されるので、非常に少ないデータ量に抑えることができ、既存の設備を使ったネットワーク経由でのバックアップが実現できる。これは単に容量を節約できるだけでなく、台数も少なくなるので、管理コストの削減にもつながる。重複排除はその処理が実行される場所によって実装方法が異なる。概して、データの発生源に近いところでメリットが多くなるが、逆に発生源に遠いところでの実装ではシステムに与える影響が少なくなる。一概に重複排除と言っても、ベンダにより実現できる手法が異なる。インライン方式とポストプロセス方式を組み合わせたハイブリッド型や、ソフトウェアによってポストプロセスを実行する製品なども登場している。したがって、適切な手法を見極めた上でソフトウェアやストレージを選定することが推奨される。

 次回は、さらに高度な重複排除の実装例と、最先端の技術を紹介する。

2/2
 

Index
重複排除のさまざまな形態
  Page1
重複排除を使ったバックアップの手法
 (1)バックアップクライアントでの重複排除
 (2)インライン方式
 (3)ポストプロセス方式
 ソフトウェアかハードウェアか
Page2
重複排除の適切な適用方法
 既存の環境に重複排除機能を追加する場合
 既存のストレージを活用して重複排除機能を追加する場合
 ネットワーク経由でバックアップする場合

Server & Storage フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Server & Storage 記事ランキング

本日 月間