いまどきのサーババックアップ戦略入門(5)

アプリ対応で進化したバックアップ技術を使う


株式会社シマンテック
成田 雅和
2008/1/16


 「アーカイブ」の意味の変化

 「アーカイブ」とは、狭義には複数のデータを保存目的で1つにまとめておくことであるが、原則としてアクセス頻度が低いデータが対象となるため、性能が高くなく、コストの低いストレージにデータを移すことを意味するように変わってきている。こうしたデータへのアクセスは、更新ではなく参照のために行われるケースが大半であるため、通常の圧縮だけでなく重複排除技術も使ってデータ量を削減したり、参照が高速になるように索引(インデックス)を作るといったことも行われるようになってきている。このようなアーカイブを行うことで、元の業務サーバにはアクセス・更新の頻度も高いワーキングセットだけを残せるようになり、高性能で高価なストレージを有効利用できるようになる。また、業務サーバが処理すべきデータ量が削減されるため、データ量増加によるサーバ性能の劣化が最小限となるといった副次効果が得られることもある。

 バックアップという観点から見た場合、アーカイブすることでバックアップ対象とすべきデータ量が減るために、バックアップウィンドウやRTOの短縮といった形でバックアップのサービルレベルを上げることができる。そもそも更新頻度が低いデータを、フルバックアップ/差分・増分バックアップといったポリシーでバックアップすることに大きな意味はない。更新がないので複数世代のフルバックアップに複数コピーを持つ意味はないし、差分・増分ではバックアップされないので、バックアップ対象として更新の有無を調べに行くことも無駄だからである。バックアップウィンドウ内で処理が終わらずに問題となるような場合、バックアップ視点からアーカイブを導入し、バックアップすべき対象データを絞り込むということも対策の1つである。

 アーカイブを行う場合、アーカイブしたデータについても(長い周期ではあっても)定期的にバックアップを取ったり、レプリケーションなどで複製を作ったりすることは必須である。バックアップとアーカイブを混同して、「アーカイブしたデータのバックアップは不要」としているケースもまれに見受けられるが、これは誤りである。バックアップとは異なり、広義のアーカイブでは、元のデータを消すことになるので、アーカイブデータが障害などにより欠損すると、データロスに直結するからである。アーカイブを導入する場合には、アーカイブしたデータのバックアップにも留意しておこう。

 暗号化ニーズにどう対応するか

 バックアップテープを輸送することで災害対策の一助とすることも多いが、この場合に問題になるのがテープの紛失事故によるデータ漏えいである。漏えい対策の1つがデータの暗号化である。

 暗号化を行う場合、(1)業務サーバ上で行う、(2) バックアップサーバ上で行う、(3) テープ装置で行う(あるいはバックアップサーバとテープ装置の間に暗号化装置を挟む)と、大別して3つの方法がある。

図3 バックアップデータの暗号化

 業務サーバ上で暗号化を行う方法はもっとも簡単で、業務サーバとバックアップサーバ間の通信も暗号化されるため最も安全な方法であるといえる。半面、業務サーバのCPUを使用して暗号化処理を行うため、バックアップ処理中は暗号化処理の負荷が大きくかかり、結果としてバックアップに必要な時間も長くなる。また、暗号化しないバックアップではテープ装置によりデータが圧縮されるが、暗号化したデータは圧縮が効かないため、使用するテープ本数を増やすか、暗号化前にデータを圧縮することになる。この圧縮処理も業務サーバ上のCPUで行うことになるため、業務サーバ上の負荷は非常に大きなものとなってしまう。

 一方、バックアップサーバ上で暗号化処理を行う場合、業務サーバへの負荷は暗号化しないバックアップと同等である。ネットワーク上を流れるバックアップデータも平文であるため、安全という点では(1)の業務サーバ上での暗号化より劣る。バックアップサーバ上での圧縮、暗号化は同じように高負荷な処理であるが、いったんバックアップサーバ側のディスク上にステージングし、そこからあらためて圧縮、暗号化処理をしてテープへ書き込むことで業務サーバから見た場合のバックアップウィンドウを短くすることができる。

 バックアップサーバへのデータ転送も含めて暗号化する場合には、業務サーバ側での暗号化を、遠隔地へ輸送するテープのみの暗号化でよい場合にはバックアップサーバ側での暗号化を検討するのがいいだろう。

◆◆◆

 5回の連載を通じ、バックアップに対する業務要件の変化に応じた新しいバックアップ戦略の必要性として、バックアップ装置の都合でなく、業務やリストア要件、特にRTO(目標復旧時間)やRPO(目標復旧時点)という点に着目した戦略の立案について解説した。また、その実現を支援する新技術として、ディスクベースのバックアップやVTL、スナップショット、重複データ排除、負荷分散、データレプリケーションによる災害対策、アプリケーション固有のバックアップなどについて解説してきた。

 当面の間、企業のデータ量増加ペースが鈍ることはないように思われる。また、コンプライアンスや事業継続といった新たなデータ管理の要求が弱まることはないだろうし、人件費をはじめとしてコストダウンの要求がやむこともないだろう。そういった厳しい要求に直面しておられる読者諸氏に、少しでもこの連載記事が参考になれば幸いである。

3/3
 

Index
アプリ対応で進化したバックアップ技術を使う
  Page1
OSのバックアップにおける進化
  Page2
Exchange Serverデータの個別アイテムのリストア
仮想サーバのバックアップ
Page3
「アーカイブ」の意味の変化
暗号化ニーズにどう対応するか


Server & Storage フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Server & Storage 記事ランキング

本日 月間