新たな技術が支援する効率的で 低コストなバックアップ術 もう悩まない? 「バックアップ」の誤解を解く |
データの損失は許されないが、「時間がかかる」「お金がかかる」……管理者にとってバックアップは、常に身近にあり、頭を悩ませ続ける課題だった。バックアップにまつわるそんな「神話」を打破し、確実に、効率的に、そして少ないコストでデータを保護するための技術を紹介しよう。 |
身近な技術だからこそ生じる「神話」「誤解」 | ||
ディスクをはじめとするストレージ機器の価格は、数年前に比べると格段に安価になった。かつては大容量と表現された「数十GB」は、いまや普段使いのPCでも当たり前。企業全体で見れば、数十テラバイトクラスのデータが蓄積されることも珍しくない。
ここで管理者の頭を悩ませるのが、いかにバックアップを行うかということである。日々生成され、保存されるデータの量は加速度的に増大している。一方で、機器の故障や不慮の事故、あるいは操作ミスなどさまざまな要因があるが、いかなる理由にしろデータが失われてしまうという事態は、業務継続という面からも、またコンプライアンスという観点からも望ましいことではない。
そこで浮上するのがバックアップだ。しかし、身近な技術であるにもかかわらず、いやそれだからこそ、バックアップをめぐってはいろいろな「誤解」「神話」が存在している。この記事では、その神話のいくつかを挙げ、実際のところはどうなのかを紹介したい。
神話1:「RAIDを組んでいるから大丈夫」 | ||
最近ではエントリ向けサーバであっても、RAIDを組んだディスクを搭載するケースが増えてきた。RAIDには、同一のデータを複数のディスクに書き込んで信頼性を高める「RAID 1」(ミラーリング)、検証用のパリティコードを組み合わせ、データの整合性を確保するとともに複数のディスクにデータを振り分けて高速化も実現する「RAID 5」など、いくつかの方式がある。いずれも、機器自体に障害が発生してもシステムの運用を継続できることを目的とした仕組みだ。もし、どれか1つのディスクに故障が発生しても、システム自体の運用は継続できる。
【関連記事】 特集 RAIDの基礎知識−RAIDレベルを理解しよう−(System Insider) http://www.atmarkit.co.jp/fpc/special/raidglossary/index.html |
しかし、このRAIDの仕組みを導入したからといって、データそのものの保護が実現できるわけではない。
最も分かりやすい例は、操作ミスなどによってアプリケーションデータが破壊されてしまった場合への対処だ。誤って一部のファイルを消去してしまったり、システムクラッシュなどによって不適切なデータが混入した場合、RAIDではシステムの運用は継続できても、元の「あるべき姿」に戻すことは困難だ。
こうした事態に備えるには、やはり「バックアップ」を行うことが必要になる。データのコピーを取得するという目に見える処理は同じでも、RAIDとバックアップとでは目的が異なることに注意が必要だ。障害に備えてシステムの可用性を高めることを目指すRAIDと、最新の状態のデータを保持し、必要に応じて復元できるようにするバックアップとは、互いに補完し合う関係にあり、正しく使い分けることが重要である。
同じ問題は「レプリケーション」にも当てはまる。特に、遠隔地にデータを保管するリモートレプリケーションは、災害対策(ディザスタリカバリ)の観点から注目されているが、ミスなどによってデータを上書きしてしまった場合、そのミスも反映されてしまうことになる。この場合、複数のレプリケーションを取得し、世代管理を行う機能を備えた製品が出てきているので、そうした選択肢を検討することも有効だ。
神話2「バックアップもリストアも時間がかかる」 | ||
バックアップにおいては、最期にバックアップを取得してから障害が発生するまでの間の時間(RPO:Recovery Point Objective)、そして障害が発生してから復旧するまでの時間(Recovery Time Objective:RTO)をいかに短く抑えるかがキモとなる。
まず大前提となるのは、保護しようとするデータやアプリケーションの性質や重要性だ。これと投資できるコストに応じて、「テープへのバックアップ」「ディスクへのバックアップ」、あるいは「スナップショット」「クラスタリング」といった手段を選択することになる。
以前はコストの面からやむを得ず、時間のかかるテープへのバックアップを選択するケースが珍しくなかったが、最近では、ディスクへのバックアップやスナップショットも、数万円から十数万円台という低価格で導入できるようになった。これにより、RPOとバックアップ処理に要する時間を短縮することができる。
【関連記事】 いまどきのサーババックアップ戦略入門(1)(Server & Storage) http://www.atmarkit.co.jp/fserver/articles/bkupstrategy/01/01.html |
同じことが、RTOとリストアにもいえる。
「バックアップは取ってあるからこれで大丈夫」と安心していたら、いざリストアを実行する段になって、バックアップ元と同じ環境を用意しなくてはならないことに気付き、手間取ってしまった……という経験のある人はいないだろうか? システム復旧の際にはまずOSをインストールし、パッチを適用し、必要なアプリケーションをインストールしてそれからようやくバックアップデータを戻すという手順を踏む必要があるため、数時間、下手をすると1日単位の時間を費やすこともある。
そうしたケースに有効なのが、イメージバックアップ機能だ。ファイル単位ではなく、。ディスク上のデータ全体をイメージとして取得することにより、その下のOSやアプリケーションも含めてバックアップを取得する。このため、迅速に元の環境を復元することが可能だ。長時間のダウンタイムが許されない環境に有効な手法である。
特に最近は、イメージバックアップながらファイル単位での復元機能を備えたり、バックアップ元とは異なるハードウェア構成に対してリストアを行えたり、さらには仮想環境上にリストアを行える機能を備えた製品が登場しており、より柔軟性が高まっている。
神話3「確かに単価は下がったが、全体で見ると高い」 | ||
ストレージハードウェアの選択肢は幅広く、十数万円で入手できるものから数百万、数千万円もするものまでさまざまだ。インターフェイスは、おなじみのSCSIからファイバチャネル(FC)、iSCSIなど多様なうえに、データの保存に利用されるメディアも、テープからディスク、最近ではフラッシュメモリを使用したSSDなど、幅広い選択肢が用意されている。
この状況で、すべてのデータを同じ種類のストレージに格納する必要はない。頻繁に読み書きされるデータもあれば、いったんアーカイブとして保存されたら、あとは参照されるのはごくまれというデータもある。データの性質に応じて保存先を選択する仕組みを作り上げることで、コストの最適化が可能だ。
例えば、データベースならば、FCなど高速なI/Oを備えたハイエンドストレージが必要だろう。一方、メールサーバやデータ保管用のファイルサーバならば、頻繁に書き換えられることは考えにくいため、SATAを採用したよりコストパフォーマンスに優れたストレージ機器を採用する方法が考えられる。また、最近では、消費電力が少なく放熱も少ないSSDを採用し、運用コストの削減を図るストレージ機器もあり、十分検討に値するだろう。
【関連記事】 ストレージとは何か(1)(Server & Storage) http://www.atmarkit.co.jp/fserver/articles/storage/01/01.html |
もう1つ、ストレージのコスト削減に有効な技術がある。「重複排除」だ。
もともとバックアップに関しては、毎回フルバックアップを取得する代わりに、前回取得したバックアップからの増分・差分のみをバックアップすることで、最新の状態を維持しながらストレージ容量を節約する手法が取られてきた。
これを、よりきめ細かい単位で行えるようにしたのが、多くのストレージ製品が実装するようになった重複排除機能である。データの内容を細かく見たり、ハッシュ情報を比較することによって、同一の部分を排除し、異なる部分だけを保存するというもので、製品や環境にもよるが、数十分の1から数百分の1にデータを縮小できるという。この結果、バックアップに要する時間も短縮できることになる。
「仮想化」と「オンラインストレージサービス」に注目 | ||
バックアップをめぐる大きな流れとして、今後は「仮想化」や「オンラインストレージサービス」が登場してくることになるだろう。
リソースの有効活用やコスト削減といった観点でストレージの仮想化に取り組むケースが増えているが、それゆえに新しい問題が生じる可能性もある。例えば、バックアップ時間が集中することによってI/O処理の負荷が高まり、全体のパフォーマンスが落ちてしまう恐れもあるのだ。事前のサイジングとスケジュールも含めた適切な設計が欠かせないことに注意が必要だ。
【関連記事】 サーバ仮想化におけるバックアップの課題(Server & Storage) http://www.atmarkit.co.jp/fserver/articles/vmbackup/01/01.html |
また、特に中小企業を中心に、Amazon S3などのオンラインストレージサービスに対する関心も高まっている。自社でバックアップ設備を導入する場合に比べ、低価格で利用できることが魅力だ。ただ、個人・部門単位でのデータ共有には向いていても、システムそのものを支えるバックアップとして利用するには、信頼性や可用性の面で課題が残る。また、アーカイブなどの目的で、物理メディアへのバックアップを必要とするシーンも残るだろう。それでも、オンラインストレージサービスが今後有力な選択肢となることは間違いなく、適材適所で利用を検討していくことが求められる。
ソリューションFLASH Pick UP! |
||||||
|
提供:株式会社日立製作所
日本CA株式会社
株式会社シマンテック
アイティメディア営業企画
制作:@IT 編集部
掲載内容有効期限:2010年1月23日
ソリューションFLASH Pick UP!
JP1/VERITAS NetBackup、JP1/VERITAS Backup Exec
日立製作所
サーバ仮想化の広がりにつれて、その運用における新たな課題も次第に明らかになってきた。重要な課題の1つに数えられるのがバックアップだ。ではバックアップの何が問題になるのか、その解決策として何をすることができるのだろうか。
CA ARCserve Backup r12.5
日本CA
CA ARCserve Backup r12.5の重複排除(通称「デデュプ」)機能によって、バックアップデータはどこまで削減できるのか。日本CAが実施した『デデュプでストレージ使用量を大幅削減』キャンペーンには、デデュプの高い効果を示す実例が続々と寄せられた。その驚きの効果を具体的に検証しよう。
Symantec Backup Exec System Recovery 2010
シマンテック
電子メールやファイルサーバに業務を依存している中小企業は多い。自社の資産を守り、ビジネスを止めないためには、自社システムに柔軟に対応できる安価なバックアップシステムが必要だ。 (TechTargetジャパン「企業を強くするIT製品レビュー」)
ホワイトペーパーダウンロード
統合システム運用管理JP1 ストレージ管理
JP1のストレージ管理では、複雑化するITシステムに幅広く対応し、バックアップ運用の一元管理による総合的なデータ保護を実現。多様なニーズに応える豊富な機能により、仮想環境においても他の業務に負荷をかけない効率的なバックアップと柔軟なリストアで、攻めのビジネスを支えます。
CA ARCserve Backupによる「Microsoft Hyper-V仮想環境」の事業継続と惨事復旧
コスト削減仮想化技術の成熟によって仮想環境の導入企業は増加している。しかし、仮想環境上にあるデータを安全・確実に保護し、簡単に復旧する方法は確立されているか? マイクロソフト監修による注目のホワイトペーパー。