事業継続/災害対策、結局何をすべきなのか――富士通の回答
「データ管理のお悩み解決コーナー 〜事業継続/災害対策編〜」では、前編と後編の2回に分けて、@IT編集部が事業継続対策(IT関連)および災害対策につき、検討の際の指針としてのヒントを提示している。これはベンダ中立的な立場で、一般的に十分認識されていないと思われる重要な点を述べたものだ。では、実際に製品やサービスを提供している富士通のような企業はどう考えているのか。富士通におけるストレージ関連ソリューションのキーマンである、プラットフォーム技術本部 プロダクトソリューション技術統括部シニアディレクターの荒木純隆氏に聞いた。
事業継続/災害対策の効率を高め、コストを抑えるには
サービスレベルに適した投資をする
過剰なコストを排除するためにまず重要なことは、各システムに必要なサービスレベルを見極め、レベルに応じた施策を行うことだ、と富士通 プラットフォーム技術本部 プロダクトソリューション技術統括部シニアディレクターの荒木純隆氏はいう。富士通では、データのSLAとコストのバランスに応じてハードウェア、ソフトウェアを利用して6段階の災害対策レベルを定義している。最もクリティカルなシステムでは、遠隔地の災害対策(DR)拠点にリアルタイムでバックアップすることが必要となるが、システムの本来の要件を見極めればそこまでのサービスレベルを要求されるシステムはそれほど多くない。1日1回のバックアップで十分というシステムも多数あるはずだ。
各システムを要件に応じていくつかのサービスレベルに分類したうえで、それぞれ共通のハードウェアに統合することで、機器コストは過剰投資にならずにすむ。また、運用を統一することによって、運用コストも削減しやすくなる。日本では業務ごとに担当者や予算が別になっているケースが多く、共通ハードウェアへの統合には多少の困難があるかもしれないが、そこをブレークスルーすることによるメリットは大きい。
ストレージに関する技術はここ数年めざましい革新を遂げており、富士通でもさまざまなレベルのデータ保護を実現する製品を提供している。SANストレージ「ETERNUS DXシリーズ」ではバックアップを同期で行うか非同期で行うか選択できるし、重複排除のデ・デュープアプライアンス「ETERNUS CS800」でリモートバックアップを行うという方法もある。各サービスレベルで必要とされる要件に従ってこれらを使い分けることで、コストの最適化が可能だ。
また、「コストを下げるという意味では、回線費用は大きなポイント」だと、荒木氏は言う。ネットワーク費用はたいてい月額や年額の契約で、最大トラフィックに合わせた契約にせざるを得ない。このため、場合によってはハードウェア費用よりも回線費用の方が高いということもある。しかし、例えば1日1回の遠隔地バックアップであれば、重複排除ストレージを使えば転送データ量を減らすことができる。また、リアルタイムバックアップの場合でも、トラフィックの多い時間帯と少ない時間帯があるだろう。DXシリーズでは、ストレージ内部に大容量のバッファを持つことにより、更新データの順序を保証しながらトラフィックを平準化する仕組みを提供している。これらの方法でトラフィックの最大量を抑えれば、回線費用を下げることが可能だ。
精査・分類した結果、遠隔地リアルタイムバックアップが必要なシステムが明らかになった場合は、「経営トップの理解を得ることが重要」と荒木氏は言う。データセンターを2カ所持つというような投資は、経営トップの理解なしには進めにくい。このため、情報システム部門の担当者は、事業継続にとってどのデータがどの程度重要か、どのレベルにはどのような技術や取り組みが適しているかといったことを説明できる準備が必要になってくる。富士通では、それをサポートするようなコンサルティングも提供している。
サーバ仮想化も活用した、確実な対策とは
災害対策のためのデータ保全の考え方
システムを仕分ける場合、具体的にはどのような考え方をすればよいのだろうか。まず、災害対策を考える場合、再現できないデータは必ず保全する必要性がある。逆に、マスターとなるデータを加工してできたDWHのようなデータは、オリジナルが遠隔地に転送されているならば送る必要はない。遠隔地にあるマスターデータを使ってもう一度生成するというプロセスを、災害対策として組み込めばいいのである。「事業継続のためにはどのようなデータが遠隔地に送られていなければいけないかを精査することが、災害対策でデータ保全をどう考えるかの大きなポイント」(荒木氏)だ。
クリティカルなシステムには、とにかく安全第一で即座に完全復旧できる仕組みが必要だろう。例えば、物流のPOSでセンターシステムが被災しDRサイトに切り替わった場合、店舗のPOS端末から最新のデータを再送信して完全な状態に戻すような仕組みのように、業務形態に合わせた復旧ソリューションが必要となる。一方、それほどクリティカルでないなら、テープで行っていた1日1回の定時バックアップを、CS800のような重複排除ストレージに入れ換えてリモートバックアップに変更するだけでも効果がある。
ただし、災害対策や事業継続は単純にサーバやストレージが止まらずに動き続けるというだけではなく、業務のあり方と密接に関係している。つまり、ある種のハードウェアを導入すれば全ての問題が解決するということではなく、むしろシステムの運用設計が鍵を握る。「富士通は長年、社会システムを手がけていた設計ノウハウの蓄積があり、ネットワークの専門チームもいる。また、ネットワークサービスを提供する部門もある。そういった総合力で、課題解決の手段を提供している」と荒木氏は言う。
サーバ仮想化環境とBCP/DR
昨今、サーバ仮想化は珍しいことではなくなった。部門ごとに部分的に導入というケースだけでなく、全社的に仮想化基盤を利用しているという企業も現れた。サーバを仮想化するとポータビリティがよくなるので、BCP/DRにとって便利な環境であることは間違いない。例えば、リアルタイムバックアップの領域では、ストレージの機能を使って遠隔地にミラーリングし、ヴイエムウェアのVMware vCenter Site Recovery Manager(SRM)と組み合わせるといった手法が考えられる。富士通では、それに対応してSRMと連携するSRA(Storage Replication Adapter)というモジュールも提供している。
とはいえ、バックアップのことを考えると、現状では何でも仮想化してよいというわけではないと荒木氏はいう。というのは、バックアップの仕組みやOSとハイパーバイザとの組み合わせで、仮想化ベンダがデータの整合性を保証していないケースがあるからだ。現実問題としては、バックアップシステムの運用設計には幅広い知識が必要であり富士通ではこれらの知見をまとめSEの設計を容易にしている。
それとは別に、災害対策用のバックアップサイトを仮想化環境で持つというアプローチもある。これは、コスト面でメリットが大きい。例えば、A拠点とB拠点(データセンター事業者の場合にはA社とB社でもよい)のシステムのバックアップをXデータセンターに置く場合、そこに2拠点分のリソースを100%プラス100%で準備しておく必要はない。両方の拠点で同時に災害に見舞われるということは考えにくいからだ。これは、メインフレームの世界で富士通が従来から行っていた手法だ。
あるいは、1拠点のバックアップであったとしても、全く同様のリソースを用意しておかなくてもよい。いつまでにシステムを復旧させるか(RTO)やどのレベルで運用を継続させるか(RLO)に従って、重要度の高いシステムにはリソースを多く、そうでないシステムには少なく配分すればいいのである。そのようにして縮退稼働をしつつ、徐々にリソースを追加していく、あるいは本番サイトの復旧を待つという手がある。
ちなみに、富士通が提供しているダイナミックリソース管理ソフトウェア「ServerView Resource Orchestrator」には、DRオプションがある。運用サイトの状態(定義)を待機サイトに展開し、継続運用することができるというものだ。災害対策が必要な領域については、自動的に遠隔地側の環境が生成される仕組みになっている。
また、バックアップ用のサイトとしてデータセンター事業者などの仮想化基盤サービスを利用するという手法は、これからますます広がるだろう。特に中堅・中小の企業では、災害対策のためにデータセンターを2カ所持つというのはまず考えられない。また、自治体などの場合には、地震対策のためにはその市区町村の外にバックアップサイトがなければ意味がない。富士通では自治体のITシステムを手がけているが、災害対策用には富士通のデータセンターサービスが利用されている。大規模災害の場合、自治体として罹災証明をいかに早く発行できるかが住民の被災後の生活立て直しに重要であるとの認識が再確認された。
要件に応じた技術を選択可能
BCP/DRにおける富士通のアドバンテージの1つは、さまざまなバックアップ方式やほとんどの主要バックアップソフトウェアに対応しているため、従来の運用をできるだけ変えたくないという管理者のニーズに応えることができるという点だ。
バックグラウンド・コピー方式のOPC(One Point Copy)と、更新差分のみをコピーするQuickOPC、コピー・オン・ライト方式のSnapOPC+、二重化切り離し方式EC(Equivalent Copy)/REC(Remote Equivalent Copy)といった様々なコピー方式を提供する「ETERNUS SF AdvancedCopy Manager」は、エントリからハイエンドまでETERNUS DXシリーズのどの機種でもすべて共通で使用でき、きめ細かな設計が可能だ。また、物理と仮想の統合バックアップが可能なだけでなく、テープへの二次コピーを一括管理できる仕組みも提供しており、バックアップデータがディスク上かテープかを意識せずに運用できる。その他、Oracleデータベース向けのバックアップソフトウェア「ETERNUS SF Recovery Manager for Oracle」では、ハードウェアのバックアップ機能と連携して、完全なバックアップセットの取得と容易なリカバリの仕組みを提供する。
もう1つは、さまざまなノウハウや技術をベースに総合的なコンサルティングを提供できる点だ。富士通には、災害対策の仕組みをどう設計するかについての社内SE向けの専門サイトもある。そこには、センター切り替え時のネットワークの仕組みやストレージの機能、ソフトウェアの機能、サービスレベルごとの方式など、過去の知見がまとめられている。
BCP/DRについては、企業規模が小さくなるほど必要ないと考えがちだ。しかし、事業継続の取り組みをしていることが取引条件になっている業界もある。今年5月にはISO 22301が決まり、その認証取得する企業も増えるだろう。ここにはITシステムについては具体的に書かれていないが、実際の事業を継続することと、それに紐付いたITシステムの運用とはほぼイコールである。今後は企業規模を問わずBCP/DRの必要性が認知されることになるだろう。そのためには、「企業トップが理解することが重要だ」というのが、荒木氏の意見だ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- @IT Special PR:変わるITインフラとストレージ: 富士通にお手伝いできること
- @IT Special PR:IDCジャパン アナリスト 森山正秋氏×富士通 ストレージシステム事業部長 有川保仁氏 震災で変わる情報管理ニーズストレージはどう応えるか
- @IT Special PR:富士通のキーマンに聞く プライベートクラウドをお題目だけで終わらせない方法は
関連リンク
提供:富士通株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2012年12月19日