混在環境の運用管理、絶対に外せない「5つの機能」とは：特集：クラウド／OSS時代の「業務を止めない」運用ノウハウ（3）（1/2 ページ）

混在環境の運用管理上の課題をどう解決するか？クラウド／OSS時代の運用効率化に必要な機能とアプローチを徹底解説する。

» 2016年04月20日 05時00分公開

[高橋和也,TIS]

混在環境が引き起こす運用上の課題

　前回「運用管理担当者を悩ませる「混在環境、6つの傾向」と対策」では、混在環境が引き起こす課題として以下の6点を挙げた。

混在環境の運用管理「6つの課題」

混在する環境･製品ごとに異なる運用手順のメンテナンスコスト増大
障害箇所切り分けの複雑化
構成変更に対する迅速な対応
変動する利用料金の管理
管理するアカウント数やアクセスコントロール設定の増加
担当者に要求される知識の拡大と属人化

　どれも一朝一夕に解決できる課題ではないが、何もせずに現状のまま放置するわけにはいかない。しかし現在の運用業務に追われている状況では、いろいろと試行錯誤しようにも、時間の確保が難しい場合も多いだろう。運用改善につながりそうな有望な製品を見つけても、問い合わせの手間や導入までの工数、初期費用などを考えて二の足を踏んでいる場合もあるかもしれない。

　そこで本稿では、システム的な対応が難しい6以外の課題に対して、どのような対応方法が考えられるかを整理し、試用が比較的容易なOSSやクラウドサービスの例を交えて紹介する。

混在環境には「製品や環境を横断して監視する仕組み」が必要

　物理・仮想、オンプレミス・クラウドなど、さまざまな環境が混在する環境では、運用手順も環境ごとに大きく変わってくる。また、そこに介在する製品も多様になりがちである。こうした環境においては、運用手順自体をそろえることは難しいが、その中でもまだ比較的そろえやすいのは、監視やログ収集などの運用系のシステムだと思われる。

　動的な構成変更を頻繁に行うようになると、それに合わせて監視基盤なども監視対象を更新する必要に迫られる。こうした処理を自動化しようと思った場合に、監視基盤の製品がシステムごとに異なる状態だと、製品ごとに個別対応が必要になるため、保守の手間が増大する。また、こうしたデータが集まる基盤が統一されていれば、将来的に収集したデータを分析に役立てることになった場合にも対応が容易になる。

　たいていの監視製品では、サーバやその上で動作するソフトウェアについては、エージェントを導入することで環境を問わず同様に監視できることが多いため、基本的には運用部門が習熟している製品を選んでも大きな問題はないと思われる。一方で、監視製品によっては、さまざまなクラウド基盤や仮想基盤と連携してリソースの変動に自動的に追従して監視を開始するなど、混在環境の管理をより楽にする機能を備えているものもある。

　例えばOSSの監視製品である「Zabbix」では、「VMware vCenter」と連携してハイパーバイザ上の仮想マシンを自動的に監視登録する機能を備えている。またZabbixの機能を一部拡張し、「Amazon EC2」上の仮想マシンも自動的に監視登録することができる「HyClops for Zabbix」というツールもOSSとして公開されている。同じくOSSの監視製品である「Hinemos」では、「AWS（Amazon Web Services）」「Microsoft Azure」、VMwareなどの環境を、監視だけではなく運用まで含めて一元管理するためのクラウド仮想化オプションが別途提供されている。

参考リンク：初めての運用管理者が知っておきたい監視・ジョブ管理向けOSS構成例4つの比較まとめ（＠IT）

　こうした機能をうまく活用できれば運用負荷の軽減にもつながる。混在するさまざまな環境における構成変更への対応を負担に感じているのであれば、さまざまなクラウドや仮想基盤への連携機能を持つ製品も候補の1つとして考えてみるとよいだろう。

分散した環境では、ログの集中管理と分析がキモに

　従来もログの集約やバックアップといった運用は行われてきたが、システムの規模や数が拡大している現在、全てのログを人が定期的に確認するのは困難である。そのため普段は重要な項目だけログ監視をしておき、実際のログは障害などが起こった際にのみ目を通すことが多い。しかし普段からログの傾向を把握していないと、障害発生時に迅速にログから原因を読み取ることは難しい。またログの中には障害対応以外にも有用な情報が埋もれていることもある。

　そうしたログやその他各種データを可視化・分析するための基盤として、「Splunk」や「Elastic Stack」といった、検索エンジンを母体とする製品が注目されている。これらの製品ではログなどのデータを集約して必要な情報を素早く検索できるようにするだけではなく、集約したデータに対してユーザが自由に集計や可視化を行うことができる。クラウドサービスとしての提供も行われているため、小さく始めることも可能である。

　ログの集約だけであれば古くから使われているsyslogを用いても可能だが、混在した環境において迅速な異常検知、原因追求を行うためには、集約したログの分析・可視化も含めた機能が必要だ。「これまでログは障害や問題発生時にしか目を通していなかった」という場合も、こうした製品を使ってデータを収集し、普段からその傾向を可視化しておくことができれば、迅速な障害切り分けや改善点の発見などに役立つだろう。

構成変更を検知し運用系も自動的に追従

　　　　　　 1|2 次のページへ

SpecialPR