SLAに関する7つの誤解とは、Uptime.comが解説:ダウンタイムはゼロにはならない
Uptime.comは、SLAに関する誤解がDevOps業務に悪影響を与える場合があると公式ブログで指摘した。SLAについて、7つの一般的な誤解を取り上げ、どこが間違っているのかを解説した。
Webサイトのアップタイムやパフォーマンスを向上させるソリューションを提供するUptime.comは、2021年2月19日(米国時間)に公式ブログで、SLA(サービスレベル契約)に関する誤解について解説した。SLAについて誤った考えを抱いていると、DevOps業務に悪影響を与える場合があるという。DevOps担当者向けに7つの一般的な誤解を取り上げ、どこが間違っているのかを解説した。
誤解1 1つの開発言語を使うべきだ
DevOpsを適切に進めるには、複数のツールが必要だ。作業に応じて適切なツールを使う必要があり、使用する言語を1つに絞るべきではない。
PythonやJavaScriptは多種多様な目的に使えるが、決して唯一の選択肢ではない。
誤解2 100%のアップタイムは達成可能で、持続可能でもある
この誤解は、今回取り上げた中で最も有害な誤解だろう。この誤解のせいで、非現実的なSLAを達成できずに仕事を失ったり、企業として訴えられたり、ユーザーが不満を抱いたりするからだ。
100%のアップタイムは達成不能、持続不能だ。SLAで規定すべき目標基準については、2つのシンプルな原則がある。この原則に基づいて自社に適した内容を検討しなければならない。
- SLAの義務としてアップタイムを決定するには、サービスレベル指標が必要になる
- SLAでは義務を定義する。同時にエラー予算(許容可能なダウンタイム時間)も定めなければならない
誤解3 システムのアップタイムは、サービスの可用性と同じである
管理画面のステータスページでは、全てが問題なく稼働していると表示されていても、ユーザーからはそうではないと否定される場合がある。これは、サービスの可用性に注意を払っていないのが原因だ。
顧客と接点があるシステムが最も重要だ。SLA通りに99.99999999%のアップタイムを実現したとしても、Webサイトにアクセスできなければ、顧客はアップタイムのレベルなど気に掛けない。
まずはインフラやネットワーク、サービスについて知識を深める必要がある。何が分からないのかが分かっていない状態だからだ。モニタリングだけではこの問題の解決にはならない。障害が発生して初めて、そもそも何が問題なのか気付く場合もある。エラー予算を確保しておけば、障害や見落としを学習につなげることができる。
顧客と接点があるシステムの接続が切れたら、早急に接続を回復するよう努めることが、評価の決定的な悪化を避けるために有効だ。
誤解4 クラウドなら任せきりにできる
クラウドコンピューティングは営業担当者の宣伝文句の通り、安全性が高く、柔軟に運用できるかもしれない。だが、大規模なクラウドプロバイダーは攻撃の対象となる領域も大きく、問題が発生した場合の影響も少なくない。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- プロが教える、クラウドインフラのトラブルシューティング「4つの原則」とは
クラウドインフラはオンプレミス環境と比べて複雑になりがちで、トラブルの原因特定に時間がかかることが多い。では、どういった点に注意してトラブルに対応していけばいいのか。 - 受験勉強に学ぶ、デジタル時代のSLAのあるべき姿〜「とにかくシステムを止めるな!」にうまく対抗する方法〜
今回は、IT部門が同じ企業内のビジネス部門と、SLA(サービスレベルアグリーメント)を通じてより良い関係を築くにはどうしたら良いか? 特に上級マネジャーにどう対峙したら良いか? を一緒に考えてみたい。 - Uptime.com、2020年上半期のWebサーバダウンタイムレポートを発表
Uptime.comは、2020年上半期に世界6000以上の主要Webサイトで発生した障害やダウンタイムの状況などを業種別にまとめたレポートを発表した。