検索
連載

NTT東日本が明かす、未経験者も使うクラウド技術者育成用AWSハンズオン環境のコスト管理ポイント特集:「惰性をやめる、慣習を疑う」こんどこそ楽になる運用管理(3)

社内でのクラウド活用が加速する他、DX案件の中でクラウドサービスを利用するケースが増えるNTT東日本。クラウド技術者の育成が急務となり、育成の場として選ばれたのはAWS上に構築されたハンズオン環境だった。しかし、従量課金モデルの場合、管理を少しでも怠れば、高額な料金が請求されるリスクがある――運用管理者に光を当てるオンラインイベント「Cloud Operator Days Tokyo 2021」の同社による講演では、AWS活用におけるコスト管理のポイントが明かされた。

Share
Tweet
LINE
Hatena

クラウド技術者育成向けハンズオン環境の課題はコスト管理


東日本電信電話 Associateの田口裕真氏

 Amazon Web Services(AWS)をはじめとするクラウドの活用において重要なのは、「いかに技術の進化スピードに合わせて継続的に学習できるか」だ。

 東日本電信電話(以下、NTT東日本)では、クラウドの活用がますます加速している。2016年にクラウド技術のノウハウを集約する先端組織を設置。外部に委託していたAWSの運用を内製化して知見の集積を図った。また、社内のデジタルトランスフォーメーション(DX)活動支援組織、いわゆる「Cloud Center of Excellence(CCOE)」も設置。2020年には社内のDX活用相談件数が前年比6倍になり、その大半のシステムやツールでクラウドが活用されている。

 そうした中で課題となったのは、クラウドの開発者や運用者の育成だ。特にAWSに絞った場合、技術者のスキルアップ方法は大きく3つ挙げられる。

 1つ目は、AWS認定トレーニングやウェビナーなどを活用する方法。2つ目は、AWS主催イベント「AWS Summit」「AWS re:Invent」「AWS Innovate」などに参加し、最新のリリースや機能の情報を取集した上で、社内の勉強会やイベントなどでアウトプットして知識を定着させる方法。3つ目は、手を動かして確認する方法だ。

 特に一番効果的なのは、3つ目のハンズオン学習方法だ。新しくリリースされたサービスをいち早く扱い、「どのようなメッセージが表示されるのか」「画面がどのように変わったのか」といったところを含めて検証し、自らの経験値に変えることができる。

 もっとも、検証環境を準備するにも、当然コストがかかる。

 「Cloud Operator Days Tokyo 2021」の講演「不要リソース削減漏れ通知システムによるコスト削減」で、NTT東日本 Associateの田口裕真氏は管理者がクラウド関連で抱える悩みの“あるある”を3つ挙げた。

  • 年間の予算枠にコストが収まるのかどうか
  • 突然の高額な請求が発生しないかどうか
  • 不要なコストが発生していないかどうか

クラウド関連の予算管理者のよくある悩み(田口氏の講演資料から引用)

 まず不安要素の一つとして、「検証環境という性質上、従量課金での利用となり、かつ検証目的で利用状況が変動することから、コストの予測がしづらい」という課題がある。

 「うっかり無料の利用枠を超えて利用してしまった」「不正アクセスやプログラムで想定外のリクエストが集中して請求額が予期せず加算されてしまった」といった理由から、非常に高額な請求が発生する可能性もあるだろう。

 「土日夜間などに不要なリソースが稼働しっぱなしだった」「削除漏れのリソースがあった」などが原因で、いらぬコストを支払ってしまうリスクも懸念される。

 最初の2つの不安要素については、AWSが用意している「My請求ダッシュボード」内の「AWS Budgets」機能とコスト異常検出機能で、「ある程度は管理できる」と田口氏。予算の範囲に応じて請求アラートを設定すれば、いちいち見にいかずともアラート通知で即時対応できる。また、コスト変動の幅を閾(しきい)値として設定し、超えた場合は通知するなども可能だ。つまり、管理者で対策ができる。

 問題は、3つ目だ。この対策には、利用者の協力が必要だ。

 そこで同社は、不要なコストを発生させない仕組みやユーザー向けルールを開発することにした。

強制的に取り締まらず、利便性を損なわず、無駄遣いをさせない仕組みやルール

 ルールや仕組み作りにおいて、田口氏たちは「利用者自身がルールを守って自主的に棚卸しする方法」を選択した。

 「『AWS Identity and Access Management』(IAM)の権限を制御する」「サービスコントロールポリシーでサービスを使えなくする」など、権限に基づき強制的に機能をオフにする方法もあった。確かに強制的に取り締まる方が、確実な効果が期待できるが、利便性は損なわれるだろう。また、今回の管理対象は検証環境であり、機能面などで制限をかけると検証作業自体に影響が出かねない。

 検討の末、田口氏たちは3つの対策を講じた。

  • AWSの検証アカウント利用ルールを策定する
  • 不要リソース削除漏れ通知システムで管理する
  • リソースの棚卸しに有用なサービスを利用する

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る