AWSコストの妥当性を「説明」できるようにする、クックパッドのインフラコスト管理術:内製アプリでクラウドリソースを効率的に調達
大規模サービスを展開する国内ITベンダー6社による「6社合同SRE勉強会」が2022年3月12日に開催された。主催社の1社であるクックパッドは「AWSコストを可視化して『説明』できるようにするための取り組み」と題したセッションで、大規模にAWSを利用する際に避けて通れない「コストの管理、監視」を効果的に実施するための工夫を複数紹介した。
LINE、メルカリ、クックパッド、ディー・エヌ・エー(DeNA)、サイバーエージェント、リクルートの6社は、2022年3月12日に「6社合同SRE勉強会」をオンラインで開催した。同勉強会では、各社でサービス運用に関わるエンジニアが、自社でのSRE(サイト信頼性エンジニアリング)に関連した取り組みを紹介すると同時に、他の企業のエンジニアとの質疑応答を通じて知見が共有された。
WebでITサービスを展開するいわゆるWeb系企業は、パブリッククラウドを標準的なITインフラとして、大規模に活用している。サービスを生みだすためのコンピューティングリソースを、必要な時に、必要な規模で、即時に調達できることがパブリッククラウドの大きなメリットだ。一方で、利用規模が大きくなるほど、組織全体でクラウドにどの程度のコストをかけているのかを把握したり、その増減を適切に管理したりすることの難易度は増していく。
クックパッドのSREチームに所属するmozamimy氏は「AWSコストを可視化して『説明』できるようにするための取り組み」と題したセッションで、自身が取り組んだAWSコスト適正化のための施策と、その実施を効率化するために内製したシステムを紹介した。
クラウドのコスト管理は「投資最適化」の大切な要素
セッションのタイトルである「AWSコストを『説明』できるようにする」という表現は、「なるべく高い精度でコストを予測し、適切に管理してムダづかいをなくしていくことを目指す取り組み」を指しているという。
「お金は、組織やそれを構成する人間が、目標を達成するための原動力となるもの。できる限りムダをなくし、必要な部分へ適切に投入していきたい。クックパッドで主に利用しているAWS(Amazon Web Services)をはじめ、パブリッククラウドのコストは『かけた分だけリターンがある』という性質のものではない。気軽にリソースを調達できる一方で、気付いたら大きなムダが発生していたという事態も起こりがちになる。パブリッククラウドを効果的に活用するために、自社の状況に合わせたコスト管理、最適化の仕組み作りは大きなポイントだと考えている」(mozamimy氏)
mozamimy氏は、2019年前後から、クックパッドにおける全社規模でのAWSコストの可視化、最適化、管理手法の標準化に取り組んできた。この取り組み以前において、AWSのコストは、主にインフラチームのリーダーが中心となってスプレッドシートで管理しており、知見の属人化も課題になっていたという。
mozamimy氏は、コスト管理手法の標準化を進めるに当たって「予算案の作成に苦労しない環境づくり」を軸とした仕組みの構築を目指したという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「あけおめLINE」による過負荷障害をどう防ぐ? LINE SREが語る“安定稼働”の裏側
2022年3月12日、大規模サービスを展開する国内IT企業6社が「6社合同SRE勉強会」をオンラインで開催した。LINEでSREを務める加藤俊弥氏は大量アクセスが発生する「元日」に過負荷による障害を起こさないため、SREとして取り組んだ「準備」「検知」「対処」を紹介した。「失敗を経験して改善することが大切」――3つのハードルを乗り越えたデンソーがクラウドネイティブに感じた「価値」
クラウドを活用した新しいサービスを外注ではなく内製で開発する――容易ではない組織風土の変革を実現してきたのがデンソーだ。アジャイルやクラウドネイティブ技術を活用するに当たって超えてきた失敗や、クラウドネイティブに感じる「価値」を同社クラウドサービス開発部SREチームの佐藤義永氏が語った。ミクシィのSREがセキュリティに貢献する理由
サイトの信頼性向上のためにSREの導入が進んでいる。ではSREを導入した企業では具体的にどのようなことに取り組んでいるのか。2020年1月に開催された「SRE NEXT 2020」でミクシィの清水勲氏が語った。