検索
連載

「ダブルチェックを頑張る」でごまかさない、スクウェア・エニックスのサーバ設定漏れ防止策たくさんのサーバを一気に構築できる“自律構築の仕組み”とは(1/3 ページ)

スクウェア・エニックスは膨大な数のゲームを提供している。当然、それらを支えるインフラも大量で、運用管理にかかる手間も大きい。「Cloud Operator Days Tokyo 2023」のセミナーを基に、大量サーバの最適な管理法を紹介する。

Share
Tweet
LINE
Hatena

 変化の激しい現在のビジネス環境において、アプリケーションやサービスもその変化に素早く対応する必要がある。もちろん、それを支えるインフラについても同様だ。クラウドサービスやIaC(Infrastructure as Code)などを活用し、効率的にインフラを管理している企業も多いだろう。

 ただ、ある意味でインフラは生き物だ。作った当初は問題なくても、管理する対象が増えたり、長期間運用していたりすると最初の方法ではうまくいかないことが増えてくる。ゲームビジネスで有名なスクウェア・エニックスにおいても、似たような課題があった。同社が提供するサービス(ゲーム)は種類も量もかなりの数で、気が付くと管理するサーバは「ちょっと手に余る台数」になっていたという。

 大量のサーバを効率的に管理するためにはどのようなアプローチが有効なのか。「Cloud Operator Days Tokyo 2023」で発表されたスクウェア・エニックスの事例から、その方法を探る。

オンラインサービスを支える数百台規模のMySQLサーバ

 スクウェア・エニックスは、オンラインサービスとして提供しているゲームの種類ごとに「HD(High Definition)ゲーム」「MMO(Massively Multiplayer Online)」「スマートフォン」という3つのインフラ(商用サービスインフラ)を管理している。

画像
スクウェア・エニックスの橋本和宏氏

 スクウェア・エニックスの橋本和宏氏(Online Service Infrastructure Group SRE<Site Reliability Engineering> クラウドエンジニア)が関わっているスマートフォン向けのバックエンドシステム(以下、バックエンドシステム)は、10年以上運用されている比較的ベテランのシステムだ。「Google Cloud」で稼働しており、フロントエンドはコンテナ化し、「GKE」(Google Kubernetes Engine)で管理している。一方バックエンドは、仮想マシン(VM)に「MySQL」「Redis」「Apache Kafka」などのデータストア系のサーバを構築しており、運用や管理に手間がかかっている状態だった。

Copyright © ITmedia, Inc. All Rights Reserved.

       | 次のページへ
ページトップに戻る