検索
特集

クラウドは便利、でもエンジニアの学ぶ機会が減ってしまった――クラウド技術が運用者にもたらした功罪とは特集:「惰性をやめる、慣習を疑う」こんどこそ楽になる運用管理(7)

運用者目線で見たクラウド技術のメリット、デメリット、今後求められる運用者像とは何か。オンラインイベント「Cloud Operator Days Tokyo 2021」で行われたパネルディスカッション「クラウド技術、自動化技術が基盤“運用者”にもたらした効果と功罪」、その内容の一部を紹介する。

Share
Tweet
LINE
Hatena

 2021年8月27日に開催されたオンラインイベント「Cloud Operator Days Tokyo 2021」では、「クラウド技術、自動化技術が基盤“運用者”にもたらした効果と功罪」と題したパネルディスカッションが行われた。トークテーマは「クラウド、自動化技術の運用者視点での効果」「運用者に残した功罪とは何か」「今後の運用者像」の3つ。モデレーターを務めたのは日本電信電話(以下、NTT)の水野伸太郎氏だ。


NTTの水野氏(左)、トヨタの伊藤氏(左上)、LINEの室井氏(右上)、レッドハットの伊藤氏(左下)、ヤフーの奥村氏(右下)

 本稿ではパネルディスカッションの内容の一部を紹介する。パネリストは以下の通り。

  • 伊藤雅典氏(トヨタ コネクティッド先行開発部 主査)
  • 室井雅仁氏(LINE Senior Software Engineer)
  • 奥村司氏(ヤフー クラウドプラットフォーム本部技術1部 リーダー)
  • 伊藤拓矢氏(レッドハット クラウドソリューションアーキテクト部 スペシャリストソリューションアーキテクト)

クラウド技術、自動化技術の運用者目線での効果とは

水野伸太郎氏(以下、水野氏) 基本的にクラウド技術というものは、開発者が迅速にサービスを開発して提供するための機能として提供されています。一方で、運用者には、どういう良い側面があるのでしょうか? 開発者と運用者の連携がどういう形でうまく回るようになったのでしょうか? こちらを聞いていきたいと思います。

奥村司氏(以下、奥村氏) 開発者に、クラウド時代に準じた標準化意識が芽生えたのが一番大きなところ。マイクロサービス化っていうのも大きなところで、「こういうことをやりたいなら、こういう構成だよね」という共通認識をエンジニア全体で持てたのがクラウド技術のもたらしたものの一つなのかなと思っています。

 クラウド化するとき、どうしても「今のまま、今の構成を保ったまま仮想化すればいいや」と思っているユーザー(クラウド利用者)もいるので、そういう人に対しての啓発は多少なりとも必要です。後は、自分たちがコントロールできない障害を見据えたシステムを構築するノウハウがユーザーに蓄積されたのも、クラウド技術がもたらしたものだと思います。

水野氏 ユーザーつまり、アプリケーション開発者にも「クラウドネイティブな基盤を想定したつくりにする」など、意識の変革があったということですね。LINEの室井さんはいかがでしょうか。

室井雅仁氏(以下、室井氏) ハードウェアから見たときのアプリケーションレイヤーに、(開発者、運用者の間で)同一のものができて、コミュニケーションを取るとき共通の単語が出来上がっている、というのが一番の良いところと感じています。

 例えば、従来「このサイズのスペックのサーバが欲しいです」「じゃあサーバを1台買いましょう、あなたのサービスにはこのサーバです」といったやりとりをしていたのが、「『OpenStack』でこういうフレーバー(仮想ハードウェアのテンプレート)が欲しいと思ったとき、それをどう解決しようか」といった感じで、OpenStackというレイヤーで吸収できるようになりました。

水野氏 次はトヨタの伊藤さん、いかがでしょうか。

伊藤雅典氏(以下、トヨタ 伊藤氏) 「オンプレミスで運用していた頃と比べるとトラブルが減り、本来やらないといけない業務ロジックに集中できてうれしい」という声が多いですね。後は、ピーク時と比べて運用コストを半分くらいに削減できました。そんな良い側面があります。

水野氏 ありがとうございます。レッドハットの伊藤さん、クラウドってこんなに世の中を良くしたとか、こんなに提供しやすくなったとか、提供側としてのメリットがあれば教えてください。

伊藤拓矢氏(以下、レッドハット 伊藤氏) クラウド技術の効果としては、従来の仕事のやり方やチーム編成など、変える契機がなかなかなかったものを、変えるきっかけになったと思います。

 インフラのレイヤーに対して、CI/CD(継続的インテグレーション/継続的デリバリー)やテスト自動化など、もともとソフトウェアにあったものをハードウェアのレイヤーに導入できるようになりました。以前は人間の手で配線を変えたり、ネットワーク機器を確認したりして障害対応するなど、個々のチームがそれぞれ連携する必要がありましたが、クラウド基盤を導入すると、それをオンデマンドでコントロールできるようになります。チーム編成や工数の積み方、仕事のやり方を変える契機になったのが一番大きな効果だと思います。

クラウド技術が運用者に落とした影――学ぶ機会が失われている?

水野氏 それでは逆にクラウドがもたらした功罪の、特にデメリットについて事例などがあればぜひ伺いたいと思います。「クラウドを使用するためにこれまでの仕組みをすっかり変えなければいけない」「アプリケーション開発は楽になったが、運用者はすごく大変になって回らなくなった」といったことがあるのではないでしょうか。

トヨタ 伊藤氏 クラウドを使うことで、本来やらないといけないことに集中できるのは良いことですが、「クラウドのサービスが物理的にどういうものの上で動いているのか」といったスケーラビリティに関する理解が薄くなっていると思います。

 極端な話「AWSのこのサービスとこのサービスをくっ付けると新しいサービスができちゃうじゃん」と、そのくらい簡単に開発ができるようになりました。何が起きるかというと、その背景にある構造に想像が至らないために「実は非効率なシステムになっている」ということに気付いたり、処理量が10倍、100倍に増えていった場合にちゃんとスケールするのかどうかの見通しを立てたりすることが困難になっていると感じています。そこがあまり指摘されないデメリットの一つだと思います。

水野氏 開発者にとってクラウドの便利なツールがあって、あまり下回りを意識しなくても新しいサービスを作ることができる半面、トラブルがあったり、性能を求めようとしたりした場合は、開発者もちゃんと理解した上で使わないとうまく性能が出ず、かえって無駄が多くなってしまうのですね。他の皆さんはいかがでしょうか。

奥村氏 クラウドのフルマネージドサービスの普及に伴って、開発者としては楽になったのは間違いありませんが、学ぶ機会が失われていると思います。(エンジニアには)障害が起きたときに、そこを調べてみて初めて、その分野に詳しくなっていくという学びのステップがあると思うんです。そういったものがフルマネージドサービスで奪われてしまって、「後は報告を待っていればいい」というような姿勢ができてしまったのは、デメリットという面では大きいのではないでしょうか。

 ひどい例になると、自分が担当している範囲しか分からない人がいます。一昔前のエンジニアですと、MySQLが分からない人は珍しかったと思いますが、今の時代は普通にそういう人がいたり、DNSが分からなかったりします。そういう人がいると、やはり学ぶ機会が失われているのを体感しますね。

水野氏 ユーザーはあくまでもクラウドのAPIのユーザー(という認識)であって、クラウドの中はブラックボックスという形で運用しているのでしょうか。LINEの室井さんはいかがですか?

室井氏 学ぶ機会を失っているのは結構感じています。普段使う分には本当に問題ないのですが、例えば、全体的なインテグレーションをした際、アプリケーション側でミスマッチが起こった、という場合にもう少し深掘りしていくタイミングが今までより少なくなっていて、エンジニアとして成長するタイミングが減っているんじゃないかなと感じます。

水野氏 クラウドは、「詳しいところを知らなくてもちゃんと運用できます」というのが売りだと思うのですが、知らないと困ってしまうのはどういうシチュエーションでしょうか? 知らなくてもいい場面も多いのでは、という気もします。

室井氏 サービスを作って運用しているときは問題ありません。一番問題だと感じるのは、トヨタの伊藤さんがおっしゃったように、スケールアウトしたり、スケールが上がったりする場合に「どこがボトルネックになっているか」を調査するといった種類のトラブルシューティングが難しく、時間がかかるようになっていると感じています。

水野氏 フルスタックで理解するのは難しいことだと思います。「運用者が何でもかんでも知らなきゃならない」っていうのは、逆にフルスタックでの理解を押し付けられている感じにもなってきているのでしょうか。レッドハットの伊藤さんはそういう課題感を認識されていますか?

レッドハット 伊藤氏 クラウドマネージドサービスが増えてきて、それを提供する側として最近感じているのは、トラブルがあったときに中の細部までログインして調査することができないということです。結局、それってユーザー側で実運用に当たっているSRE(Site Reliability Engineering)に聞かないと解決しない問題なんです。

 SREの部隊を作るのはすごく良いと思うし、僕がユーザー側にいたときはSREの部隊で運用の部隊に来た問い合わせを全部返していたこともありました。それがどんどん進むと、使う側、ユーザー側のスキルセットが足りなくなってしまう。知らなくても業務として成立してしまうことがすごく多くなっています。そういったところに、なんとかテコ入れしないといけないと思っています。

これからの運用者には、何が必要とされるのか?

水野氏 今後の運用者には、どういったスキルが求められるのか、どう育成されるべきなのか、あるいはどうやってチームビルディングをしていくのか。スーパーマンを10人くらい高給で雇ってSREチームを作らないといけないのかどうか。人材育成、チームビルディングに関して各社の取り組みや考えをお聞かせください。奥村さんいかがですか。

奥村氏 まずは「目の前の当たり前」に疑問を持てる人、システムの運用を自分で変革できる人がこれまで以上に重要になると思います。今って、自動化とかクラウド技術の発展で(運用者が)システム全体の品質に貢献できる余地が大きくなっている。考え方によって、システム運用者はバリューをより発揮しやすくなるので、運用者にとってチャンスだと思っています。

 システムが常に変化し続ける時代なので、運用する人も変化し続けないといけない。目の前の当たり前に疑問を持って、自身で改善まで持っていこうとする姿勢が重要なのではないでしょうか。全員が全員SREにならなくてよくて、一人一人に疑問を持つような意識を持ってもらうのが重要なのかなと感じています。

 トラブルが起きたときになぜそれが起きたか、どうすればそれが防げたかを考えてもらい、改善まで1人で一気通貫してそのプロセスをやってもらうと「こういうふうにして改善を続けていけばいいんだ」と理解してもらえると思います。特に(自分のチームで)新しく入ってきた人には、そういったプロセスを全て踏んでもらうことを重視しています。

水野氏 何かトラブルが起こってもいいからまずはそれを体験させる、それが経験につながるということですね。LINEではいかがですか?

室井氏 全体的に「運用をする」じゃなくて、「運用を開発する」という方向に変わってきているのではないでしょうか。CI/CDやクラウド技術のデリバリーが早くなって、今までの「設計」「開発」「運用」というくくりが曖昧になっています。運用者も開発、開発者も運用、という世界観になってきているのかなと。

水野氏 コードという観点で運用をマニュアルじゃない方法でしっかり構築できる、こういった(ものを備えている)のが求められる人材像、という感じですかね。

トヨタ 伊藤氏 ITリテラシーの基本を勉強し直すのは本当に大事で、スーパーマンはいた方がいいんですけど、全般の底上げにももうちょっと気を遣う方がいいんじゃないかと思う次第です。

 70数年前からトヨタで実施されている、「トヨタ プロダクションシステム(トヨタ生産方式)」と呼ばれているフィロソフィー的なものがあるのですが、それとアジャイルって実は突き合わせるとちょっと共通点があるんです。自分たちの工場でできていることがなぜIT現場でできないのか、というのを時々問われることがあります。

水野氏 それは非常に面白いですね。トヨタイズムをITの現場にもちこんでクラウド運用に適用できるのか、ぜひまた(次回のイベントで)お話を伺いたいです。

特集:「惰性をやめる、慣習を疑う」こんどこそ楽になる運用管理

ITがビジネスを加速させる昨今、多くの新規サービスが開発、リリースされ、運用管理者には安定したサービスの供給や、利用動向のログの解析などが求められている。だが、これに伴い解析すべきログや拾うべきアラートも増す一方となり、多大な負担が運用管理者の身に振り掛かっている。また、新規サービス開発でのクラウド活用、基幹システムのクラウド移行が進み、可用性や柔軟性といったクラウドならではの特性を生かす、いわゆるクラウドネイティブなアプリケーションの運用が増え、コンテナやマイクロサービスといった複雑な運用管理も求められている。しかも、オンプレミスに残さざるを得ないサーバとのハイブリッドな運用も並行しなければならない。このような中、従来の手法や技術では、とうてい運用管理業務が回らず、ビジネスに貢献することができないのが実情だ。現状を打破するためには、従来の慣習を疑い、新しい技術や自動化、AI(人工知能)などを取り入れ、現状に合った新たな運用管理の手法を実践することが大前提となる――本特集では、運用管理の最新技術や使いこなし方を徹底的に深掘りする。



Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る