リクルートにおけるVDIの導入、運用、コロナ対応、そして今後のICT環境を紹介する連載。初回は、VDI導入の背景や“構築の成功”と“導入の失敗”の危機などについて。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
初めまして。筆者は現在、リクルートにおいてICTのインフラを担当しながら、今後のPC環境の在り方に関する中長期的な計画を立案し、導入を推進しています。2015年2月にリクルートテクノロジーズに入社し、VDI(Virtual Desktop Infrastructure、仮想デスクトップインフラ)の企画立案から構築、運用に携わってきました。
コロナ禍により、「VDI導入を検討している」「いま構築、運用している」という企業は多いと思います。VDIのメリットはたくさんあります。他方で導入、運用は大変です。VDIの“デメリット”も少なからず存在します。そこで本連載「リクルート5万人のテレワーク/VDI環境大解剖」では、リクルートにおけるVDIの導入、運用、コロナ対応、そして今後のICT環境について、4回に分けてお話しします。VDIの導入などに悩んでいる方々のお役に少しでも立てるよう、生々しい話も含めて共有したいと思います。
リクルートでVDI導入を検討したのは2015年のこと。当時は約3万台のPCが約700拠点で稼働していました。ビジネス拡大に伴い、PCの台数も拠点数も、今後ますます増えることが予想されていました。そのような中で、リクルートのICT環境には、“3つの課題”がありました。
第一に、“働き方変革への貢献”です。多様な働き方を支えるためのICT環境の変革が求められました。出先だろうが自宅だろうが、どこにいても社内と同じ環境を利用できるようなテレワークの実現が求められていたのです。
第二に、“セキュリティの向上”です。テレワークが進む中でも、より一層しっかりとしたセキュリティ対策を実装していく必要性がありました。
第三に、“PC管理コストの削減”です。当時はPCの納品対応や故障対応、そしてOSやオフィスソフト(以下、Office)のアップデートにかなりの工数がかかっていました。PC管理の仕組みが自社で作った古いもので、OSやOfficeのアップデートがリモートから完結するような仕組みになっておらず、ユーザーの手作業に依存していました。そのため、何年かに1回あるOSやOfficeのアップデートは会社の一大行事になっている状況でした。ファイルサーバも古いものが数多く存在し、故障が頻発しており、その対応にも日々追われていました。
これら3つの課題にどのように立ち向かうか。
検討した結果、解決策として行きついたのがVDIの導入です。VDIなら3つの課題を“同時に解決”できると考えました。ネットワークを介してVDIに接続さえすれば、どこにいようとも社内と同じ環境を利用できます。ユーザーの手元の端末には画面が転送されるだけで、VDIの置かれているデータセンター内にデータを閉じ込めることができるので、セキュリティ面でも高い安全性が期待できます。さらに、OSやOfficeのアップデートを含め、PCの運用はVDIサーバ側で集中的にできます。同時にファイルサーバも集約して統合管理することで、PC管理コスト面でもメリットが得られると考えました。
VDIで3つの課題を同時に解決するといっても、特に働き方変革への貢献といったような利便性追求と、セキュリティ追求の両立はなかなか難しいところがあります。またVDI構築にかかるコストにも留意しないといけません。そこで、VDI構成上2つ工夫することにしました。
まず、利便性とセキュリティの両立を図るべく、“2つのVDI”を提供することにしました。通常の業務利用で求められるレベルのセキュリティを保証しながら、より利便性を重視した「標準VDI」と、アクセス先を制限するなど強固なセキュリティを実装した「セキュアVDI」です。両VDI間のデータをセキュアにやりとりする仕組みも用意しました。これにより、通常業務時は標準VDIを使い、カスタマーの個人情報を取り扱うなどセキュリティ重視の業務時はセキュアVDIを使うといった、ユーザーの使い分けを可能にすることで、利便性とセキュリティの両立を図ることにしました。
続いて、VDI自体の仕組みも工夫しました。“フルクローン型のVDI”、すなわち、一人一人に専用のVDI環境を提供することにしたのです。この方式ならユーザーが業務に必要なソフトを個別に導入したり、制約を少なくして柔軟にVDIを活用したりと、利便性を向上させることが可能になります。
この方式は他と比べて多くのシステムリソースが必要となり、VDI基盤コストがかかるという問題がありました。しかし、データの重複排除や圧縮といった、ストレージを効率的に利用できる技術を活用することでVDI基盤コストの抑制を図れることを確認し、フルクローンの導入を決めました。
VDIの導入は“集約環境”にすることでもあります。環境を集約するからこそ、大事にしなければならないポイントがあります。それは“性能とコスト”です。「VDI基盤でストレージのパフォーマンスが出ない」といったような性能面の大きな問題が起きた場合には、どのような影響があるでしょうか。そうです、一気に数万のユーザーに影響を与えてしまうことになるのです。かといって、無尽蔵にコストを費やして性能を上げることはできません。“性能とコスト”のバランスをどのようにとるのか検討に検討を重ねました。
実は本格的なVDIの構築前に、トライアルの環境を作っていました。当初は、トライアルの環境をベースとし、それを広げていくことでVDIを構築しようと考えていたのです。しかし、性能とコストにおいてベストなバランスを追求すべく、一からVDI基盤の構成を検討し直しました。ベンダー各社に多大なるご協力を頂き、主に性能面において、時間をかけて複数製品を検証しました。「どのような製品をどのように構成すれば、コストを抑えながら性能要求をクリアできるのか」といった観点で構成を詳細に検討し、並行してコンペティションも実施しました。最終段階においては日本国内での検証にとどまらず、技術者を派遣し、製造元の米国での検証にも踏み切りました。
結果として、トライアル環境とは全く違う構成で、ベンダーの製品を組み合わせてVDI基盤を構築することになりました。設計/構築面においては手戻りになる部分も多々ありましたが、性能向上とコスト低減を追求していった結果です。
ちなみに、本番環境がトライアル環境とは全く違う構成になったことを受け、トライアル環境は後でBCP(事業継続計画)環境として活用しました。構成が違うからこそ、本番環境で何かがあった場合でも影響なく動作するだろうと思ってのことでした。トライアル環境にもそれなりのコストがかかっていたので、BCP環境としての流用プランを固めることができたときは、ほっとしたことを覚えています。
VDIの導入に当たっては、全社プロジェクトを編成しました。ユーザーがスムーズに使えるようなVDIを実現すべく、構築を推進しました。VDIの安定稼働はネットワーク次第なところもあるので、ネットワークのカイゼン、途中からは特に無線環境のカイゼンの取り組みにも着手しました。優秀な社員、パートナー会社の皆さんに恵まれ、“構築は成功”するように見えました。
問題が明らかになったのは要件定義の最終段階でした。2016年度初めに、要件定義終了時のゲートレビューとして、プロジェクト全体のウォークスルーレビューを実施したのです。役員も参加しながら、要件定義のポイントを全て洗い出して問題ないかどうかをレビューしました。そこで明らかになったのは、「いまのまま進めると、VDI基盤の“構築には成功”しても、VDIの“導入には失敗”するだろう」ということです。
一体どういうことでしょうか。その理由は、VDI導入において、“VDI利用のライフサイクル”の考慮と、“変革のマネジメント”の観点が抜けていたからでした。
まず、VDI利用のライフサイクルとは何でしょうか。VDIの利用開始から終了まで、そこにはライフサイクルがあります。それは、ユーザーがVDIを利用し始める前から始まります。
第一に、VDIを十分作っておき在庫として持っておく必要があります。そして、ユーザーが入社したら社内のIDを発行し、IDにひも付く形でVDIを在庫から割り当てます。「標準VDIとセキュアVDIのどちらが必要なのか」「スペックはどうするのか」といった点を選択する必要があるので、VDIを申請するワークフローシステムも必要となります。申請を終えたユーザーにVDIを割り当てると、ユーザーはVDIを使い始めますが、VDI利用中もトラブル対応や利活用においてサポートが必要です。
また、VDIコストを費用配賦(はいふ)する場合は、ユーザーが所属する組織への課金も必要になります。途中でユーザーが異動したり、ユーザーの所属する組織や上長が変わったりもします。よって権限設定や、各種管理情報の更新なども適切にしなくてはなりません。やがてユーザーは退職する日を迎えるでしょうが、適切なタイミングでVDIが返却されないと、セキュリティ上問題になってしまいます。
このようにVDI利用のライフサイクルをしっかりと押さえ、その各段階で必要となるシステムや仕組みを整備しなければ、VDIを利用していくことはできないのです。恥ずかしながら、VDI構築当初はこのような発想がありませんでした。レビュー後にVDI利用のライフサイクルの洗い出しと、必要なシステムの検討に着手し、VDIの申請〜払い出し〜削除に至る一連のシステムを開発することになりました。
プロジェクト途中からの、システム開発スコープの追加です。当然、コスト面や要員面での調整は難航しました。システム連携も多く、リリース直後は多くのトラブルにも見舞われました。「プロジェクト計画時から組み込んでおけばよかったなあ」と、何度も反省することになりました。
そして、変革のマネジメントについても反省点がありました。VDI導入は言葉にすれば単純です。PCをVDI化するだけです。しかしそれはユーザーにとってみれば、大きな変革なのです。当初は、「VDIにつないで利用する」ような操作へのイメージすら湧かないユーザーもいました。それなのに、経営会議で承認を得たことを“印籠”のようにして、ただどんどんと進めようとしてしまったのです。ユーザーからすると、「VDIって何?」という感じだったでしょう。
特に混乱を招きそうだったのが“2つのVDI”です。セキュアVDIと標準VDIの2環境を提供することを考えていたため、それらの使い分け方法などの情報を整理し説明する必要がありましたが、検討が不十分のままプロジェクトを進めていました。
対策として、プロジェクト内に移行推進ユニットと広報ユニットを設け、ユーザー対応体制を整備しました。移行推進ユニットでは、リクルートグループ各社に窓口を立て、各社のユーザー取りまとめ担当への説明やQ&Aを一元的に対応するとともに、社内にポータルサイトを設け、VDI関連情報を集約しました。広報ユニットにおいては、ユーザーへの広報内容の整理やマニュアル類の整備を実施し、コールセンターの設置を準備しました。
移行フェーズに入ってしばらくしてから問い合わせを分析したところ、全体で見るとVDIサービスの仕様や、申請/運用フロー、セキュアVDIと標準VDIの使い分けといったような問い合わせが多く寄せられていたことが分かりました。それまでのPC環境と何がどう変わるのか、丁寧にユーザーに情報提供することが大事なのだと、その時にも改めて痛感しました。
既存PCからVDIへの移行作業は、とても難儀しました。
特に難しかったのが、データの移行です。約700拠点にわたり約3万台存在する既存PC内のデータを、データセンターにあるVDI基盤のストレージに移動させなければなりませんでした。移行においては、ユーザーの業務を阻害することも極力避けなければなりません。そこで、夜間のネットワークを使ったデータ転送と、NAS(Network Attached Storage)などを使った物理的なデータ配送の仕組みを使い分けました。いつ、どの拠点の、どのユーザーのPCデータを移行させるのか、詳細な計画を立案し実行に移しました。既存PC内のデータの移行と並行して、拠点にあったファイルサーバのデータをデータセンターにある統合ファイルサーバに移行する作業を実施する必要もあり、データ移行の難易度は極めて高いものがありました。
前述の通り、体制を強化してユーザー対応の仕組みは整えましたが、VDI移行が進むにつれさらにさまざまな声が寄せられました。プロジェクトメンバーのリソースも限られていますし、移行は移行で計画通りに進めないと全体のスケジュールが破綻してしまいます。そこで、要望や緊急対応の依頼があった場合は各プロジェクトメンバーが判断するのではなく、エスカレーションフローを定めるとともに、ステアリングコミッティを設けて、そこで要望や緊急対応の対応有無を判断するようにしました。
その過程では、さまざまなトラブルも発生しました。無線アクセスポイントと端末の組み合わせによりVDIの動作が緩慢になったり、端末をプロジェクターにつなぐとバグによりVDIが固まってしまったりといった問題が多発し、数多くのクレームが寄せられました。そのようなトラブルを集中的に取り扱うため、プロジェクト上層部も含めた定例検討会を設置し、検討しては対策を立てて一つ一つ実行していきました。これらの運用初期に起きた問題については、次回取り上げます。
2015年から始まって2018年3月、足かけ3年でVDIの導入は何とか終わりました。結果として、VDIで狙っていた“3つの課題”、働き方変革への貢献、セキュリティ向上、PC運用コストの削減については一定の成果を上げることができたと考えています。
特にVDI化のメリットを感じたのは、OSアップデート時でした。VDI導入後に、「Windows 7」から「Windows 10」へバージョンアップしましたが、通称「朝テン」方式でバージョンアップできました。朝テンとは、ユーザーから見たときに、“朝”になったらWindows 10(テン)になっていることです。VDIのメリットを最大限生かし、夜の間にWindows 7のVDIからWindows 10のVDIへのデータ移行や初期設定を済ませ、朝にはユーザーにWindows 10 VDI環境を提供できました。以前であれば、PCを交換して手作業でデータを移行してもらったり、ユーザーにOSの入ったメディアを渡し、それを使って1日くらいかけておのおのバージョンアップしてもらったりといった方式しかありませんでしたが、VDIによって迅速にバージョンアップすることが可能になりました。TCO(総保有コスト)で考えると、かなりの成果も出せたのではないかと考えています。
他方で、VDIの大変な点も見えてきました。システム運用観点だと、キャパシティープランニングをはじめとして、集約環境ならではの難しさがありました(この辺りの苦労や工夫は、今後の連載でお伝えします)。
また、昨今のPC環境を考えるに当たっては、コロナ禍の影響も避けられません。コロナ禍では、さまざまな工夫によって、何とかVDIによるテレワーク環境を継続できました。この点はVDIにしていたからこそスムーズに対応できたところですが、他方で、TV会議実施時におけるデメリットが見えてきました。VDIにおける音声や動画との親和性の低さは否めません。
リクルートのVDIを作り始めたのが2015年。そろそろVDI基盤のEOSL(End Of Service Life)が見えてきました。導入時は、“いま、ここ”の課題だった“3つの課題”に対するソリューションとしてVDIを選択しましたが、EOSLに際し、PC環境は中長期的にはどうあるべきか、というテーマについて経営層も含めて議論しています。
そこで新たなPC環境の姿として「クラウド&マルチデバイス環境」を定め、それに向かって次のPC環境を構築していくことにしました。この話は最終回にしたいと考えています。
株式会社リクルート 横断機能担当 ICT統括室 インフラソリューションユニット インフラソリューション部 部長
SIerで提案、構築、保守運用を経験した後、2015年リクルートテクノロジーズに入社。リクルートグループ全社VDI導入の企画、構築、推進をリードする。現在は、社内ICTのインフラ部隊をマネジメントしながら、次世代のPC環境を検討、推進中。
Copyright © ITmedia, Inc. All Rights Reserved.