企業の“Kaggler枠”って実際どうなの? ― データサイエンティスト協会 7th シンポジウム:Kaggleイベントレポート
最近注目を集めている“Kaggler採用枠”やKaggler社内ランク制度の実態はどのようなもので、それによってどのようなメリットがあるのか。実際にKaggler制度を運用する企業の代表者やその制度の下で働くKagglerたちの意見を聞いてみよう。
一般社団法人データサイエンティスト協会主催のイベント「7th シンポジウム」が(少し前になるが)2020年11月9、10日に開催された。
そのセッションの一つでは、Kaggleに関するパネルディスカッション(主に質疑応答)が行われた。本稿ではその内容を紹介する。以下はセッション内容を独自に書き起こしたものである。
- モデレーター:
- 石原祥太郎氏(日本経済新聞社 デジタル事業情報サービスユニット)
- パネリスト:
- 小野寺和樹氏(NVIDIA Senior Deep Learning Data Scientist)
- 原田慧氏(ディー・エヌ・エー システム本部AIシステム部データサイエンス第一グループ グループマネジャー)
- 藤田亮氏(Rist 代表取締役社長)
- 福田敦史氏(アイリス 取締役CTO)
このセッションでは、最初に「Kaggleとは何か」の説明と、各登壇者の自己紹介が行われた。その後、下記の3つの質問に対してパネルディスカッションが行われた。
本稿では、最初にあった「Kaggleの説明」についてはセッション内容を参考に筆者による言葉で要約し、各自己紹介は割愛した(※本稿の最後に、スクリーンキャプチャーしたセッションスライドを引用して掲載する)。その後のディスカッション部分は、雰囲気が出るように会話調で記述する(以下、敬称略)。
Kaggleとは?
Kaggle(カグル)とは、主に機械学習による予測モデルを作成し、その性能を競うコンペティション(コンペ、大会)である。予測モデルが解決する課題と、そのために必要な(主に教師あり学習の)データセットは企業や学術機関から提供される。参加者らがKaggleサイト上にモデルを提出することで、スコア順に順位が決定する。詳しくは「公式サイト:Kaggle Progression System」を参照してほしいが、例えば参加チームが100〜249の場合、トップ10に入るとGold(金)メダル、上位20%でSilver(銀)メダル、上位40%でBronze(銅)メダルを取得できる。コンペでGoldメダルを1個、Silverメダルを2個取得すると、Kaggle Master(マスター)の称号が得られる。Goldメダルを5個、チームではなく1人参加でGoldメダルを取得すると、最高の名誉であるKaggle Grandmaster(グランドマスター)の称号が得られる。Kaggle参加者の多くは、Master、次にGrandmasterになることを目指しているだろう。Kaggleに取り組む人はKaggler(カグラー)とも呼ばれる(※2020/02/02修正:メダル取得の有無を含めた定義になっていましたが、筆者による誤りでした。お詫びして訂正させていただきます)。
このKaggleは近年、注目を集めており、書籍やWeb上で記事が多数公開されるなど盛り上がってきている。ちなみにDeep Insider上では、2019年10月も本稿と同じようなイベントレポート記事「Kaggle Grandmasterに聞く「トップデータサイエンティストの過去・現在・未来」 ― データサイエンティスト協会 6th シンポジウム」を公開している。
また近年、Kaggleの各称号取得者を優遇する企業などがたびたびニュースとなっており、Kaggleで活躍することは収入や転職活動にも有利に働くようである(参考:図2)。
パネルディスカッション
Kagglerを採用するメリットは?
石原 DeNA(ディー・エヌ・エー)では、いち早く採用時や社内ランクにKaggler制度を取り入れていますね(図3)。
そこでまずは、DeNAの原田さんに伺います。本業との関わりでは、Kagglerにどのようなメリットを感じていますか?
原田 図4に示す通りで、Kagglerは純粋にデータサイエンティストとして優秀であることが大きなメリットです。例えばクラウドとDockerを活用するといったエンジニアリングのスキルも備えていますし、ビジネス面も理解しており「何が必要か」を掘り下げて課題発掘できたりします。非常に優秀で何でもでき、しかも実装スピードも速いという点がメリットです。
そういった優秀なデータサイエンティストを採用し続けられるのは、Kaggler制度があるおかげです。また、Kaggleへの参加といった勉強できる環境が会社の制度としてあるというのは、優秀なデータサイエンティストであればあるほど重要です。
石原 一口にKagglerといってもさまざまな人がいると思います。どういうKagglerに入社してほしいですか?
原田 なかなか難しい質問ですね。技術的な観点から見ると、すでにDeNA社内に多くのKagglerがいますので、そういったKagglerにできない何かができる人に入社してもらえるとうれしいです。チーム全体で見て、多様性がある方が好ましいので。最近、小野寺さんがDeNAから抜けてしまったので、例えば小野寺さん並みに特徴量加工が強い人には採用のチャンスがあるかもしれません。
会社的な観点から見ると、DeNAは事業会社であり技術研究をする会社ではないので、「ずっとKaggleやLightGBMだけやっていたい」という人は残念ながら採用できません。普段は、Kaggleをやっている時間以外は、普通にデータサイエンティストとして働くことになります。事業に興味を持っていることが大切です。DeNAの仕事の中に「(Kaggleコンペのように)このモデルの精度が少し上がったら1億円もうかります」のような仕事があれば最高ですが、残念ながらそのような仕事はありません。
厳しいことを言っているように聞こえるかもしれませんが、結局、Kaggleの各種問題を解いて上位ランクに入るには、「データがどうやって発生しているのか」といったデータが生まれた背景などを一生懸命に調べることになりますよね。それと同じことを会社の事業でやることを思えば、それほどむちゃな話ではないのかなと。むしろKaggleが強い人ほど、事業には向いているのではないかと私は思います。
石原 なるほど。Aillis(アイリス)ではKaggle支援によって「プロダクトの精度が10%以上向上」といった成果を出しているそうですね(図5)。
具体的に図6に示すようなKaggle支援に取り組まれているとのことです。
そのAillisの福田さんは、「Kaggleが事業に役立つ」という点についてどのように考えますか?
福田 私も原田さんとほぼ同じ意見です。言い方は悪いですが、あまり優秀ではないデータサイエンティストが100%フルコミットで作業するよりも、優秀なデータサイエンティストがKaggleを20〜40%やって、残りで業務をやってもらう方が圧倒的に仕事が速く、パフォーマンスがよいですね。Kagglerは、ドメイン知識のキャッチアップ力があり、手法もたくさん知っているので、普通に仕事の半分でKaggleをやっていても、並みのデータサイエンティストが100%フルコミットで仕事をするよりも良い成果が出るという実感があります。それだけでなく、優秀なデータサイエンティストは成長意欲があるのでより成長しやすく、普通のデータサイエンティストはどんどん引き離されていく傾向があります。
石原 Aillisの事業規模を拡大していくに当たって、どういう人を採用したいと考えていますか?
福田 Aillisの場合、“Kaggler枠”といった特別な採用枠は設けていません。Kaggleについては、誰もが当たり前に興味を持って自由に挑戦してほしいと思っているため、あえて特別な採用枠にはしていません。Kaggleだけでなく研究やエンジニアリングなど何かに前向きに挑戦する人を採用していきたいと思っています。
“Kaggler枠”の課題は?
石原 “Kaggler採用枠”に関する話が出ていますが、会社としてその採用枠を運用する際の課題もあると思います。2018年の運用開始から数年がたっているDeNAの原田さん、実際にはどのような課題があるのでしょうか?
原田 結構大変でしたので60分ぐらい語れます(登壇者ら:笑)。DeNAでは2018年2月から運用を開始して、既に3年が経過しています。まず狭い意味で制度面だけを見ると、うまく機能していると思います。特に社内ランクの更新条件といったルール部分はこだわって私が作成しました(図3)。過去の栄光には賞味期限があって、毎年結果を出し続けないと、たとえGrandmasterであっても権利を失う、というのはすごく良いルールだなと思っています。みんな、良い意味でプレッシャーを感じながら続けてくれているなと感じています。
課題をしいて挙げるなら、あくまでDeNAは事業会社でありもちろん本業が最優先なので、お仕事が忙しいときにKaggleがあまりできないということが起きています。そこはうまくアサイン(担当割り当て)調整などでケアしてあげなければならないという点が課題です。
もっと語りたいこととして、Kagglerチーム全体で感じている課題は、人によってKaggleに対して温度差が出てきていることです。チームを作りたてのころは、誰もが「Kagglerとして成功してやるぜ」という熱気を持っていました。Kaggleがやりたくてチームにジョインしてきた人ばかりでしたので、みんな楽しそうにしていました。物理的に笑い声が絶えなくて、以前はよく「うるさい」と怒っていました。それぐらい盛り上がっていました。
しかし何年かたちチームとして大きくなると、経営層から「Kaggler制度は何の役にたっているのか」と言われるようになってきていますし、内部からの変化も大きいです。優秀なデータサイエンティストであるが故ですが、「Kaggle Masterになっただけでは自分のキャリアとしてはダメだ」という考えを持つ人も出てきています。チームの中にKaggle Masterは何十人もいてGrandmasterもいますから、チームの中ではそういった称号はユニークな価値にはなりません。つまりKaggleの結果は、ビジネス方面やエンジニア方面など別領域に進むための通過点になってきています。みんなが瞬間的には同じ方向を向いていますが、将来的には違う方向を向いているような状況になったと感じています。
石原 小野寺さんは、元DeNAで現在はNVIDIA所属ですが(図7)、Ristでアドバイザーも務められています。そういった複数の企業でのKaggler制度を見た上で、制度上の課題について感じることがあれば教えてください。
小野寺 今の自分の仕事は、Kaggleコンペに参加することです。言ってみれば「遊ぶことが仕事」のようなものです。なので、NVIDIAでのKaggle制度に課題を感じたことはありません。
RistでKaggle制度を立ち上げたときは、DeNAに入社したときと同じイメージになるような制度設計をアドバイスしました。例えば先ほど原田さんが言及した「昔の栄光にすがらない」などです。
石原 RistでもDeNA同様に“Kaggler枠”や社内ランク制度を取り入れていますね(図8)。
そのRistの藤田さんにお聞きします。“Kaggler枠”で採用する人とそうでない人の違いについて教えてください。
藤田 まず“Kaggler採用枠”に関しては、採用時に見るポイント/軸は、その枠であるかないかで違いはありません。ただし“Kaggler採用枠”の方が、より厳しく評価するということはあります。特に“Kaggler枠”の人は、各プロジェクトにデータサイエンティストとして貢献するだけでなく、広報活動の一環で人前で話をしたり、営業活動の一環でお客さまとコミュニケーションを取ったりする必要がありますので、「しゃべれるエンジニアであるか」「非専門家の人に、分かりやすく伝えられるか」といった点を重視することはあります。ちなみに会社視点で“Kaggler採用枠”のメリットは、優秀な人材が採用できるだけでなく、広報活動や営業活動にも効果があるという点も大きいです(図9)。
石原 Ristの採用では、Kaggleでどれくらいの実績があるのが好ましいのでしょうか?
藤田 基本的にはKaggle MasterやGrandmasterといった称号を見ています。そこから先は、「どのコンペでメダルを取ったか」「そのコンペの質はどうだったか」などを見て、社内にいるKagglerやアドバイザーの小野寺さんの意見を参考にしています。
石原 DeNAの採用では、実績をどのように見ていますか?
原田 採用に関しては、Ristの藤田さんがおっしゃたこととほぼ同じです。私自身もKagglerではあるので、称号よりも何のコンペをどれくらいやっているかを見ます。なので、Masterでも不採用だった方も多くいますし、逆にBronzeメダル2個しかない人を採用して今はGoldメダル3個を取得したような人もいます。Kaggleのプロフィールや「ディスカッションで何を言っているか」を見てネットストーキング(登壇者ら:笑)すれば、「どれくらい一生懸命にやっているか」がよく分かります。
石原 DeNAでは“Kaggler枠”の人とそうでない人のコラボレーションはどうなっているのでしょうか?
原田 AI部門のデータサイエンティストは全員がKagglerです。ただし事業部門のデータサイエンティストは、データサイエンティストである前に事業部の人間というスタンスなので、事業のためなら何でもやります。なので、AI部門の人は幸せな働き方かなと思います。事業の泥臭いところ、ドメインにどっぷりと入るのは、事業部の人が担当してくれています。AI部門はそこからはみ出ている技術的な所や共通的なところを作っています。特に実装に関してはAI部門の方が得意なことが多いので、モノを作るなどのシステム実装は基本的にAI部門が担当しています。そういった分業パターンが多いです。
石原 ところで、SIGNATEなど、Kaggle以外のコンペティションプラットフォームは、DeNAの制度ではどのように扱われていますか?
原田 Kaggle以外のプラットフォームだと、どうしてもコンペティションの質が安定しないことがあります。なので、なかなか高い評価はしづらいなと感じています。例えばKaggle以外で優勝しても「Silverメダル扱い」などの評価になったりします。他に困っているのが、Kaggle Daysなどのイベントでの優勝をどう扱うかで、これも「Silverメダル扱い」にしたような気がします。このあたりは都度相談ですね。
石原 Aillisでは、意図的に“Kaggler採用枠”は作っていないという話がありましたが、今後、Kaggleの成績をどのように見ていく予定でしょうか?
福田 私自身はKaggleに参加していないので、社内のメンバーから話を聞いている限りになりますが、Masterといっても玉石混交だと思っています。チームで偶然にMasterになってしまったという人もいらっしゃるので、Kaggleのディスカッションを見たりメンバーと相談したりすることで「本当に優秀なMasterか」を確認したいと、今日のディスカッションを聞いて考えるようになりました。
石原 Ristは京都を拠点にしていますが、採用でメリットやデメリットを感じたことがありますか?
藤田 Ristでは、京都大学をはじめ60人もの優秀なインターンを採用しています。これを東京で行うのは難しいかなと感じます。東京は大学は多いですが、企業も多いですので。
ただし中途採用に関しては、関西や京都でAIエンジニア/データサイエンティスト職を探している人の母数自体が少ないという課題があります。今は東京に住んでいるが元々は関西出身の方や、京都に憧れを持っている人などが、Ristには中途で入社してきています。そういった点は、「京都が良い」と感じる部分です。
データサイエンティストから見た“Kaggler枠”
Copyright© Digital Advantage Corp. All Rights Reserved.