ビッグデータが抱える2つのボトルネックに直面したNBA:三国大洋の箸休め(24)(2/2 ページ)
NBAの一部のチームが導入した映像解析システム「SportVU」から得られた膨大なデータを活用する段になって、人とマシンという2つのボトルネックが明らかになってきたそうだ。
2つのボトルネック――人とマシンと
それはさておき。
「XY Hoops」のプロジェクトで使われたデータ(2012-13シーズンのもの)には、8億件の選手のロケーション情報(コート上での位置情報)が含まれる。また最終的に出来上がったデータベースの容量は93Gbytes。ただし昨シーズンは14チームしかSportVUを導入していなかったから、今シーズン以降はデータ件数が倍以上になる公算が高い。
Kirk Goldsberryは、「何年か前までは、そもそも膨大なデータを入手すること自体が難しかった=入手自体がボトルネックになっていたが、今ではこの部分はそれほど問題ではない(略)代わって新しいボトルネックが生じており、中でも一番の問題は人的リソースの確保だ」などと書いている。
いわゆる「データサイエンティスト」の不足については、「2018年までに米国だけで14万〜19万人くらい不足する」というMcKinsey Global Instituteのレポートがよく引用されているのを見かける。またそうした人材の供給に向けて、いろんな米大学が取り組み(授業)を開始しているといった記事を目にしたこともある。下記のNYTimesはその一例だ。
- Data Science: The Numbers of Our Lives - NYTimes
この記事中に出てくる「コンピューターサイエンスとソフトウェアエンジニアリング、それに統計学が分かる人間」の確保というのがボトルネックになるというのは、「DataBall」の記事を読んでいても何となく分かる。より正確にいうと、EVPというコンセプトを発案するに至った院生の説明個所の「分からない」(門外漢にとっての「ちんぷんかんぷんさ」)から、その難しさが伝わってくる。
またGoldsberryは、「XY Hoops」プロジェクトで利用したマシンリソースについて、「ハーバードのOdysseyというクラスターコンピューティングサービスを使ってデータを解析。このシステムはパラレルで動くプロセッサ500基で構成され、割り当てたメモリ容量は2Tbytes……」などとさらっと書いているが、例えば一般の企業でこういう類いの計算処理リソースをどれくらい容易に(どれくらいのコストで)確保できるか、というのもよく分からない(それだけでも敷居が高そうにも思えるが)。
いずれにせよ、それだけの計算処理リソースやそれを使いこなせる人材を確保しているNBAのチームが現在どれほどあるのか。「ゼロではないにせよ、限りなくゼロに近いのではないか」とGoldsberryはそう自問自答している。
タイプライターからスプレッドシートへ、そしてデータベースへ
この記事でもう1つ印象に残るのは、選手のパフォーマンスを見る指標が、新しいツールの登場に応じて大きく変わってきている、という点。
Goldsberryは、従来から使われてきている「得点」や「アシスト」などの指標が「鉛筆と紙しか記録の手段がなかった時代の名残りで、それをタイプライターで清書し直しただけ」としている。また、その後パソコンと表計算プログラムの普及に伴って登場してきた新たな指標――例えば、John Hollingerが開発した「Player Efficiency Rating(PER)」(=選手の時間あたりの貢献度を測るもの)なども、パソコンで処理できるデータしか扱えなかった。
それに対して、「SportVU」で生成されるデータを処理するには桁違いの計算処理リソースが必要だが、同時にこれまでになかったような洞察が得られる可能性もある、と記している。
文章の分解
上記の背景を踏まえて、冒頭の英文を少しずつ区切りながら読み解いてみよう。
[1] The NBA’s big-data possession is just getting started, /
[2] and everyone is rooting for a slam dunk /
[3] that benefits teams, athletes, media, and most of all, fans. /
[4] But that’s not guaranteed, /
[5] and (in the words of Parker,)we just have to make sure we “make the right play in the end.”
それぞれ、以下のように読み解ける。
[1] NBAでビッグデータが入手できるようになったのはつい最近のことで
[2] 今は誰もがスラムダンクと呼べそうなものを見つけ出そうとしている
[3] 各チームや選手、メディア、そして何よりもファンにとってプラスになるものを
[4] しかしそうしたものが確実に見つかると決まっているわけではない
[5] そして(Parkerの言葉を借りれば)われわれは「最終的に正しいプレーをする」ように確実を期さなくてはならない、ということになる
もう一度英文を
では最後に、もう一度英文を読み直してみよう。
The NBA’s big-data possession is just getting started, and everyone is rooting for a slam dunk that benefits teams, athletes, media, and most of all, fans. But that’s not guaranteed, and in the words of Parker, we just have to make sure we “make the right play in the end.”
三国大洋 プロフィール
オンラインニュース編集者。「広く、浅く」をモットーに、シリコンバレー、ハリウッド、ニューヨーク、ワシントンなどの話題を中心に世界のニュースをチェック。「三国大洋のメモ」(ZDNet)「世界エンタメ経済学」(マイナビニュース)のコラムも連載中。
Copyright © ITmedia, Inc. All Rights Reserved.