AI、機械学習に必要なデータ整備、活用について取り上げる本連載。第1回は、AIが学習するためのデータにラベル付けを行う「アノテーション」作業効率化ツールを提供している、FastLabelのCEOに、昨今のAI開発事情について話を聞いた。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
AIの利用が拡大している。B2C(Business to Consumer)領域でメガプラットフォーマーが提供するサービスだけでなく、B2B(Business to Business)領域のビジネスITにおいてもAIの採用が増えている。
その一因に、企業が保存しているデータの増加がある。特に、IoTセンサーやWeb接続できるカメラなど、日々蓄積される非構造化されたデータは、人間が確認できる容量をはるかに超えている。そこでAIを使ってそのデータを活用したいと考える企業が増えているからだ。
しかし、データをAIで分析するためには準備が必要である。AIが判別できるように、データに「ラベル付け」を行わなければいけない。この作業を「アノテーション」というが、ここに膨大な時間が費やされているという。
その課題解決に目を付け、2020年に創業した企業がFastLabelだ。代表取締役CEOを務める上田英介氏は、同社の創業の理由を次のように述べる。
「アノテーションはAI活用プロセスの最上流過程になります。例えば自動運転の車を作るときに、画像データの中で、これが車、これが人……、ということを学ばせるための教師データを作る必要があります。このデータ作りの作業が、非常に労働集約的であることが問題だと思っていました。そこで、その作業を自動化するツールを開発しようと思い立ったのが創業のきっかけです」
企業がPoC(概念実証)で3カ月間AIプロジェクトを行う場合、全体の2カ月から2カ月半はデータ作りに費やされることも珍しくないという。データ作りを自動化して短期間で終わることができれば、もっと高速でPDCA(Plan、Do、Check、Action)サイクルを回すことができて、結果として業務の改善が進むというのが、上田氏の考えだ。
AIの利用に関してデータ作成の重要性が増している理由は、テクノロジーの進化からも説明できると上田氏は語る。
上田氏によれば、今、AIの開発環境には大きな変化が訪れているという。2012年にディープラーニングという技術が登場し、AIの分析アルゴリズムに大きな革新があった。それ以降、AIの活用が一気に広がってきたことはよく知られているが、この時期はアルゴリズムが最重要視される「モデルセントリック」の時代だった。
Copyright © ITmedia, Inc. All Rights Reserved.