水とお酒をどう見分ける? AIプロジェクトの成否を分ける、アノテーションの重要性を有識者に聞いたAI・機械学習・データ活用の今と未来(1)

AI、機械学習に必要なデータ整備、活用について取り上げる本連載。第1回は、AIが学習するためのデータにラベル付けを行う「アノテーション」作業効率化ツールを提供している、FastLabelのCEOに、昨今のAI開発事情について話を聞いた。

» 2022年09月26日 05時00分 公開
[指田昌夫@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

AI活用のボトルネックはデータの整備

 AIの利用が拡大している。B2C(Business to Consumer)領域でメガプラットフォーマーが提供するサービスだけでなく、B2B(Business to Business)領域のビジネスITにおいてもAIの採用が増えている。

 その一因に、企業が保存しているデータの増加がある。特に、IoTセンサーやWeb接続できるカメラなど、日々蓄積される非構造化されたデータは、人間が確認できる容量をはるかに超えている。そこでAIを使ってそのデータを活用したいと考える企業が増えているからだ。

 しかし、データをAIで分析するためには準備が必要である。AIが判別できるように、データに「ラベル付け」を行わなければいけない。この作業を「アノテーション」というが、ここに膨大な時間が費やされているという。

 その課題解決に目を付け、2020年に創業した企業がFastLabelだ。代表取締役CEOを務める上田英介氏は、同社の創業の理由を次のように述べる。

FastLabelの上田氏

 「アノテーションはAI活用プロセスの最上流過程になります。例えば自動運転の車を作るときに、画像データの中で、これが車、これが人……、ということを学ばせるための教師データを作る必要があります。このデータ作りの作業が、非常に労働集約的であることが問題だと思っていました。そこで、その作業を自動化するツールを開発しようと思い立ったのが創業のきっかけです」

 企業がPoC(概念実証)で3カ月間AIプロジェクトを行う場合、全体の2カ月から2カ月半はデータ作りに費やされることも珍しくないという。データ作りを自動化して短期間で終わることができれば、もっと高速でPDCA(Plan、Do、Check、Action)サイクルを回すことができて、結果として業務の改善が進むというのが、上田氏の考えだ。

AIはモデル重視からデータ重視の時代へ

 AIの利用に関してデータ作成の重要性が増している理由は、テクノロジーの進化からも説明できると上田氏は語る。

 上田氏によれば、今、AIの開発環境には大きな変化が訪れているという。2012年にディープラーニングという技術が登場し、AIの分析アルゴリズムに大きな革新があった。それ以降、AIの活用が一気に広がってきたことはよく知られているが、この時期はアルゴリズムが最重要視される「モデルセントリック」の時代だった。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。