水とお酒をどう見分ける? AIプロジェクトの成否を分ける、アノテーションの重要性を有識者に聞いた:AI・機械学習・データ活用の今と未来(1)
AI、機械学習に必要なデータ整備、活用について取り上げる本連載。第1回は、AIが学習するためのデータにラベル付けを行う「アノテーション」作業効率化ツールを提供している、FastLabelのCEOに、昨今のAI開発事情について話を聞いた。
AI活用のボトルネックはデータの整備
AIの利用が拡大している。B2C(Business to Consumer)領域でメガプラットフォーマーが提供するサービスだけでなく、B2B(Business to Business)領域のビジネスITにおいてもAIの採用が増えている。
その一因に、企業が保存しているデータの増加がある。特に、IoTセンサーやWeb接続できるカメラなど、日々蓄積される非構造化されたデータは、人間が確認できる容量をはるかに超えている。そこでAIを使ってそのデータを活用したいと考える企業が増えているからだ。
しかし、データをAIで分析するためには準備が必要である。AIが判別できるように、データに「ラベル付け」を行わなければいけない。この作業を「アノテーション」というが、ここに膨大な時間が費やされているという。
その課題解決に目を付け、2020年に創業した企業がFastLabelだ。代表取締役CEOを務める上田英介氏は、同社の創業の理由を次のように述べる。
「アノテーションはAI活用プロセスの最上流過程になります。例えば自動運転の車を作るときに、画像データの中で、これが車、これが人……、ということを学ばせるための教師データを作る必要があります。このデータ作りの作業が、非常に労働集約的であることが問題だと思っていました。そこで、その作業を自動化するツールを開発しようと思い立ったのが創業のきっかけです」
企業がPoC(概念実証)で3カ月間AIプロジェクトを行う場合、全体の2カ月から2カ月半はデータ作りに費やされることも珍しくないという。データ作りを自動化して短期間で終わることができれば、もっと高速でPDCA(Plan、Do、Check、Action)サイクルを回すことができて、結果として業務の改善が進むというのが、上田氏の考えだ。
AIはモデル重視からデータ重視の時代へ
AIの利用に関してデータ作成の重要性が増している理由は、テクノロジーの進化からも説明できると上田氏は語る。
上田氏によれば、今、AIの開発環境には大きな変化が訪れているという。2012年にディープラーニングという技術が登場し、AIの分析アルゴリズムに大きな革新があった。それ以降、AIの活用が一気に広がってきたことはよく知られているが、この時期はアルゴリズムが最重要視される「モデルセントリック」の時代だった。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- BizTechが「AI開発会社/AIサービス カオスマップ2022」を公開
BizTechは、「AI開発会社/AIサービス カオスマップ2022」を公開した。AI(人工知能)開発会社やAIサービスをカテゴリー別にまとめたもので、2021年版に比べて企業やサービスが追加されている。 - 内視鏡の映像をリアルタイムで共有し、遠隔地から医師をサポート ドコモらが遠隔医療向けの実証実験を実施
神戸大学と香川大学、高知赤十字病院、オリンパス、NTTドコモは、リアルタイムで複数の人による医用映像確認とアノテーションを実現する遠隔医療の実証実験を2022年2月23日に実施する。 - 手作業によるラベル付けを不要に 東京大学の郭威助教らがアノテーションの自動化手法を開発
東京大学の郭威助教らの研究グループは、ある品種に対して学習させたAIモデルを別の品種向けに検出精度を落とすことなく変換できる「モデル汎化法」を開発した。