「製品の発表前でデータが存在しない」場合も学習データを用意可能 AI学習向け合成画像データセットをユニティが提供:「実はこの画像、使えませんでした」を防止
ユニティ・テクノロジーズ・ジャパンは、AIの学習を目的とした、コンピュータビジョンアプリケーションに向けたオーダーメイドの合成画像データセット「Unity Computer Vision Datasets」を提供する。
ユニティ・テクノロジーズ・ジャパン(以下、ユニティ)は2021年4月21日、コンピュータビジョンアプリケーションのAI(人工知能)学習向け合成画像データセット「Unity Computer Vision Datasets」を提供すると発表した。
「製品の発表前でデータが存在しない」場合も学習データを用意できる
AI学習において合成画像データが重要なのは、既存のデータでは得られない特定のニーズや条件を満たすことができるからだ。プライバシー保護のために使えるデータが少ない、製品の発表前でデータが存在しないといった場合でもUnity Computer Vision Datasetsを使えば、学習データを用意できる。
Unity Computer Vision Datasetsは、「ドメインランダム化」という技術を用いて、アプリケーションの品質向上に向けた画像データを生成する。この技術を使えば、対象となるオブジェクトの位置や向きが異なる複数のデータを、照明やカメラアングルといった設定を変化させて出力できる。
ユニティは合成画像データの価格について次のように説明する。
「実世界のデータの場合、そのデータに付加する情報(ラベル)が多くなるほど高額になる。ユニティは『2D、3Dバウンディングボックス』『クラスセグメンテーション』『インスタンスセグメンテーション』などのラベルを同じ価格で提供する。一度に多くのデータを購入する場合は単価が下がる仕組みになっている」
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- クラウド(AWS/Azure/GCP/IBM)で手軽に使えるオープンデータセット
4つの人気クラウドプラットフォームで手軽に利用できるオープンなデータセットの一覧ページである「Registry of Open Data on AWS」「Azure Open Datasets」「Google Cloud 一般公開データセット」「IBM Developerの『データセット』カテゴリー」を紹介する。 - Food-101N:料理カラー写真(分類ラベルのノイズが多いバージョン)の画像データセット
データセット「Food-101N」について説明。31万9枚、101種類の料理カラー写真(アップルパイや餃子など)の「画像+ラベル」データが無料でダウンロードでき、ラベルノイズ問題の研究や画像認識などのディープラーニングに利用できる。 - Open Images Dataset:Googleによる膨大な画像データセット
データセット「Open Images Dataset」について説明。物体検知用の境界ボックスや、セグメンテーション用のマスク、視覚的な関係性、Localized Narrativesといったアノテーションが施された、約900万枚と非常に膨大な数の画像データセット。その概要と使い方を紹介する。