ニュース
「年々変化するファッションの流行を捉えられる」 ZOZOが大規模データセットと実装基盤を公開:データ分布のシフトを再現
ZOZOテクノロジーズは、大規模データセット「Shift15M」と実装基盤をオープンソースとして公開した。ファッションアプリ「IQON」に投稿されたコーディネートなどのデータと、データ分布のシフトが生じる条件の下で検証するためのコードを用意した。
ZOZOテクノロジーズは2021年9月2日、同社の研究開発組織「ZOZO研究所」の研究員が使用している大規模データセット「Shift15M」と実装基盤を公開したと発表した。
ZOZO研究所はファッションの流行が変化しても、継続的に認識精度を高く保てるAI(人工知能)技術を研究しているが、「データ分布のシフトの検証は、AI技術の実用性に関わる重要なテーマであるものの、検証に用いる実用的なデータセットが不足しており、こうした分野の研究の進展が制限されてきた」という。
今回のデータセットと実装基盤を公開は、こうした分布シフトの研究の発展を支えることが目的だ。
なお、データ分布のシフトとは、ファッションのように流行の変化による影響を受けて、データ量が変化する数理的現象。流行や時間などの変化に伴って入力データの分布が変化することで生じる。分布シフトによって、AIの認識精度が低下することが知られている。
コーディネートの特徴量や「いいね」の数から分布シフトを再現
Shift15Mは、スマートフォン向けファッションアプリ「IQON」に投稿されたコーディネートを基に構成した大規模データセット。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- MRI画像のAI解析などで利用できる「脳画像ビッグデータ」を公開 国際電気通信基礎技術研究所ら研究グループ
ATR脳情報通信総合研究所の研究グループは「複数疾患の脳画像ビッグデータ」を一般公開した。多くの施設で統一のプロトコルで撮像した複数精神疾患のfMRIデータと旅行被験者データを合わせてデータベース化したもので、オンラインプラットフォームでダウンロードの申請ができる。 - 無料で受講できる「統計オープンデータのデータ分析入門」 総務省が開講
総務省は、データサイエンスに関するオンライン講座「誰でも使える統計オープンデータ」を開講した。統計GISやAPIを使った、統計オープンデータのデータ分析に関する基本的な知識を学べる。 - 米大学研究者、回答者のプライバシー保護のために調査データを変更する新しい方法論を提唱
ドレクセル大学とバンダービルト大学の研究者のチームが最近発表した論文で、調査データが共有される場合に、消費者のプライバシー保護のためにデータを恒久的に変更し、その一方でデータの精度を維持する新しい方法論を提唱した。