国立情報学研究所(NII)が「メルカリ」データを無償提供 NIIがそろえるその他のデータセットは?:学術研究用途に限定
メルカリの研究開発組織であるmercari R4Dと国立情報学研究所は、大学などの公的な研究機関に向けてフリマアプリ「メルカリ」の出品に関するデータ「メルカリデータセット」を無償で提供する。
メルカリの研究開発組織であるmercari R4Dと情報・システム研究機構 国立情報学研究所(NII)は、大学などの公的な研究機関(学術研究機関)に向けて、フリマアプリ「メルカリ」の出品に関するデータ「メルカリデータセット」の無償提供を始めた。NIIの事業である「情報学研究データリポジトリ(IDR:Informatics Research Data Repository)」を通じて2022年9月1日から提供されている。
メルカリ以外にもユニークなデータセットを提供
メルカリデータセットには、2020年1〜12月にフリマアプリ「メルカリ」に出品された商品のテキストデータと画像データ、コメントなどの情報が含まれている。用途を学術研究目的に限定しており、利用申請に基づく審査を経て許可した大学や公的研究機関にのみ提供する。
メルカリとNIIによると、「AIやビッグデータなどの研究領域を中心にデータを活用した研究活動が活発化しており、現実社会で活用可能な研究成果を創出するために、実データを利用したいというニーズが高い」という。両者は、メルカリデータセットの活用によって、個人間取引過程での消費者の行動や心理分析、中古品の価値分析、二次流通市場の特性分析など「循環型社会の実現、幅広い研究への活用が期待できる」としている。
なおIDRでは、メルカリデータセット以外にも「Yahoo!知恵袋データ」「顧客満足度調査データ」「法律相談データ」などユニークなデータセットが提供されている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Wine Dataset:ワイン(アルコール度数/色の濃さなどの13項目)の表形式データセット
データセット「Wine」について説明。178件のワインの「表形式データ(アルコール度数/色の濃さなどの13項目)」+「ラベル(3種類のワインの分類)」が無料でダウンロードでき、多クラス分類問題などのディープラーニングや統計学/データサイエンスに利用できる。scikit-learnにおける利用コードも紹介。 - 無償で利用できる「約16万件の口コミデータ」 マイスタースタジオとNIIが提供
マイスタースタジオとNIIは、学術研究分野でのデータ活用促進に向けて、口コミサイト「みん評」の口コミデータ「みんなの評判口コミデータセット」の提供を開始した。学術研究を目的に無償で利用できる。 - 実画像を一切使わず「数式から生成した画像データ」のみで画像認識AIを構築する手法を開発 産総研
産総研は、数式から自動生成した画像データでAIの画像認識モデルを構築する手法を開発した。数式から画像パターンや教師ラベルを自動生成することでラベル付けのコストを削減し、実画像のデータ数や権利関係を気にせず、画像認識モデルを構築できる。