プライバシーを保護したままで「AI学習向けデータの統合解析」を実現 NEDOと筑波大学「どうデータ共有するか」の課題を解決?

NEDOと筑波大学は、プライバシー情報を含んだ複数のデータを、共有せずに統合解析するAI(人工知能)向けの技術を開発した。不可逆変換処理した中間表現データと、「アンカーデータ」と呼ぶダミーデータを共有することでセキュリティに配慮しつつ、複数の企業や機関が所有するデータの統合解析を可能とした。

» 2019年08月09日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)と筑波大学は2019年8月7日、「データコラボレーション解析」技術を開発したと発表した。これは、複数の企業や機関がそれぞれ保有するプライバシー情報などを含んだデータに対して、元データを共有せずに統合的に解析するAI(人工知能)向けの技術。医療分野での生活習慣病データの解析による疾患予測などに応用できる。

 データコラボレーション解析では、プライバシー情報などを含むデータを、各企業や各機関独自の関数によって「中間表現データ」に変換し、この中間表現データを共有する。中間表現データへの変換関数の処理は不可逆で、元のデータには戻せない。しかも中間表現データから元データの推測は困難であるため、元データに含まれるプライバシー情報などの安全性は確保できる。ただし、中間表現データは各機関がそれぞれの変換関数で変換したデータなので、単純には統合解析できない。

画像 データコラボレーション解析のイメージ(出典:NEDO

 そこで「アンカーデータ」と呼ぶダミーデータを用意し、これを各企業や機関で共有することにした。アンカーデータと、解析対象とするデータのそれぞれの中間表現データを生成し、アンカーデータを目印にして各企業や機関の中間表現を統合可能な「データコラボレーション形式」に変換する。これによって変換方式が異なる中間表現データでも統合解析ができるようにした。データコラボレーション形式のデータを用いてAIに学習させ、学習済みモデルを構築する。

「データ共有」はAI活用の隠れた課題

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。