NEDOと筑波大学は、プライバシー情報を含んだ複数のデータを、共有せずに統合解析するAI(人工知能)向けの技術を開発した。不可逆変換処理した中間表現データと、「アンカーデータ」と呼ぶダミーデータを共有することでセキュリティに配慮しつつ、複数の企業や機関が所有するデータの統合解析を可能とした。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)と筑波大学は2019年8月7日、「データコラボレーション解析」技術を開発したと発表した。これは、複数の企業や機関がそれぞれ保有するプライバシー情報などを含んだデータに対して、元データを共有せずに統合的に解析するAI(人工知能)向けの技術。医療分野での生活習慣病データの解析による疾患予測などに応用できる。
データコラボレーション解析では、プライバシー情報などを含むデータを、各企業や各機関独自の関数によって「中間表現データ」に変換し、この中間表現データを共有する。中間表現データへの変換関数の処理は不可逆で、元のデータには戻せない。しかも中間表現データから元データの推測は困難であるため、元データに含まれるプライバシー情報などの安全性は確保できる。ただし、中間表現データは各機関がそれぞれの変換関数で変換したデータなので、単純には統合解析できない。
そこで「アンカーデータ」と呼ぶダミーデータを用意し、これを各企業や機関で共有することにした。アンカーデータと、解析対象とするデータのそれぞれの中間表現データを生成し、アンカーデータを目印にして各企業や機関の中間表現を統合可能な「データコラボレーション形式」に変換する。これによって変換方式が異なる中間表現データでも統合解析ができるようにした。データコラボレーション形式のデータを用いてAIに学習させ、学習済みモデルを構築する。
Copyright © ITmedia, Inc. All Rights Reserved.