NEDOと筑波大学は、プライバシー情報を含んだ複数のデータを、共有せずに統合解析するAI(人工知能)向けの技術を開発した。不可逆変換処理した中間表現データと、「アンカーデータ」と呼ぶダミーデータを共有することでセキュリティに配慮しつつ、複数の企業や機関が所有するデータの統合解析を可能とした。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)と筑波大学は2019年8月7日、「データコラボレーション解析」技術を開発したと発表した。これは、複数の企業や機関がそれぞれ保有するプライバシー情報などを含んだデータに対して、元データを共有せずに統合的に解析するAI(人工知能)向けの技術。医療分野での生活習慣病データの解析による疾患予測などに応用できる。
データコラボレーション解析では、プライバシー情報などを含むデータを、各企業や各機関独自の関数によって「中間表現データ」に変換し、この中間表現データを共有する。中間表現データへの変換関数の処理は不可逆で、元のデータには戻せない。しかも中間表現データから元データの推測は困難であるため、元データに含まれるプライバシー情報などの安全性は確保できる。ただし、中間表現データは各機関がそれぞれの変換関数で変換したデータなので、単純には統合解析できない。
そこで「アンカーデータ」と呼ぶダミーデータを用意し、これを各企業や機関で共有することにした。アンカーデータと、解析対象とするデータのそれぞれの中間表現データを生成し、アンカーデータを目印にして各企業や機関の中間表現を統合可能な「データコラボレーション形式」に変換する。これによって変換方式が異なる中間表現データでも統合解析ができるようにした。データコラボレーション形式のデータを用いてAIに学習させ、学習済みモデルを構築する。
最近では、さまざまな企業や機関が、蓄積したデータをAIで解析することに取り組んでいる。AIを活用した解析の精度を上げるには、分布の偏りが少なく十分な数のデータが必要だ。ただし、そのために複数の企業や機関が所有するデータを統合解析する場合、特に医療データなどプライバシー情報を含んだデータを1箇所に集めることは、セキュリティ上困難だった。そのため、元データを共有せずに、企業や機関の垣根を越えて統合的に解析する技術の開発が課題だった。
なお、NEDOと筑波大学は開発した技術の実用化に向けて、筑波大学附属病院が保有するデータの解析と、聖路加国際大学と島津製作所から得られるデータを解析するための協議を進めている。さらに、医療以外の分野での利用に向けて、同技術の適用をさまざまな業界に呼び掛けるとしている。
Copyright © ITmedia, Inc. All Rights Reserved.