プライバシーを保護したままで「AI学習向けデータの統合解析」を実現 NEDOと筑波大学:「どうデータ共有するか」の課題を解決?
NEDOと筑波大学は、プライバシー情報を含んだ複数のデータを、共有せずに統合解析するAI(人工知能)向けの技術を開発した。不可逆変換処理した中間表現データと、「アンカーデータ」と呼ぶダミーデータを共有することでセキュリティに配慮しつつ、複数の企業や機関が所有するデータの統合解析を可能とした。
国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)と筑波大学は2019年8月7日、「データコラボレーション解析」技術を開発したと発表した。これは、複数の企業や機関がそれぞれ保有するプライバシー情報などを含んだデータに対して、元データを共有せずに統合的に解析するAI(人工知能)向けの技術。医療分野での生活習慣病データの解析による疾患予測などに応用できる。
データコラボレーション解析では、プライバシー情報などを含むデータを、各企業や各機関独自の関数によって「中間表現データ」に変換し、この中間表現データを共有する。中間表現データへの変換関数の処理は不可逆で、元のデータには戻せない。しかも中間表現データから元データの推測は困難であるため、元データに含まれるプライバシー情報などの安全性は確保できる。ただし、中間表現データは各機関がそれぞれの変換関数で変換したデータなので、単純には統合解析できない。
そこで「アンカーデータ」と呼ぶダミーデータを用意し、これを各企業や機関で共有することにした。アンカーデータと、解析対象とするデータのそれぞれの中間表現データを生成し、アンカーデータを目印にして各企業や機関の中間表現を統合可能な「データコラボレーション形式」に変換する。これによって変換方式が異なる中間表現データでも統合解析ができるようにした。データコラボレーション形式のデータを用いてAIに学習させ、学習済みモデルを構築する。
「データ共有」はAI活用の隠れた課題
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- ビッグデータのセキュリティ対策に必要な「10」の項目
ビッグデータのセキュリティ対策には、どんな心構え/対策が必要か。マカフィーが「企業が取り組むべき、10の項目」を公開した。 - なぜ、データベースセキュリティが必要か──企業の対策率「たった20%」の現状
本連載では、データベースセキュリティの「考え方」と「必要な対策」をおさらいし、Oracle Databaseを軸にした「具体的な実装方法」や「Tips」を紹介していきます。今回は、あらためて「なぜ、データベースセキュリティが必要なのか」を説明します。 - データベース暗号化が必要な「理由」と「3大方式」を理解する
本連載では、データベースセキュリティの「考え方」と「必要な対策」をおさらいし、Oracle Databaseを軸にした「具体的な実装方法」や「Tips」を紹介していきます。今回は、「なぜ、データベースを暗号化しなければならないのか」について解説します。