復号せずに複数の暗号化データの関連性を解析、NICTらが医療データ解析で実証:医療ビッグデータを安全に活用
NICTと筑波大学は、医療データを暗号化されたまま解析する技術「まぜるな危険準同型暗号」を利用して、医療データを復号せずに、解析対象のデータかどうかを判別できることを実証した。個人の遺伝情報と病気の罹患情報との統計的な関連性を、各個人の病気の有無や遺伝情報を知ることなく安全に解析できるため、医療ビッグデータを安全に活用しやすくなる。
情報通信研究機構(NICT)のセキュリティ基盤研究室と筑波大学は2018年7月18日、三重大学で教授を務める山田芳司氏の協力の下、医療データを暗号化したまま解析する技術「まぜるな危険準同型暗号」を用い、同暗号方式の性能を実証したと発表した。暗号化した医療データを復号せずに、解析対象データかどうかを判別できる。例えば個人の遺伝情報と病気の罹患(りかん)情報との統計的な関連性を、データを暗号化したまま安全に解析できといった利点があるという。
個人のプライバシーを保護した上で医療データを新たな治療法の開発などに活用しようとした場合、プライバシー保護の手段としては暗号化が有効だ。暗号化したデータに対して加算や乗算が可能な準同型暗号技術を利用したデータ解析技術の開発が進んでいる。
ただしデータを暗号化すると、そのままでは解析対象のデータかどうかを判別できなかった。判別するには復号する必要があり、プライバシー上の懸念がある。そのため従来は、解析対象外のデータの混入を検出できないまま解析を進めてしまい、誤った統計値が出力される恐れがあった。
NICTらが2016年に開発したまぜるな危険準同型暗号は、誤データ混入防止機能を持つ準同型暗号方式。データとは別に暗号化したキーワードを用い、同じキーワードに関連した暗号文に対してのみ準同型演算を許す。暗号文が同じキーワードに関連しているか否かを、キーワードそのものを知ることなく判定できる。
異なるキーワードに関連した暗号文に対して準同型演算を行った場合は警告を発し、警告を無視して準同型演算を行っても、復号時にそれを判定する機能を備えている。
暗号技術の実証実験として、今回、病気の罹患情報と遺伝情報を解析対象データとして、「ある病気に罹患していること」と「ある遺伝的特徴を持つこと」の統計的な関連性を解析した。解析値として「遺伝的特徴を持ち、かつ、病気に罹患している人の数の暗号文」を計算した結果、4500人程度のデータから、病気の罹患情報と個人の遺伝情報との統計的な関連性を1分弱で得た。さらに異なる病気の医療データの暗号文が混在した場合、数ミリ秒程度で検出できることを確認した。
NICTと筑波大学によれば「同技術によって、対象外のデータが混入していないことを暗号理論的に証明した上で、収集した医療データを、プライバシーを保護したまま解析できる。これにより新たな診断方法や治療法の早期かつ効率的な発見につながることが期待される」という。
なお、暗号化データ解析手法の研究開発は、NICTと筑波大学が共同で行った。NICTは暗号化データ解析ツールの開発を、筑波大学は医療データ検定方法の検討を担当した。実証実験には、三重大学がデータベース化した臨床情報と遺伝情報のデータを用いた。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- クラウドサービスに最適な暗号方式とは?――暗号化したまま計算する「準同型暗号」
情報漏えいの懸念があるクラウドの世界では、データを暗号化して保持するのが安全です。しかし従来の暗号方式では、暗号化されたデータを計算するときにいったん復号を行う必要があり、ネットワークやクライアントマシンに負荷がかかってしまいます。今回はこの問題を解決するための「準同型暗号」について解説します。 - 暗号化技術を支えているのは「信頼」だった
情報セキュリティを支える「暗号化技術」の背景にはどのような理論があり、その安全性はどのようにして検証されているのでしょうか。@IT連載「クラウド時代の暗号化技術論」筆者であるサイボウズ・ラボ 光成滋生氏に聞きました。 - まだまだ広く深い、暗号の世界――匿名認証や電子投票に利用される「ブラインド署名」「グループ署名」「ゼロ知識証明」
最終回となる第8回では、匿名認証などに用いられるデジタル署名である「ブラインド署名」や「グループ署名」、相手に情報を与えずに自分が情報を持っていることを証明する「ゼロ知識証明」を紹介します。