PPDM活用の前に「個人情報」「プライバシー」の今を知る匿名化技術とPPDM(1)(1/2 ページ)

本連載では、今後、データを活用する際に必須の知識になると考えられているプライバシー保護データマイニング(PPDM)技術の手法を体系的に整理して紹介していきます。第1回の今回は、PPDMの前段階となる、匿名化、プライバシーなどの議論や留意点を紹介します。

» 2014年11月20日 11時30分 公開
[美馬正司日立コンサルティング]

連載バックナンバー

 「プライバシー保護データマイニング(PPDM)」という言葉を聞いたことはあるでしょうか? PPDMはビッグデータ活用などの議論が進むのに併せて注目を集めつつある技術の一つで、「プライバシーを保護しつつ、データから有用な情報の抽出を試みるための技術の総称」とされています。

 本連載では、まず、データを扱うために理解しておくべき、個人情報やプライバシー保護に関する直近の議論を整理し、その注意点を示します。その上で、データを安全に活用する際に有効な手法であるPPDMの多様な手法を紹介していきます。

義務としての「個人情報保護」と新しい課題

 個人情報保護法は、誰もが安心してIT社会の便益を享受するための制度基盤として2005年4月に施行されました。これは個人情報の有用性に配慮しながら、個人の権利利益を保護することを目的としており、氏名などの特定の個人を識別できる情報(個人情報)を5000件以上所持する事業者に対して、それらの情報を取り扱うルールを制定したものです。

 個人情報保護法の施行から10年近くが経過した今、IT技術の進歩によって、POSやオンラインでの行動履歴、さらにはSNSのコメントや位置情報など、個人の活動を推定することが可能なデータが格段に増えています。これらの情報は、必ずしも個人を特定できるとは限らず、現在、このような個人情報に該当しない可能性がある情報を含め、個人に関する情報を広く「パーソナルデータ」と呼んでいます。

 現在、パーソナルデータの取得や利活用においては、個人のプライバシーへの配慮が不十分であるとして、たびたび議論に挙がっています。この「プライバシー」については明確な定義がなく、個人によって捉え方が違いますが、概していうと、個々人が「知られたくない個人的な情報」をみだりに公開され、第三者に知られ、不快に感じることをプライバシーの侵害ということができます。中には、これらの情報を収集すること自体をプライバシーの侵害と呼ぶ声もあります。

個人情報とプライバシーは似て非なるもの

 ここで、個人情報とプライバシーの位置付けについて明確にしておきましょう。個人情報保護法は、事業者が個人情報をどう扱うべきかを定めたもので、国が事業者を規定するものです。一方のプライバシーとは、憲法13条の「すべて国民は、個人として尊重される」という条文にある、生命、自由、幸福に対する国民の権利を侵したり、民法710条の「他人の身体、自由若しくは名誉を侵害した場合又は他人の財産権を侵害した場合(略)、財産以外の侵害に対しても、その賠償をしなければならない」という条文にあるように、個人に被害を及ぼす情報が不正に公開されたりした場合に、プライバシーを侵害されたとして、個人が事業者などを訴えるもの、と理解できます。

 つまり、プライバシーの侵害については、各個人がどのように感じるか、受け取るかが大きな要素となるため、取り扱いが非常に難しいという問題をはらんでいます。特に事業者が常に気を付けなければならないのは、個人情報に該当しないと考えられるパーソナルデータであっても、その取り扱いによっては、プライバシー侵害として訴えられるケース、あるいは炎上して問題化するケースなどが起こり得る、というリスクです。

「特定」「識別」情報と「パーソナルデータ」の範囲

 では、企業や組織がプライバシーを保護するためにはどうすればよいでしょうか。

 個人情報保護法では、個人情報を「特定の個人を識別することができるもの(他の情報と容易に照合することができ、それにより特定の個人を識別することができるものを含む)」と規定しています。つまり、特定の個人として識別されるということの「蓋然(がいぜん)性(その事象が実現される確実性)」が判定基準になりますが、プライバシーという点では、この部分が明確でないところに個人の側に「気持ちの悪さ」が生じます。

 例えば、個人の購買履歴が集積したデータがあった場合、特異な嗜好(しこう)品や非常に高額な製品などから、購買した人が特定できる可能性もゼロではありません。従って、ここに気持ち悪さが生じます。一方、街中にいる人の数をグラフ化した場合、東京駅に自分がいたからといって、東京駅のグラフの公開はプライバシーの侵害にはなりません。これは、その数字の塊だけでは誰のデータなのかを第三者が特定することができないという蓋然性が、誰が見ても明らかだからです。つまり、第三者が実際に特定の個人を識別することに確実性があるか否かで、プライバシーに配慮できているかどうかについて、一定の判断ができるといえます。

 では、特定の個人が識別されるリスクを低減するにはどうすればよいのでしょうか。そこで有効と考えられているのが匿名化技術です。匿名化とは、データをひも解いていっても、ある特定の個人にデータが戻らないようにすることをいいます。匿名化に際して、検討するデータの特性はもう一段分解すると二つに分けることができます。一つは、「識別性(=あるデータが一人の人のデータと分かるかどうか)」、もう一つは「特定性(=あるデータが誰のデータであるか分かるかどうか)」です。

 そして、匿名化された情報は、ある一人の人のデータであることは識別できるが個人までは特定できない「識別非特定情報」と、一人の人だとも分からないし、個人とも特定できない「非識別非特定情報」の2種類に分類できます。

 個人情報保護法の改正では、「識別非特定情報」を含む「個人の特定性を低減したデータ」をどのように使っていくのか、どのように規定していくのか、ということが焦点になっています。今後、企業は「個人情報」だけでなく、「パーソナルデータ」を扱う機会が格段に増え、プライバシーを保護するという観点からも、特定性、識別性という観点により一層、注意していく必要があります。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。