5分で分かるオープンデータ:データ資源活用の基礎(1)(2/5 ページ)
にわかに話題になり始めた「オープンデータ」だけれど、その現状は? 実際には何ができる? Linked Open Dataとは? ざっと理解するオープンデータのこれからと、ビジネス創出の可能性。
2分:これまでの情報公開と何が違うのか?
行政データの公開と聞くと、「既に『情報公開請求』や『政府統計総合窓口(e-Stat)』、各行政機関のWebサイトでのデータ公開などがあるのでは?」と疑問を持つ方もいるのではないでしょうか。現在、政府が進めているオープンデータ政策が従来の情報公開とどう異なるのか、3つのポイントに沿って説明します。
(1)オープンライセンス
各行政機関のWebサイトの利用規約では、そもそも利用条件が不明であることや、データの改変や商用目的でのデータ利用に関しては許諾を得なければならないことが多く、このことがデータ利用のハードルとなっています。
この課題に対応するため、データを公開する際にオープンライセンスを基本とすることが世界的な潮流となっています。オープンライセンスとは、「誰もが自由に利用、再利用、再配布可能」という、利用上の制約が極めて少ない権利形態です。DATA.GO.JPの掲載データに採用されているライセンス「CC BY」は、世界中で広く使われているライセンス表示「クリエイティブ・コモンズ・ライセンス(CCライセンス)」の一種で、出典を明示することで当該データの自由な二次利用が認められます。CCライセンスは6種類のライセンスから構成され、この他にCC BYに商用利用の禁止を加えた「CC BY-NC」、データの改変禁止を加えた「CC BY-ND」などがあります。
このようなオープンライセンスの取り組みを通じ、利用者はデータの利用条件を容易に確認できるようになると同時に、より多くの用途にデータを利用できるようになります。
また、オープンライセンスに関して国内では、政府のWebサイトの利用規約を統一的に見直す動きがあり、規約のひな型となる「政府標準利用規約(第1.0版)」が2014年6月に政府内で決定されました。この規約では、データの出典およびデータを加工した場合はその旨を表示することで、原則的にWebサイト上のデータを自由に利用可能としており、今後は各機関のWebサイトにのみ掲載されているデータについても、二次利用する際の条件が大きく緩和される見通しです。
(2)機械判読可能
行政が自由な二次利用を認める形でデータを公開していても、それがPDFやJPEGなどのデータ形式では、コンピュータープログラムなどが数字や文字などのデータを取り込むことができません。これに対し、コンピュータープログラムなどが表形式のデータなどから情報を読み込み、処理を行えるデータ形式を「機械判読可能なデータ形式」と呼び、オープンデータ政策においてはこのような形式でデータを公開していくことを目標に掲げています。
機械判読可能な形式で公開されたデータは、コンピューターで加工などの処理が容易に行えるため、再利用性が高く、民間から高いニーズがあります。DATA.GO.JPの利用状況に関するレポート(PDF)においても、機械判読可能なデータほどアクセスが多い傾向が指摘されています。
(3)オープンフォーマット
オープンフォーマットは、CSVやXMLなど、特定の商用ソフトウェアに依存しないデータ形式を指します。データをオープンフォーマットで公開することにより、誰もがデータを活用できるようになります。
このように、オープンデータは従来の情報公開と異なり、民間における再利用を意識した政策であることに特徴があります。オープンライセンス、機械判読可能、オープンフォーマットの3つのポイントを押さえたデータ公開により、民間事業者はデータの取得(データの利用条件に関する問合せなど)や加工(PNGファイルやPDFファイルからのデータ抽出など)に掛かるコストが削減され、容易に行政機関の公開データを活用できるようになります。
政府では、「統計」「地理空間」「予算・決算」などの分野のデータをオープンデータとして積極的に公開していくこととしています。これらのニーズの高いデータが利用しやすい状態で提供されることで、ビジネスにおけるオープンデータの利用がさらに広がると予想されます。
Copyright © ITmedia, Inc. All Rights Reserved.