PDF誕生から30年、AIの進化でPDFはますます重要になる PDF Association:紙+手書き署名から電子署名、公開鍵暗号化、その先へ
PDF Associationは、30年にわたって進化しつつ人々のコミュニケーションやビジネスに大きな影響を与えてきたPDFが、AI技術の登場により、これから何が起こるのか予測した。
PDFの仕様策定や普及を推進するPDF Association(以後、PDFA)は2023年6月15日(米国時間)、PDFの誕生から30年を迎えたことを受け、30年間でデジタルドキュメントにどのような変化が起きたのか、これから何が起こるのか予測した。
1993年はHTMLとPDFが初めて仕様化された年であり、2023年現在、それぞれの用途で両方とも主流になっている。HTMLとPDFは、それぞれ深く関連しつつ、異なるニーズを満たすために共存している。Webは人間の情報体験に革命をもたらす一方、PDFは紙の文書をデジタルに置き換えた。
PDFAのCEOであるダフ・ジョンソン氏は次のように述べている。
「『デジタルドキュメントもWebに置き換わる』と予想する人もいたが、PDFは今日も成長し続けており、多くのWebサイトは特定のPDFを見つけるためのナビゲーションとして存在している。おそらくそれがHTMLに次いでインターネット上で2番目に一般的なフォーマットとなっている理由だろう」
1993年に何が起こったか?
インターネットが登場した1980年代以降、1993年初頭まで、エンドユーザーのインターネットリソースへのアクセスは、主にテキストのみのディスカッショングループとGopherのような原型的Webプロトコルで構成されていた。
1993年に登場したWebブラウザの「Mosaic」は、HTMLを活用し、テキスト、画像、レイアウト、スタイリング、フォント、スクリプトなど、必要なリソースがリクエストに応じてどこからでも組み立てられるという、ビューイングソフトウェアが体験をコントロールする新しい時代を生み出した。
1993年、AdobeがPDFレファレンスを無料公開する決定とともに「Adobe Acrobat」と「Acrobat Reader」が市場に登場し、他の多くの商用およびオープンソースのアプリケーションが続いた。HTMLと同様、開発者なら誰でも最初からPDFを読み書きできた。一方でHTMLとは異なり、閲覧ソフトウェアではなく表示するファイル自体が、体験をコントロールした。
今日のPDFは、オープンなISO標準であり、信頼性の高いデジタル文書のプレゼンテーションとして、世界的なベンダー中立の技術エコシステムであるPDFAのメンバーにより維持されている。
誕生から現在まで、デジタルドキュメントはどう変わったか
PDFは、かつて紙の文書を使っていたのと同じように、デジタルドキュメントをデジタルで拡張性のあるツールで利用することを可能にした。HTMLやPDFはユーザーがデバイスやOSを自由に選択できる。しかし、HTMLはインターネット接続が必要であり、PDFはリモートサーバやWebが閲覧できない場面でも利用できる。
PDFAは、30年前に登場したPDFが、世界中のコミュニケーションやビジネスに与えた影響は、どれだけ強調しても強調しすぎることはないとした上で、1993年当時と2023年現在で、デジタルドキュメントの使用方法がどう変化したのか、次の表にまとめた。
使用方法 | 1993年 | 2023年 |
---|---|---|
テキストコンテンツ | 白黒のテキストが主流 フォントは限定 | 色、透明度、特殊効果、絵文字、世界言語、高度なタイポグラフィー、数式など |
画像 | 低解像度、限られた色、遅い | 高解像度、広色域、HDR、高度な圧縮、豊富なメタデータ |
閲覧方法 | 紙 | ユーザーが選択したデバイス上のビュワーソフトウェア、レスポンシブなレイアウト、オプションとしての紙 |
共有方法 | 郵便および配送サービス デバイスおよびベンダーに依存する電子ドキュメント | 電子メール、クラウドサービス、どこでも任意のデバイスでアクセス、一貫性のある信頼性の高い表示 |
署名 | 手書き署名 | デジタル証明書によるデジタルおよび電子署名、長期検証、取り消し、否認防止、改ざん検出などデータベースエントリ |
整理法 | プリンタを利用し、ホッチキスやクリップで保存 多くの手作業が必要 | 画面上で手動または自動操作 Nアップ、自動仕上げ、ホッチキス留めや製本などさまざまなメディアのサイズと形状に対応 |
分類 | フォルダとラベル | メタデータ、履歴情報、コンテンツベースの自動分類 |
保存法 | 配布管理、カギ付きファイリングキャビネット | パスワード、公開鍵暗号化、動的アクセス制御、改ざん検出、デジタルおよびタイムスタンプ署名、デジタル著作権管理(DRM) |
フォームへの記入 | ペン(または鉛筆)と紙 | HTMLまたはPDFの入力可能なフォームへの入力、データ入力時の検証、コンテキスト依存の検証、オートコンプリート、自動入力 |
再編集 | グリスペン、コピー機 | 墨消しツールとワークフロー |
検索 | カード目録 サイロ化されたデータベース | 高速検索エンジンとAI(人工知能)、補足データ(添付ファイルやMathML表現など) |
コンテンツの検出 | OCR、コピー&ペースト | コンテンツ認識、データマイニング、ビッグデータ、AI |
アクセシビリティー | 点字、拡大鏡、アナログオーディオテープ | 支援技術(AT)、論理構造、セマンティクス、画像の代替テキスト、MathML、ナビゲーション支援機能 |
コメントとレビュー | 紙にペンでマークアップ、コメントを手動で調整、オリジナルを編集、再共有を繰り返す | マルチユーザーのライブコメント、立地マークアップ、ビデオ会議、クラウドベースの交換 |
リッチメディア | 不可能 | サウンド、ムービー、アニメーション、リッチメディア、3D、クロスプラットフォーム、Webコンテンツへのリンクなど |
ペーパーキャプチャー | 低解像度スキャンからビットマップへ | 高解像度スキャンによるリッチドキュメント、OCR、HCR、自然言語認識 |
アーカイブ | 紙と磁気テープ | クラウドストレージ、データベース、即時検索と取得 |
AIの進化で求められる「コンテンツの正確性」
HTMLとPDFの仕様が初めて登場してから30年が経ち、URLがドキュメントの代替として使われている場面も珍しくない。しかし、WebサイトやWebページのURLは、変更や消滅も多く、エンドユーザーの手に負えない。そのため、多くのユーザーは、コンテンツを「記録」する手段として、いまだにスクリーンショットや「Wayback Machine」に頼っている。しかし、ピクセルだけで保存できる情報は限られており、何も証明することはできないだろう。
PDFAは、こうした課題に対し、保存したコンテンツの正確性を証明する手段としてPDFを推奨している。PDFは、情報を自己完結的で信頼できるオブジェクトとして永続させ、「ドキュメンタリー」やコミュニケーションのニーズに応えることを目的として、情報を記録できる。
今日、進化する状況、特にAIの導入が進み、PDFのような正確で信頼できるProvenance(来歴)の確保と維持が、重要かつ緊急の課題になりつつある。日常的な問題としてPDFの来歴情報の提供を標準化することは、C2PA(Coalition for Content Provenance and Authenticity)のようなイニシアチブの原動力の一部にもなる。
ダフ・ジョンソン氏は次のように述べている。
「PDFは既に来歴証明のためのメカニズムを幾つか提供しているが、今後、AIが進化する未来では、透明性向上とアクセシビリティーの強化をより強く求められることになるだろう。われわれは、30年後の2053年に情報技術がどうなっているかを予測できない。しかし、人間が情報を伝達する必要がある限り、永続的で信頼性の高いポータブルなドキュメントフォーマットが必要であることは、合理的に予測できる。仮にPDFが存在しないなら、われわれがそれを発明しなければならない」
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- NASAが「約800万個のPDF」を格納した世界最大規模のアーカイブを公開
NASAのジェット推進研究所は世界最大級のPDFアーカイブを作成したと発表した。プライバシーの保護や脆弱性への対処、ソフトウェアの互換性に関する問題などセキュリティの研究に活用できるという。 - 米国DARPAがツール提供、ファイルフォーマットの脆弱性を軽減する「ドキュメントセキュリティ」とは?
DARPAは、Safe Documentsプログラムの成果として、人々が安全であることを確信してドキュメントを開き、画面に表示されるまでのプロセスを信頼できるようにする新しい方法とツールを開発した。 - ExcelだけでファイルをPDFに変換する
Excelで作成した見積書などを送付したい場合、PDFに変換して送るのはよくあることだ。Excelでは、簡単にPDFに変換することが可能だ。その方法を2種類紹介する。