データとして活用したい表が画像でしかない場合、表を見ながら、手動でMicrosoft Excelに入力していないだろうか。Excelの画像認識機能を使ったり、オンラインツールを使ったりすると、簡単に画像から表データに変換できる。その手順を紹介する。
対象:Excel 2016/2019/2021/365
データとして活用したい表が画像でしかなく、仕方なく表を見ながら「Microsoft Excel(エクセル)」に手動で入力したことはいないだろうか。こうした作業は面倒だし、場合によっては入力ミスも起こりがちだ。何らかの手段を使って、入力を省力化したいのではないだろうか。
そこで、本Tech TIPSでは、画像にしかない表をExcelにデータとして取り込む方法を紹介しよう。ただし、画像の状態によっては正確なデータとしては取り込めず、手動による修正が必要になる場合があるので注意してほしい。
Excel 365(Excel for Microsoft 365)を利用しているのならば、[データ]タブの[データの取得と変換]グループに[画像から]というアイコンがあるのではないだろうか。もし、[画像から]アイコンがないのであれば、[ファイル]−[アカウント]を開き、「Microsoft 365とOfficeの更新プログラグ」の[更新オプリョン]アイコンをクリックして、[今すぐ更新]を選択して、最新版に更新すると、[画像から]アイコンが表示されるはずだ。
[データの取得と変換]グループの[画像から]を使って、画像の表からデータを抽出するには、2つの方法がある。1つは画像ファイルを読み込ませる方法で、もう1つはスクリーンキャプチャーを使う方法だ。
画像ファイルを読み込ませる方法は、[画像から]アイコンをクリックして、[ファイルからの画像]を選択、[図の挿入]ダイアログが開くので、ここで表が含まれた画像ファイルを選択すればよい。
スクリーンキャプチャーを使う方法は、Snipping Toolなどのスクリーンキャプチャーアプリを使い、表部分をキャプチャーしてクリップボードに保存する。この際、なるべく解像度の高い画像としてキャプチャーすると、認識率を高められる。[画像から]アイコンをクリックして、[クリップボードからの画像]を選択すると、キャプチャーした表が読み込まれる。
シートの右側に[画像からのデータ]ペインが開き、画像認識が実行され、画像から表データを抽出する。ペインの上部には読み取った画像が、下部にはそこから抽出した表データが表示される。表データのセルを選択すると、自動的に画像の該当する部分が拡大表示される。データが表示された入力ボックスが表示されるので、画像を見ながら、データを修正、[同意する]ボタンをクリックして、そのセルの値を確定していく。なお、正しく読み取れていないと判断されたセルは、さくら色(Windows OSのモードなどによっては赤色)の背景で表示される。
幾つかの表で試したが、ある程度高い解像度でキャプチャーした画像でないと、読み取り精度が落ちてしまうようだ。なるべく表を大きく表示して、キャプチャーするとよいだろう。
画像から表データを抽出する方法として、オンラインツール(Webサービス)を使う方法がある。主なオンラインサービスは、以下の通りだ。
いずれも無料で利用でき、画像ファイル(JPEGもしくはPNG)をドラッグ&ドロップすると、画像からOCRで表データを抽出してくれる。日本語OCRに対応しており、試した限り比較的精度の高かった「OnlineConvertBox」を例に、画像の表をデータに変換する手順を紹介しよう。
Webブラウザで「OnlineConvertBox(https://onlineconvertbox.com/jp/ocr/png-excel)」ページを開き、[ファイルを選択]ボタンの部分に変換したい表の画像データをドラッグ&ドロップする。
[変換]ボタンが表示されるので、これをクリックする。ログインが求められるので、GoogleもしくはFacebookのアカウントでログインするか、メールアドレスを入力して受信した確認コードを入力してログインする(メールアドレスでログインしたい場合は、右上の[サインアップ]をクリックしてメールアドレスを認証しておくとよい)。
ログインが完了したら、再び[変換]ボタンをクリックすると、ファイルのアップロードと変換が実行される。変換が完了したら、表示された[ダウンロード]ボタンをクリックすると、XLSXファイルがダウロードできる。画像の解像度が低いと、漢字などが誤認識されてしまうようだ。Excelの「画像から」機能と同様、なるべく解像度の高い画像ファイルを使うとよい。
生成AI(人工知能)を使って、画像からExcelの表データに変換することも可能だ。ただ、画像の状況やプロンプトへの指示の仕方によって、単純に抽出できないこともあるので注意してほしい。
ここでは、ChatGPT、Microsoft Copilot、Perplexityの各チャットAIで試してみた。いずれも各サービスに無料アカウントでサインインした状態で試してみた。そのため、パーソナライズ機能が有効になっている点に注意してほしい。また、生成AIの特性上、ここで試した結果と異なる出力になる可能性にも留意していただきたい。
ChatGPTは、画像から表データを抽出できたものの、CSVファイルに出力しようとしたところで、無料版でデータ解析できる回数を超えてしまった。Plusプランにすることで、画像から表データの抽出ができそうだ。
Microsoft Copilotは、プロンプトへの入力に問題があるのか、残念ながら画像から表データを抽出できず、表の内容について解説するような回答しか得られなかった。
Perplexityは、無料版では画像のアップロードをサポートしていないため、データを抽出することはできなかった。試しにPro版でサインインして、試したところ、簡単に画像から表データが抽出できた。ただ、CSVファイルへの出力しようとすると、Pythonを使ってCSVファイルを出力するプログラムが表示されたり、データの「,(カンマ)」がそのままの状態でカンマ区切りのCSVファイルを出力したりしたため、何度かのやりとりが必要になった。
最終的には、CSVファイルへの出力ができ、精度的にも問題ないレベルであった。上手に使えば画像から表データの抽出ができそうだ。
Copyright© Digital Advantage Corp. All Rights Reserved.