Excelで作成した表に、環境依存文字が使われていることがある。こうした環境依存文字は、他の環境で文字化けを起こしたり、CSV形式に変換すると正しく文字が出力されなかったりする。場合によっては、人名などの一部が欠落するなどの問題が発生することもあるので注意が必要だ。そこで、表中に環境依存文字が含まれていないかどうかをチェックする方法を紹介しよう。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
対象:Excel 2013/2016/2019/2021/365
Excelで作成した表に、環境依存文字(機種依存文字)が使われていないだろうか。環境依存文字である認識もなく、日本語入力システム(IME)の変換で入力できることから、「(株)」や「平成」「cm」を1文字で表現できる特殊文字を利用しているケースを見かける。また、Webページ上のデータを収集するなどすると、文字コードがUTF-8になっている記号や異字など、意図せずに環境依存文字が含まれてしまうことがある。
こうした環境依存文字は、他の環境で文字化けを起こしたり、CSV形式に変換すると正しく文字が出力されなかったりする。また、通常の表記と特殊文字が混在していると、検索でヒットしないなどの問題も発生しがちだ。
総務省統計局が公開した各府省が政府統計の総合窓口(e-Stat)に掲載する統計表の表記方法の統一ルール「統計表における機械判読可能なデータの表記方法の統一ルールの策定」の13ページ「チェック項目1-10 機種依存文字を使用していないか」においても、「機種依存文字は利用者の環境によっては正しく表示されないなどの可能性がある」としており、「機種依存文字は使用しないこと」としている。
そこで、本Tech TIPSでは、表内に環境依存文字が含まれていないかどうかを確認する方法を紹介しよう。
なお、文字コードを「UTF-8」にしてCSV形式で保存し、環境依存文字を含むデータとして保存する方法は、Tech TIPS「Excel CSV形式ファイルにおける今どきUTF-8文字コード問題の傾向と対策」を参照してほしい。
Excelの関数を使って簡単にチェックできればいいのだが、残念ながらセル内の文字列全体の文字コードを調べるような機能はExcelにはない。マクロを使えばチェックできるが、それなりのプログラミングが必要になり、ハードルが高い。
そこで、Webサービスやフリーソフトウェアの環境依存文字をチェックできるツールを活用するのが手軽だ。
簡単にチェックするのであれば、イー・エージェンシーの「さぶみっと!」が提供している「機種依存文字チェッカー」や秋田大学の片平昌幸氏が提供している「機種依存文字チェッカ」などを利用するとよい。「機種依存文字チェッカー」は、チェックできる文字数が5万文字に制限されるが、実用上は問題ないだろう。
ここでは「機種依存文字チェッカー」を使ってチェックする方法を紹介しよう。
Excelでチェックしたい表を開き、表中のセルを選択、[Ctrl]+[A]キーを押し、表全体を選択する。[Ctrl]+[C]キーで表全体をクリックボードにコピーする。
Webブラウザで「機種依存文字チェッカー」を開き、入力ボックスに[Ctrl]+[V]キーで貼り付けてから、[機種依存文字をチェック]ボタンをクリックすればよい。
新しいタブにチェック結果が表示される。環境依存文字が含まれている場合は、「|」で囲まれた赤い文字が環境依存文字なので、Excelの表中の該当する文字を修正すればよい。
伊月めい氏が提供している環境依存文字をチェックできるツール「Code Check」を利用する方法もある。
Webブラウザで「Code Check」ページを開き、「ccheck.lzh」をダウンロードする(206KBほど)。「ccheck.lzh」を7-zipなどで解凍し、lzhファイル内の「ccheck.exe」を適当なフォルダに展開しておく。
Copyright© Digital Advantage Corp. All Rights Reserved.