Windows OSのコマンドプロンプト上でテキスト処理をする場合、基本的にはShift-JIS(シフトJIS)コードのテキストファイルしか扱えない。その他の文字コードのテキストを扱う場合は、Shift-JISに変換する必要がある。「メモ帳」アプリやnkfコマンドなどで文字コードを変換する方法を解説する。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
対象:Windows 10/11
文書ファイルを開いたら文字化けして読めなかったり、CSVファイルをExcelに読み込んだら日本語部分が変な記号になっていたりした経験はないだろうか。これらは、文字コードが異なっているのが原因であるケースが多い。
日本語版Windows OSでは、長らくShift-JIS(シフトJIS)がデフォルトの文字コードとして使われてきた。そのため、アプリケーションの多くが、日本語の文字コードとしてShift-JISを前提として作られている。
ただ、最近では「メモ帳」アプリやLinux用Windowsサブシステム(WSL)などのように、多言語が扱えるUTF-8をデフォルトとしているアプリやシステムが増えている。そのため、作成するアプリケーションによって、扱える文字コードが異なる場合があり、場合によって文字コードの変換が必要になる。
そこで、本Tech TIPSではWindows 10/11で文字コードを変換する方法を紹介する。
ファイルの文字コードを変換する最も簡単な方法は、「メモ帳」アプリを使う方法だろう(Tech TIPS「【Windows 10】キミは『メモ帳』アプリの実力を知らない?」も参照してほしい)。
まず、「メモ帳」アプリを起動し、[ファイル]−[開く]を選択して、変換したいテキストファイルを開く。次に[ファイル]−[名前を付けて保存]を選択して、[名前を付けて保存]ダイアログで、「文字コード」のプルダウンリストで変換先の文字コードを選択して、[保存]ボタンで保存すればよい。
例えば、各種記事などで紹介されているレジストリファイル(.regファイル)を作成する場合、「メモ帳」アプリで入力して、単純に保存してしまうと、文字コードは「UTF-8」になってしまう。しかし、レジストリファイルは「UTF-16LE」で保存する必要があるので、保存する際に[名前を付けて保存]ダイアログの「文字コード」のプルダウンリストで「UTF-16LE」を選択しなければならない。
また、Shift-JISのテキストファイルを、Linux用Windowsサブシステム(WSL)で処理したい場合も、事前にUTF-8に変換しておく必要がある。このような場合は、「メモ帳」アプリでテキストファイルを開いた後、[名前を付けて保存]ダイアログの「文字コード」のプルダウンリストで「UTF-8」を選択して、[保存]ボタンで保存すればよい。
「メモ帳」アプリやIEを使って文字コードを変換するのは手軽だが、変換したいファイルの数が多かったり、作業を自動化したりするのには不向きだ。
Copyright© Digital Advantage Corp. All Rights Reserved.