Linux Tips

Unicodeのテキストファイルをほかの文字コードに変換するには

北浦訓行
2003/5/22

 Unicodeのテキストファイルをほかの文字コードに変換するには、lvコマンドを使うといい。lvコマンドは多国語に対応したテキストファイルビューアで、lessの代わりに使われることが多いが、文字コードの変換にも使用できる。

 例えば、UTF-8でエンコードされたUnicodeテキスト(file.txt.utf8)をEUC(file.txt.euc)に変換するには、以下のコマンドを実行する。

$ lv -Oej file.txt.utf8 > file.txt.euc

 なお、lvで指定できるコード系の主なオプションは、以下のとおりだ。

  -A<coding-system> すべてのコード系をcoding-systemにする
  -I<coding-system> 入力ファイルのコード系をcoding-systemにする
  -K<coding-system> キーボードのコード系をcoding-systemにする
  -O<coding-system> 出力のコード系をcoding-systemにする

 coding-systemは、以下のものが指定できる。

 
coding-system
内容
 
a
自動選択(入力ファイルのみ)
 
c
iso-2022-cn
 
j
iso-2022-jp
 
k
iso-2022-kr
 
e
Extended Unix Code
 
ec
euc-china
 
ej
euc-japan
 
ek
euc-korea
 
et
euc-taiwan
 
u
UCS transformation format
 
u7
UTF-7
 
u8
UTF-8
 
l1〜l9
iso-8859-1〜9
 
s
shift-jis
 
b
big5
 
r
rawモード

Linux Tips Index



 Linux Squareフォーラム Linux Tipsカテゴリ別インデックス
インストール/RPM ブート/ブートローダ
ファイル操作 環境設定
ユーザー管理 コンソール/ターミナル
X Window System セキュリティ
トラブルシューティング 他OS関係
ネットワーク ハードウェア
Webサーバ Samba
GNOME KDE
OpenOffice.org エミュレータ
ソフトウェア そのほか/FAQ
全Tips公開順インデックス Linux Tips月間ランキング
Linux Squareフォーラム全記事インデックス

MONOist組み込み開発フォーラムの中から、Linux関連記事を紹介します


Linux & OSS フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Linux & OSS 記事ランキング

本日 月間