- - PR -
ファイルI/Oの文字コードについて
| 投稿者 | 投稿内容 |
|---|---|
|
投稿日時: 2003-01-06 12:12
JISAoutoDetectの実装がどの程度かは詳しく知りませんが、日本語文字コードの自動判別は、原理上、ある程度の長さの文字列で、漢字・ひらがななどの含有率が高くないと判別に失敗する可能性が高くなります。
そのため、readLineで読み込むたびに自動判別させるのは、誤判別の可能性が高くなり、処理速度の上でも不利になります。 そこで望ましい方式は、最初に複数行を読み込んで自動判別を行い、そのあと判別結果に基づいて明示的にエンコーディングを指定して、変換を行うことになると思います。 |
|
投稿日時: 2003-01-06 14:41
× Windows31-J
○ Windows-31J かと。 |
