- PR -

ファイルI/Oの文字コードについて

投稿者	投稿内容
へげもんベテラン会議室デビュー日: 2002/04/14 投稿数: 87 お住まい・勤務地: 埼玉県	投稿日時: 2003-01-06 12:12 JISAoutoDetectの実装がどの程度かは詳しく知りませんが、日本語文字コードの自動判別は、原理上、ある程度の長さの文字列で、漢字・ひらがななどの含有率が高くないと判別に失敗する可能性が高くなります。そのため、readLineで読み込むたびに自動判別させるのは、誤判別の可能性が高くなり、処理速度の上でも不利になります。そこで望ましい方式は、最初に複数行を読み込んで自動判別を行い、そのあと判別結果に基づいて明示的にエンコーディングを指定して、変換を行うことになると思います。
茶葉会議室デビュー日: 2002/12/28 投稿数: 10	投稿日時: 2003-01-06 14:41 × Windows31-J ○ Windows-31J かと。

投稿者

投稿内容

へげもん: ベテラン; 会議室デビュー日: 2002/04/14; 投稿数: 87; お住まい・勤務地: 埼玉県

投稿日時: 2003-01-06 12:12

JISAoutoDetectの実装がどの程度かは詳しく知りませんが、日本語文字コードの自動判別は、原理上、ある程度の長さの文字列で、漢字・ひらがななどの含有率が高くないと判別に失敗する可能性が高くなります。
そのため、readLineで読み込むたびに自動判別させるのは、誤判別の可能性が高くなり、処理速度の上でも不利になります。

そこで望ましい方式は、最初に複数行を読み込んで自動判別を行い、そのあと判別結果に基づいて明示的にエンコーディングを指定して、変換を行うことになると思います。

茶葉: 会議室デビュー日: 2002/12/28; 投稿数: 10

投稿日時: 2003-01-06 14:41

× Windows31-J
○ Windows-31J
かと。

«前のページへ 1|2

＠IT SpecialPR

ファイルI/Oの文字コードについて

スキルアップ／キャリアアップ（JOB@IT）