- PR -

テキストでの奇妙な符号についての疑問

投稿者投稿内容
wfwfang
会議室デビュー日: 2006/08/24
投稿数: 9
投稿日時: 2006-08-25 13:23
引用:

ueさんの書き込み (2006-08-24 15:29) より:
こんにちは。

引用:

つまり0Dは■
で、0Aは↑
であるという結果になりました。



CR や LF が奇妙な表示になるのは、エンコーディングの問題ではなく、メモ帳 というソフトに特有の問題だと思います。



−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
日本語は上手じゃないが、いっぱい書きましたが問題の中心を
はっきり説明していなかったので申し訳ございません

もう一度問題を整理させていただきます。

Windowsのメモ帳で、認識できない0D、0A(あるいは制御コードであるため、認識できるが表示できない)を無理矢理に表示させると、■や↑が表示され、なぜ別の符号が表示されないのか。○、ж、£...などたくさんあるんじゃないですか。

問題は、0Dと■の、0Aと↑の対応関係はどこで記述されているこどです。

ueさんのご意見は大変参考になりました。ODが別の記号じゃなくて、ただ■だけに表示するのは、やはりメモ帳というアプリケーション自体の仕様でしょうか。

実験として、同じコードを他のアプリケーション(WordPad、Office Wordなど)で開いたら、■などの符号は表示されませんでした。



[ メッセージ編集済み 編集者: wfwfang 編集日時 2006-08-25 14:58 ]
mio
ぬし
会議室デビュー日: 2005/08/25
投稿数: 734
お住まい・勤務地: 神奈川県
投稿日時: 2006-08-25 13:36
つまり、0x0dと0x0aというコードから、どうしてそのグリフが出てきたのか?
ということなんでしょうか。
なんでそうなるのか、そうしているかは分かりませんが、コードとしては0xffedと0xffeaのグリフが出るようです。

[ メッセージ編集済み 編集者: mio 編集日時 2006-08-25 13:37 ]
Yam
大ベテラン
会議室デビュー日: 2003/09/13
投稿数: 179
お住まい・勤務地: だんじり祭りの地
投稿日時: 2006-08-25 13:43
メモ帳は月を指している指のようなものです。
指先にこだわってはいけません。月を見るのです。
ぽぴ王子
ぬし
会議室デビュー日: 2006/03/24
投稿数: 475
お住まい・勤務地: お住まい:城・勤務地:城
投稿日時: 2006-08-25 14:41
引用:

wfwfangさんの書き込み (2006-08-25 13:23) より:

日本語は上手じゃないので、いっぱい書きましたが問題の中心を
はっきり説明していなかったので申し訳ございません


ん?日本語圏の方ではないのでしょうか。そのあたりも書いておくと皆さん行間
を読んでくれたかもしれませんね。とは言え、質問自体には言葉としての問題は
全然なかったですが。
(むしろ wfwfang さんよりも判別不能な日本語を書く日本人が多いのが気に
なる)

引用:

Windowsのメモ帳で、認識できない0D、0A(あるいは制御コードであるため、認識できるが表示できない)を無理矢理に表示させると、■や↑が表示され、なぜ別の符号が表示されないかをになって、○、ж、£...などたくさんあるんじゃないですか。

問題は、0Dと■の、0Aと↑の対応関係はどこで記述されているこどです。


それは私たちにはわかりませんし、メモ帳を作ったマイクロソフトに聞くしかない
と思います。
mio さんの投稿によれば 0xffed と 0xffea が表示されているとのことなので、
0xffe0 + コード のグリフが表示されているのではないかと推測するぐらいはで
きますが。
_________________
ぽぴ王子@わんくま同盟
ぽぴ王子の人生プログラミング中 / ぽぴンち。
wfwfang
会議室デビュー日: 2006/08/24
投稿数: 9
投稿日時: 2006-08-25 15:06
ぽぴ王子さんの書き込み (2006-08-25 14:41) より:

引用:

ん?日本語圏の方ではないのでしょうか。



中国から参りました。
今東京のあるコンピュータ関連の会社に働いています(新人1年目)。

いろいろ分らないこと(いろんな面で)がありますが、
とにかくこのスレッドに、
おかげさまで上手な質問する方法を覚えました。
ありがとうございます。
小僧
ぬし
会議室デビュー日: 2002/08/14
投稿数: 526
投稿日時: 2006-08-25 15:31
wfwfangさん、ようこそ日本へ。

文字として表示できない文字コードを画面に表示する
場合、該当する文字をどう出すのかはプログラムの作り
に依存します。メモ帳(というよりもWindowsの標準的なテキスト
入力用部品かも知れませんが)は、表示できない文字コード
が入力された場合、表示できる文字と同じ流れで処理を
行っているため、見た目に変な文字が表示されてしまうという
ことだと思います。同じテキストファイルを、別のエディタ
(秀丸など)で開くと、メモ帳とは違う文字表示になると思います。
これは、そのプログラムが
「表示できない文字コードが含まれていたら、別の文字に置き換えよう」
とか
「表示できない文字コードは削除して、表示できる文字だけにしよう」
という考えで表示処理を行うようにできているからメモ帳とは動きが
異なるのです。
メモ帳の仕様は、表示できない文字コードを○、ж、£などの文字として
表示するような仕様では無いということです。

皆さんからたくさんの書き込みがあったと思うので、既にご理解されて
いるかもしれませんが。

がんばって技術を身に着けて下さい。



[ メッセージ編集済み 編集者: 小僧 編集日時 2006-08-25 15:33 ]
wfwfang
会議室デビュー日: 2006/08/24
投稿数: 9
投稿日時: 2006-08-28 18:20
仕組みはようやく分りました。
テキストアプリケーションの仕様次第ですね。
どうもありがとうございます。

スキルアップ/キャリアアップ(JOB@IT)