- PR -

文字コードとか文字セットとか

1
投稿者投稿内容
みやも
ベテラン
会議室デビュー日: 2002/04/22
投稿数: 74
投稿日時: 2005-05-09 19:03
以下のコードがあったとして、

response.setContentType("text/html; charset=Windows-31J");

この説明として、
MIMEタイプと○○○をセットします。
の○○○に入れてOKなのは以下のどれでしょう?

・文字コード
・エンコード
・文字エンコード(character encoding)
・文字セット(character set)

個人的にはどれでも意味は通じる(OKかなぁ)ように思えるのですが、これらの言葉って厳密には違う意味なのでしょうか?このあたりにうるさい人がいらっしゃいましたらご教授ください。よろしくお願いします。
かずくん
ぬし
会議室デビュー日: 2003/01/08
投稿数: 759
お住まい・勤務地: 太陽系第三惑星
投稿日時: 2005-05-09 19:31
私の場合、

文字とコードのマップを文字セット。
ex)
ASCII(文字セットとしての)
JIS X208
UNICODE
etc

文字セットをコンピューター上でどのように扱うかをエンコーディング。
ex)
SHift-JIS
Windows-31J
utf-8
etc

したがって、今回の事例の場合は、エンコーディングのほうがヨサゲと思うのですがいかがなものでしょう > 文字コードやエンコーディングのえらい人

引用:

response.setContentType("text/html; charset=Windows-31J");

この説明として、
MIMEタイプと○○○をセットします。


[独り言]
#MIMEタイプってtext/htmlのことで、
#文字コードやエンコーディングのことじゃないような気がするが、気のせいだろうか?
##「送信データのエンコーディングとして○○○をセットします。 」
##のほうがいいような気が
###てゆうか、「送信データ」というのも微妙だなぁ
[/独り言]
みやも
ベテラン
会議室デビュー日: 2002/04/22
投稿数: 74
投稿日時: 2005-05-09 22:14
かずくんさん、回答ありがとうございます。


・文字セットが、文字の集合と文字の番号表
・エンコーディングは、符号化方式を決めたもの
ということですね。


>したがって、今回の事例の場合は、エンコーディングのほうがヨサゲと思うのですがいかがなものでしょう

意味を考えるとエンコーディングが適当ですね。

ただ、JavaDocのServletResponse#setContentType()を見ると、
「文字エンコーディング(character encoding)」なのですが、
charsetって「charcter set(文字セット)」の略だしなぁ、とか思うのです。



>MIMEタイプってtext/htmlのことで、
>#文字コードやエンコーディングのことじゃないような気がするが

MIMEタイプ "と" 文字エンコーディング
っていうので変ですかね?
かずくん
ぬし
会議室デビュー日: 2003/01/08
投稿数: 759
お住まい・勤務地: 太陽系第三惑星
投稿日時: 2005-05-10 00:03
引用:

・文字セットが、文字の集合と文字の番号表
・エンコーディングは、符号化方式を決めたもの
ということですね。


>したがって、今回の事例の場合は、エンコーディングのほうがヨサゲと思うのですがいかがなものでしょう

意味を考えるとエンコーディングが適当ですね。


私の妄想だけで確定せず、他の人の意見も待ってみましょう。

引用:

MIMEタイプと○○○をセットします。


嗚呼、MIMEタイプと[して]○○○をセットします。 と脳内補完してしまった。スマン。
みやも
ベテラン
会議室デビュー日: 2002/04/22
投稿数: 74
投稿日時: 2005-05-28 12:48
以下のページになんとなく分かる説明がありました。

http://www.studyinghttp.net/charset#Abstract

・文字セット (character set)
・文字コード (character code)
・文字エンコーディング (character encoding)


混乱の原因となっていたのは、多分、以下の部分でしょうか。

引用:
RFC 2616 においては、IANA にて登録されている、及びこれから登録されるであろう文字エンコーディングのみを議論するので、"文字セット" と "文字エンコーディング" の二語を同一視しています。




同じ意味に使っているので、どっちでもいいと。最初に戻ると、

response.setContentType("text/html; charset=Windows-31J");

の説明は、どれでも「間違い」ではないという感じでしょうか。

○MIMEタイプと「文字エンコーディング」をセットします。
○MIMEタイプと「文字セット」をセットします。
△MIMEタイプと「文字コード」をセットします。

一つ選ぶならJavaDocにならって「文字エンコーディング」にしとこうかな。。。

1

スキルアップ/キャリアアップ(JOB@IT)