- - PR -
[jdk1.3.1]全角文字を指定バイトで区切る方法
| 投稿者 | 投稿内容 | ||||
|---|---|---|---|---|---|
|
投稿日時: 2004-03-18 11:02
あー、そうでしたね…すみません、間違いでした。 | ||||
|
投稿日時: 2004-03-18 11:36
全角文字も、キャラクタセットによってバイト数が違ったと思うのですが、 このあたりは大丈夫なんでしょうか? (たしか、EUCやUTF-8は全角文字(の大部分)が3バイトのはず・・・) 実行するプラットフォームによって、結果が変わってきそうなんですが | ||||
|
投稿日時: 2004-03-18 12:24
EUCは通常の(いわゆる)全角文字は2バイト、半角カナが2バイト、補助漢字が3バイトですね。 #半角カナと補助漢字はシングルシフトを使うため | ||||
|
投稿日時: 2004-03-18 13:28
ご指摘ありがとうございます。 「大部分」じゃなくて「一部」でしたね。 うーん、生半可な知識で書き込むとすぐにボロが出ちゃうなぁ(爆) | ||||
|
投稿日時: 2004-03-18 13:43
R-55です。
確かにClusterさんの言う通り環境依存になってしまいますね。 うっかりしていました。 ですがこのスレッドの目的からすると何らかの文字コードに限定して 処理したいようなのでこれでいいということでしょうか。 | ||||
