- PR -

Xercesで文字が変わる

1
投稿者投稿内容
WANDA
会議室デビュー日: 2002/07/19
投稿数: 1
投稿日時: 2002-07-19 16:48
Xerces-cを使用していますが、Shift-jisで「槙」をよみそのまま出力すると「槇」に変わります。(その逆もあり)
JIS X 0209-1983で行われた文字の入れ替え22文字や、文字の移動4文字に関係あるように思えます(http://tohoho.wakusei.ne.jp/wwwkanji.htm)が、実際のところ内部ではどのコードを使用し、どのような変換が行われているのでしょう。
エンコードの指定が必要なのでしょうか。
(Aix4.3 / Xerces Version1.5 / C++)
※上記26文字は全て逆転します。


[ メッセージ編集済み 編集者: WANDA 編集日時 2002-07-19 16:49 ]
しょむ
ぬし
会議室デビュー日: 2001/09/06
投稿数: 430
投稿日時: 2002-07-29 12:14
Xerces の実装ミスかもしれません。
# IANA の Shift_JIS は 0208:1997 ですね

encoding に Windows-31J を使ってみたらどうでしょうか?

とと…
xerces-c-src1_5_0/doc/faq-distrib.xml に

<p>However, if you wish to parse XML files in any other
encodings, say in Shift-JIS, Big5 etc., then you cannot
use Xerces-C.

なんて記述を見つけましたが…

--
んー、1.5.0 にしろ 2.0.0 にしろ、自前のマップは持ってないようですから、
OS の iconv を使ってるんじゃないですかねぇ。


[ メッセージ編集済み 編集者: しょむ 編集日時 2002-07-29 13:17 ]
1

スキルアップ/キャリアアップ(JOB@IT)