- - PR -
Xercesで文字が変わる
1
投稿者 | 投稿内容 |
---|---|
|
投稿日時: 2002-07-19 16:48
Xerces-cを使用していますが、Shift-jisで「槙」をよみそのまま出力すると「槇」に変わります。(その逆もあり)
JIS X 0209-1983で行われた文字の入れ替え22文字や、文字の移動4文字に関係あるように思えます(http://tohoho.wakusei.ne.jp/wwwkanji.htm)が、実際のところ内部ではどのコードを使用し、どのような変換が行われているのでしょう。 エンコードの指定が必要なのでしょうか。 (Aix4.3 / Xerces Version1.5 / C++) ※上記26文字は全て逆転します。 [ メッセージ編集済み 編集者: WANDA 編集日時 2002-07-19 16:49 ] |
|
投稿日時: 2002-07-29 12:14
Xerces の実装ミスかもしれません。
# IANA の Shift_JIS は 0208:1997 ですね encoding に Windows-31J を使ってみたらどうでしょうか? とと… xerces-c-src1_5_0/doc/faq-distrib.xml に <p>However, if you wish to parse XML files in any other encodings, say in Shift-JIS, Big5 etc., then you cannot use Xerces-C. なんて記述を見つけましたが… -- んー、1.5.0 にしろ 2.0.0 にしろ、自前のマップは持ってないようですから、 OS の iconv を使ってるんじゃないですかねぇ。 [ メッセージ編集済み 編集者: しょむ 編集日時 2002-07-29 13:17 ] |
1