- PR -

XMLのCDATAセクションの扱いについて

1
投稿者投稿内容
みーちく
大ベテラン
会議室デビュー日: 2002/08/29
投稿数: 131
投稿日時: 2005-01-20 10:19
みーちくです。

XMLファイルから必要なデータを抽出し、HTMLを作成するプログラムを
作成中です。
XMLファイルにCDATAセクションが使われていた場合、
特殊文字をどのように処理すればよいのか、悩んでおります。
特殊文字変換テーブル等を実装したクラス等を作成し、
変換処理をするのでしょうか。
何か方法などありましたら、ご教授願います。

また、現在JAXPのDOMで作成していのですが、他のXMLパーサーで
上記のような処理ができるのであれば、変更は可能です。

よろしくお願いいたします。

(開発環境)
WindowsXP/Eclipse3.0/jwsdp-1.5/j2sdk1.4.2_06
山本 裕介
ぬし
会議室デビュー日: 2003/05/22
投稿数: 2415
お住まい・勤務地: 恵比寿
投稿日時: 2005-01-20 11:05
>特殊文字をどのように処理すればよいのか、悩んでおります。
なにをどう悩んでいるのでしょうか?パーサをりようする側としては気にすることはないと思います。
それとも XML パーサを実装しようとしているのでしょうか?
MMX
ぬし
会議室デビュー日: 2001/10/26
投稿数: 861
投稿日時: 2005-01-20 12:08
XSLT では
xsl:output method="html"
で HTML表示用に処理します。
DOMなどで処理した後に XSLT transform を空通し(恒等変換)してもできるでしょう。
または、その逆で HTML化処理したXMLを DOMで操作。
HTMLで文字番号参照化する文字を判定して Ⓡ などに変換を自前でする?


[ メッセージ編集済み 編集者: MMX 編集日時 2005-01-20 14:09 ]
みーちく
大ベテラン
会議室デビュー日: 2002/08/29
投稿数: 131
投稿日時: 2005-01-20 12:15
インギさん

返信ありがとうございます。

JAXPのDOMを使用して、XMLファイルの中身を標準出力しております。(テスト用)
CDATAセクションの文字列を標準出力した場合に、「(R)←丸Rです。」
等のデータがあった場合に、どうすればよいのか。
という事で悩んでおります。

実際、標準出力では「?」と表示されました。

よろしくお願いいたします。
みーちく
大ベテラン
会議室デビュー日: 2002/08/29
投稿数: 131
投稿日時: 2005-01-20 18:32
MMXさん

返信ありがとうございます。
「transform」ですね。
いろいろ試してみます。

ありがとうございました。
1

スキルアップ/キャリアアップ(JOB@IT)