- PR -

整形式でないのにエラーださない 

1
投稿者投稿内容
やべっち
会議室デビュー日: 2003/07/06
投稿数: 17
投稿日時: 2003-09-16 16:53
書き込みは初めてです。よろしくお願いいたします。
XML文書の整形式検証という基本的な問題なんです。

『環境』 J2SDK1.4.1.04 (xerces1.4.4-j)
     WINDOWS XP
     xml文書文字コード:UTF-16

単純なコードですが、
DOMParser parser = new DOMParser();
parser.parse(xml文書絶対パス);
で確認することはできております。ですが、長い文書(といっても4Kb程度)
を食わせると、整形式でない場合でも「パース成功」という結果が出てきます。

全てがそういうわけではなく
 ・<11test>test</test>
といった開始タグが数字で始まればエラーを検出します。
同様に、タグを消去しても同じようにエラーを検出します。

ただ、
 ・<testaa>test<test>
といったように、命名規則に沿っているが開始・終了タグが一致していない場合に
エラーを出さないことがあります。短い文書ならエラーを検出します。
検索中に、xerces1.2では、大きなファイル未対応と拝見したのですが。

何かご存知の方、アドバイスいただければ幸いです。
よろしくお願いいたします。

P.S マルチバイトファイル名はxerces対応していないのですか?
   (例:テスト.xml、 c:デスクトップ\a.xml など)
1

スキルアップ/キャリアアップ(JOB@IT)