WebページをXHTMLに変換したい
すでに社内にHTMLで書いたWebページが幾つもあります。これをXHTMLに変換したいのですが、何かよい変換ツールはあるでしょうか

回答/富士ソフトABC株式会社 技術調査室
2001/3/13

 現在のところ、HTML文書をXHTML文書に機械的に変換するためのキラーツールは存在しないようです。しかし、PerlやJavaなどのスクリプトで書かれた変換ツールはインターネット上で多数公開され、そのテクニックの数々が紹介されています。WebページのデータをHTMLからXHTMLへ変換しておくと、XML対応のツールでさまざまなデータ加工が可能になりますので、今後こうしたニーズは高まってくるでしょう。

 XHTMLへ変換したいという潜在的なニーズは高いはずですから、いずれ有力ベンダから完成度の高い変換ツールが提供されるようになると思われますが、それまでは下記に紹介するようなインターネット上の情報を参考に自作するのが早道でしょう。

 上記は非常に参考になります。また、変換ツールではありませんが、HTMLを含む一般的な形式の文書を読み込んで表示し、XHTML文書として保存できる製品もあります。

  • ジャストシステム社「インターネットワープロ一太郎 Ark」 http://www.justsystem.co.jp/ark/ichitaro_ark/index.html
     一太郎Arkでは、以下のファイル形式がサポートされています。
    ・HTML 4.0(読み込み/保存可)
    ・XHTML 1.0(読み込み/保存可)
    ・テキスト(読み込み/保存可)
    ・一太郎Ver.5〜10(読み込み可)*1 *2
    ・MS-WORD(Ver.6/95/97/98/2000)、 RTF(読み込み可)*1
    ・Zip圧縮テキスト(読み込み/保存可)
    ・Zip圧縮HTML 4.0(読み込み/保存可)
    ・Zip圧縮一太郎8〜10(読み込み可)*1
    ・GZip圧縮テキスト(読み込み/保存可)
    ・GZip圧縮一太郎8〜10(読み込み可)*1 *2
    *1 テキストと一部の簡単な文字装飾や、文字揃え、インデントの読み込みが可能
    *2 一太郎7〜10形式は罫線の読み込みが可能

 この製品はJavaで開発されておりソースも公開されているので、自動変換ツールを作成するのに参考になります。ただしライセンスの問題を含めて、ソースの取り扱いには細心の注意が必要です。

 

「Ask XML Expert」

 



XML & SOA フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

HTML5+UX 記事ランキング

本日月間