WebページをXHTMLに変換したい | |
すでに社内にHTMLで書いたWebページが幾つもあります。これをXHTMLに変換したいのですが、何かよい変換ツールはあるでしょうか |
回答/富士ソフトABC株式会社 技術調査室
2001/3/13
現在のところ、HTML文書をXHTML文書に機械的に変換するためのキラーツールは存在しないようです。しかし、PerlやJavaなどのスクリプトで書かれた変換ツールはインターネット上で多数公開され、そのテクニックの数々が紹介されています。WebページのデータをHTMLからXHTMLへ変換しておくと、XML対応のツールでさまざまなデータ加工が可能になりますので、今後こうしたニーズは高まってくるでしょう。
XHTMLへ変換したいという潜在的なニーズは高いはずですから、いずれ有力ベンダから完成度の高い変換ツールが提供されるようになると思われますが、それまでは下記に紹介するようなインターネット上の情報を参考に自作するのが早道でしょう。
- 「HTML Compatibility Guidelines」(http://www.w3.org/TR/xhtml1/#guidelines)、
- 「HTML検証サービス」(http://validator.w3.org/)、
- 「HTML Tidy」フリーソフト (http://www.w3.org/People/Raggett/tidy/)
上記は非常に参考になります。また、変換ツールではありませんが、HTMLを含む一般的な形式の文書を読み込んで表示し、XHTML文書として保存できる製品もあります。
- ジャストシステム社「インターネットワープロ一太郎
Ark」 http://www.justsystem.co.jp/ark/ichitaro_ark/index.html
一太郎Arkでは、以下のファイル形式がサポートされています。
・HTML 4.0(読み込み/保存可)
・XHTML 1.0(読み込み/保存可)
・テキスト(読み込み/保存可)
・一太郎Ver.5〜10(読み込み可)*1 *2
・MS-WORD(Ver.6/95/97/98/2000)、 RTF(読み込み可)*1
・Zip圧縮テキスト(読み込み/保存可)
・Zip圧縮HTML 4.0(読み込み/保存可)
・Zip圧縮一太郎8〜10(読み込み可)*1
・GZip圧縮テキスト(読み込み/保存可)
・GZip圧縮一太郎8〜10(読み込み可)*1 *2
*1 テキストと一部の簡単な文字装飾や、文字揃え、インデントの読み込みが可能
*2 一太郎7〜10形式は罫線の読み込みが可能
この製品はJavaで開発されておりソースも公開されているので、自動変換ツールを作成するのに参考になります。ただしライセンスの問題を含めて、ソースの取り扱いには細心の注意が必要です。
「Ask XML Expert」 |
XML & SOA フォーラム 新着記事
- QAフレームワーク:仕様ガイドラインが勧告に昇格 (2005/10/21)
データベースの急速なXML対応に後押しされてか、9月に入って「XQuery」や「XPath」に関係したドラフトが一気に11本も更新された - XML勧告を記述するXMLspecとは何か (2005/10/12)
「XML 1.0勧告」はXMLspec DTDで記述され、XSLTによって生成されている。これはXMLが本当に役立っている具体的な証である - 文字符号化方式にまつわるジレンマ (2005/9/13)
文字符号化方式(UTF-8、シフトJISなど)を自動検出するには、ニワトリと卵の関係にあるジレンマを解消する仕組みが必要となる - XMLキー管理仕様(XKMS 2.0)が勧告に昇格 (2005/8/16)
セキュリティ関連のXML仕様に進展あり。また、日本発の新しいXMLソフトウェアアーキテクチャ「xfy technology」の詳細も紹介する
|
|