Unicode
ユニコード
Unicodeは、私企業の団体であるThe Unicode Consortium(ユニコードコンソーシアム)が作成した、全世界の文字を包含する情報処理用の符号化文字集合である。
Unicodeそのものは私的な仕様だが、同等といわれているUCSはISOやJISの規格として成立している。
Unicodeは、当初、1文字を16bitで表現することが特徴だとされていたが、これは二重の意味で間違っている。Unicodeは16bitを最小単位として考える文字コード系だが、複数の単位で1文字を構成するための合成用文字を含んでおり、1文字イコール16bitという事実は存在しない。ただし、日本語で通常使用する文字に限って言うと、1文字イコール16bitと考えても差し支えなかったのは事実である。また、現在は、最小単位2個で1文字を表現するサロゲートペアと呼ばれる機能が規定されているため、やはり1文字イコール16bitという前提を置くことはできない。サロゲートペアを持つ文字エンコーディングスキームをUTF-16と呼ぶ。
1990年代半ばには、Unicodeは米国による日本文化侵略であるというような論調の批判が多方面から発生したが、その多くは事実無根の錯覚によるもので、事実が知れ渡るにつれて、このような批判は沈静化した。
XML & SOA フォーラム 新着記事
- QAフレームワーク:仕様ガイドラインが勧告に昇格 (2005/10/21)
データベースの急速なXML対応に後押しされてか、9月に入って「XQuery」や「XPath」に関係したドラフトが一気に11本も更新された - XML勧告を記述するXMLspecとは何か (2005/10/12)
「XML 1.0勧告」はXMLspec DTDで記述され、XSLTによって生成されている。これはXMLが本当に役立っている具体的な証である - 文字符号化方式にまつわるジレンマ (2005/9/13)
文字符号化方式(UTF-8、シフトJISなど)を自動検出するには、ニワトリと卵の関係にあるジレンマを解消する仕組みが必要となる - XMLキー管理仕様(XKMS 2.0)が勧告に昇格 (2005/8/16)
セキュリティ関連のXML仕様に進展あり。また、日本発の新しいXMLソフトウェアアーキテクチャ「xfy technology」の詳細も紹介する
|
|