Unicode

ユニコード

 Unicodeは、私企業の団体であるThe Unicode Consortium(ユニコードコンソーシアム)が作成した、全世界の文字を包含する情報処理用の符号化文字集合である。

 Unicodeそのものは私的な仕様だが、同等といわれているUCSはISOやJISの規格として成立している。

 Unicodeは、当初、1文字を16bitで表現することが特徴だとされていたが、これは二重の意味で間違っている。Unicodeは16bitを最小単位として考える文字コード系だが、複数の単位で1文字を構成するための合成用文字を含んでおり、1文字イコール16bitという事実は存在しない。ただし、日本語で通常使用する文字に限って言うと、1文字イコール16bitと考えても差し支えなかったのは事実である。また、現在は、最小単位2個で1文字を表現するサロゲートペアと呼ばれる機能が規定されているため、やはり1文字イコール16bitという前提を置くことはできない。サロゲートペアを持つ文字エンコーディングスキームをUTF-16と呼ぶ。

 1990年代半ばには、Unicodeは米国による日本文化侵略であるというような論調の批判が多方面から発生したが、その多くは事実無根の錯覚によるもので、事実が知れ渡るにつれて、このような批判は沈静化した。

関連記事

関連用語

UCS
UTF-8
UTF-16

リンク

XML & SOA フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

アイティメディアの提供サービス

キャリアアップ