UTF-8
8-bit UCS Transformation Format / ユー・ティー・エフ8
Unicodeの文字を表現する文字エンコーディングスキームの1つ。8bit単位の情報の組み合わせで文字を表記する。
Unicodeは、もともとUS-ASCIIコードとまったく互換性がないコード系として作成されたが、それでは運用上いろいろ不都合があるということで、US-ASCIIコードと互換性のある文字はUS-ASCIIコードと同じコード(0x00〜0x7f)に割り当て、それ以外の文字はUS-ASCIIコードで未定義の領域(0x80〜0xff)に、複数のコードの組み合わせとして割り当てるUTF-8が考案された。
UTF-8は8bit単位で情報を並べるため、エンディアン問題は存在しない。
UTF-8はUTF-16と並んで、広く利用されている。
XML & SOA フォーラム 新着記事
- QAフレームワーク:仕様ガイドラインが勧告に昇格 (2005/10/21)
データベースの急速なXML対応に後押しされてか、9月に入って「XQuery」や「XPath」に関係したドラフトが一気に11本も更新された - XML勧告を記述するXMLspecとは何か (2005/10/12)
「XML 1.0勧告」はXMLspec DTDで記述され、XSLTによって生成されている。これはXMLが本当に役立っている具体的な証である - 文字符号化方式にまつわるジレンマ (2005/9/13)
文字符号化方式(UTF-8、シフトJISなど)を自動検出するには、ニワトリと卵の関係にあるジレンマを解消する仕組みが必要となる - XMLキー管理仕様(XKMS 2.0)が勧告に昇格 (2005/8/16)
セキュリティ関連のXML仕様に進展あり。また、日本発の新しいXMLソフトウェアアーキテクチャ「xfy technology」の詳細も紹介する
|
|