UTF-8

8-bit UCS Transformation Format / ユー・ティー・エフ8

 Unicodeの文字を表現する文字エンコーディングスキームの1つ。8bit単位の情報の組み合わせで文字を表記する。

 Unicodeは、もともとUS-ASCIIコードとまったく互換性がないコード系として作成されたが、それでは運用上いろいろ不都合があるということで、US-ASCIIコードと互換性のある文字はUS-ASCIIコードと同じコード(0x00〜0x7f)に割り当て、それ以外の文字はUS-ASCIIコードで未定義の領域(0x80〜0xff)に、複数のコードの組み合わせとして割り当てるUTF-8が考案された。

 UTF-8は8bit単位で情報を並べるため、エンディアン問題は存在しない。

 UTF-8はUTF-16と並んで、広く利用されている。

関連記事

関連用語

リンク

XML & SOA フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

アイティメディアの提供サービス

キャリアアップ