UTF-16

16-bit UCS Transformation Format / ユー・ティー・エフ16

 Unicodeの文字を表現する文字エンコーディングスキームの1つ。16bit単位の情報の組み合わせで文字を表記する。

 当初、Unicodeの文字エンコーディングスキームは1つしかなく、固有の名前はなかった。(UCSにおいては、UCS-2と呼ばれるものに相当した)。これに対して、16bitの最小単位2個で1文字を表現するサロゲートペアと呼ばれる機能が規定されたことにより、この機構を含む文字エンコーディングスキームに、UTF-16という固有の名前が与えられた。

 UTF-16は、16bitを最小単位とするため、8bitを前提としたシステムでは、エンディアン問題が発生する。ビッグエンディアンを使用するか、リトルエンディアンを使用するかは、意識して利用しなければならない。

 UTF-16はUTF-8と並んで、広く利用されている。

関連記事

関連用語

リンク

XML & SOA フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

アイティメディアの提供サービス

キャリアアップ