文字参照

CharacterReference

 文字参照は、文字を直接記述するのではなく、間接的にISO/IEC-10646(Unicode)の文字コードの形で記述する構文である。構文は、実体参照と似通っている。しかし、実体と異なり、定義しなくても参照することができる。

 以下に文字参照の使用例を示す。第1の例は文字参照を使用しない場合である。第2の例は、16進数表記の文字参照を使用した例である。第3の例は10進数表記の文字参照を使用した例である。

<hiragana>あ</hiragana>

<hiragana>&#x3042;</hiragana>

<hiragana>&#12354;</hiragana>

 16進数表記の文字参照は、アンパサント記号(&)、シャープ記号(#)、アルファベット小文字x、文字コード、セミコロン記号(;)の順に表記する。

 10進数表記の文字参照は、アンパサント記号、シャープ記号、文字コード、セミコロン記号の順に表記する。

 記述する文字コードは、UTF-8やUTF-16の表現ではなく、ISO/IEC-10646(Unicode)規格書で示されるU+XXXX形式の抽象的な文字コードを用いる。そのため、文字エンコーディングスキームの違いによって、表記が変わることはない。シフトJIS、EUC-JP、ISO-2022-JPなどを使用する場合もやはりISO/IEC-10646(Unicode)のコード値で記述する。これにより、シフトJIS、EUC-JP、ISO-2022-JPなどでXML文書を記述する場合でも、ISO/IEC-10646(Unicode)に存在するすべての文字を書き込むことができる。

関連記事

関連用語

リンク

XML & SOA フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

アイティメディアの提供サービス

キャリアアップ