|
.NET TIPS
サロゲート文字かどうかを判定するには?[C#、VB]
デジタルアドバンテージ 一色 政彦
2008/04/10 |
|
|
Windows Vistaの登場などにより、(エンド・ユーザーによって)Unicodeのサロゲート文字が入力される可能性が出てきている。そこで本TIPSでは、1つの文字(=Charクラスのオブジェクト)がサロゲート文字かどうかを調べる方法を説明する。
なお、サロゲート文字(もしくはサロゲート・ペア文字)とは、通常「1文字=2bytes」のところが、「1文字=4bytes」となることがある文字のことだ。
文字がサロゲート文字かどうかを判定するには、Charクラス(System名前空間)の静的メソッドIsSurrogateを使用する。Char.IsSurrogateメソッドのパラメータに1文字を渡すと、戻り値でサロゲート文字か(True)そうでないか(False)を返す。
次のコードは、「る」という文字列の最初の1文字目がサロゲート文字かどうかを判定するコンソール・アプリケーションのサンプル・プログラムである。
using System;
class Program
{
static void Main(string[] args)
{
// 文字列「叱る」
string moji = "\uD842\uDF9Fる";
// サロゲート文字の判定
bool surrogate = Char.IsSurrogate(moji[0]);
Console.WriteLine(surrogate);
// 出力結果:
// True
}
} |
Module Module1
Sub Main()
' 文字列「叱る」
Dim moji As String = ChrW(&HD842) & ChrW(&HDF9F) & "る"
' サロゲート文字の判定
Dim surrogate As Boolean = Char.IsSurrogate(moji. Chars(0))
Console.WriteLine(surrogate)
' 出力結果:
' True
End Sub
End Module |
|
サロゲート文字かどうかを判定するコンソール・アプリケーションのサンプル・プログラム【.NET Framework 2.0以降】(上:C#、下:VB) |
サロゲート文字が含まれている文字列は、「Stringオブジェクトで取得できる文字列の長さ」と「実際の文字数」が異なることがあるので注意が必要だ。詳しくは「TIPS:文字数を正確にカウントするには?(サロゲート文字対応)」を参照してほしい。
|
generated by
|
|
Insider.NET 記事ランキング
本日
月間