- PR -

HttpRequestデータのサロゲート文字等判断について

1
投稿者投稿内容
未記入
会議室デビュー日: 2007/06/08
投稿数: 1
投稿日時: 2007-06-08 15:31
現在、ASP.NETでWebアプリケーションを開発しています。

Vista対応で、サロゲートペア文字や第3、第4水準文字を

全リクエストをハンドリングするglobal.asax.csで除外したいのですが

リクエストデータからサロゲートペア文字や第3、第4水準文字を

どう判断できるのかで困っています。

どなたかご存知ないでしょうか。

また、除外方法として他の方法をご存知でしたら教えてください。
かずくん
ぬし
会議室デビュー日: 2003/01/08
投稿数: 759
お住まい・勤務地: 太陽系第三惑星
投稿日時: 2007-06-08 17:57
MSDNのSystem.Stringnメンバのページを眺めれば、文字列を構成するひとつのコードポイント、
すなわち、System.Charオブジェクトを取得する方法がわかると思います。

次に、MSDNのSystem.Charメンバを眺めれば、指定されたコードポイントがサロゲート文字かどうかを判定する方法がわかると思います。

判定するだけなら、ここまでで何とかなると思います。

ここから、さらに文字を除去するとなると、かなり苦難の道が待ってます。
これは、ただ隣り合う二つのコードポイントをのぞけばOK、というわけではないからです。
文字が正規化されている場合、2つ以上のコードポイントで1文字を構成している可能性があるからです。

文字の除去については、私のUNICODEに関する拙い知識では、方法が思い浮かびません。
ただ言えることは、「死ねるね」ってことだけ。
biac
大ベテラン
会議室デビュー日: 2001/10/22
投稿数: 106
投稿日時: 2007-09-11 14:49
マルチポスト → http://forums.microsoft.com/TechNet-JA/ShowPost.aspx?PostID=1701826&SiteID=36
1

スキルアップ/キャリアアップ(JOB@IT)