- - PR -
HttpRequestデータのサロゲート文字等判断について
1
投稿者 | 投稿内容 |
---|---|
|
投稿日時: 2007-06-08 15:31
現在、ASP.NETでWebアプリケーションを開発しています。
Vista対応で、サロゲートペア文字や第3、第4水準文字を 全リクエストをハンドリングするglobal.asax.csで除外したいのですが リクエストデータからサロゲートペア文字や第3、第4水準文字を どう判断できるのかで困っています。 どなたかご存知ないでしょうか。 また、除外方法として他の方法をご存知でしたら教えてください。 |
|
投稿日時: 2007-06-08 17:57
MSDNのSystem.Stringnメンバのページを眺めれば、文字列を構成するひとつのコードポイント、
すなわち、System.Charオブジェクトを取得する方法がわかると思います。 次に、MSDNのSystem.Charメンバを眺めれば、指定されたコードポイントがサロゲート文字かどうかを判定する方法がわかると思います。 判定するだけなら、ここまでで何とかなると思います。 ここから、さらに文字を除去するとなると、かなり苦難の道が待ってます。 これは、ただ隣り合う二つのコードポイントをのぞけばOK、というわけではないからです。 文字が正規化されている場合、2つ以上のコードポイントで1文字を構成している可能性があるからです。 文字の除去については、私のUNICODEに関する拙い知識では、方法が思い浮かびません。 ただ言えることは、「死ねるね」ってことだけ。 |
|
投稿日時: 2007-09-11 14:49
マルチポスト → http://forums.microsoft.com/TechNet-JA/ShowPost.aspx?PostID=1701826&SiteID=36
|
1