サーブレットの基礎知識

日本語を扱うときの留意点(出力時)にはどんなものがありますか?

テンアートニ 中越智哉
2001/1/19

 サーブレットからの日本語を含むHTMLを出力しようとしたとき、日本語の部分がブラウザ側で正しく表示されない(日本語がすべて「?」になってしまう)ことがあります。
この現象は、サーブレットから送信された文字のエンコーディングを明示的に指定していないために起こります。

 これを解決するためには、サーブレットから送信する文字のエンコーディングの種類を明示的に指定しなければなりません。
 Servlet 2.2では、HttpServletResponseクラスのsetContentTypeメソッドで「charset=」を使用してエンコーディングを指定しないと、ISO-8859-1(いわゆるLatin文字)で出力をエンコードする仕様になっています。ですから、何も指定しないと日本語はすべて「?」に変わってしまいます。こうなってしまうと、ブラウザ側でいくらエンコードに関する設定を変更しても対応できません(もともとの出力で「?」になってしまっているため)。

 ですから、出力に日本語が含まれる場合は、必ず出力のMIMEタイプにエンコーディングを指定する必要があります。例えば、以下のように設定します。

response.setContentType("text/html;charset=SJIS");
PrintWriter out = response.getWriter();

 こうすることによって、その後にgetWriter()メソッドで取得するPrintWriterでは、ここで指定したエンコーディングに変換されて出力されることが保証されます(注意:上の2行の順序を逆にすると、MIMEタイプの設定内容が反映されません。必ず上の順序で記述してください)。

 ここで指定するエンコーディングは、サーブレットを実行するプラットフォームのデフォルトのエンコーディングと一致する必要はありません。例えば、LinuxやSolarisでSJISを指定しても問題ありません。

 ただしブラウザの種類によっては、特定のエンコーディングを正しく解釈できない可能性もあるので、そういった場合はブラウザが正しく解釈できるエンコードを使用する必要があります。

(注:本記事では、 Servletのバージョンは、2.2を仮定しています)

[参考URL]
http://java.sun.com/products/servlet/2.2/javadoc/index.html

「Java Solution FAQ」



Java Agile フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Java Agile 記事ランキング

本日 月間