第1回 CGMサイト構築で悩む負荷対策と拡張性の確保

林田 幸一
株式会社Cuon

2008/8/4

アプリケーションレイヤにおける対策(続き)

3. キャッシュを効果的に利用する

 多くの処理では、同じ処理の繰り返しによりサーバのリソースと無駄な時間を消費している。キャッシュを使うとサーバの負荷が大幅に軽減し、処理速度が上がり、ユーザーも快適にサイトを利用できるようになる。

 CGMサイトの構築上、キャッシュがなくてはサイトとして成り立たないほどに必要なものであるが、多くの方法が存在する。本連載では、HTTPロードバランサ上でのメモリキャッシュと、memcachedによるセッション情報キャッシュとクエリ結果キャッシュ、Railsのキャッシュ機能(フラグメントキャッシュ)を紹介する予定だ。

 HTTPロードバランサは、ネットワーク機器の中でも初めにリクエストを受け取る装置であり、またメモリキャッシュであるため、HTTPロードバランサ上でのメモリキャッシュはApacheとmod_mem_cacheで実現できる。頻繁に更新されない特定のデータ、例えばCSSやJavaScript、画像データなどはHTTPロードバランサ上のメモリにキャッシュさせる。

 ただし、サイズが大きいデータをメモリにキャッシュさせてしまうと、メモリが不足してしまう可能性が高い。その場合にはメモリキャッシュではなく、ディスクキャッシュ(Apacheのmod_disk_cache)にすると良い。

## mod_mem_cache ######
CacheEnable mem /images →http://site.jp/images配下をキャッシュ
CacheEnable mem /javascripts →http://site.jp/javascripts配下をキャッシュ
CacheEnable mem /stylesheets →http://site.jp/stylesheets配下をキャッシュ
MCacheSize 1048576 →1GBまでキャッシュ
MCacheMaxObjectCount 10000
MCacheMinObjectSize 1
MCacheMaxObjectSize 512000
MCacheRemovalAlgorithm LRU
CacheIgnoreHeaders Set-Cookie
CacheIgnoreNoLastMod on
## mod_mem_cache ######
httpd.confの設定例。images、javascripts、stylesheets配下をキャッシュさせている

 memcachedとは、オブジェクトをメモリにキャッシュするデーモンプログラムのことで、アクセス数の多いWebサイト(Wikipediaなど)においてデータベースの負荷を減らすために利用されることが多い。

 データをHDDに書かず、メモリ上で扱うため動作は高速である。しかし、レプリケーション機能など障害時対応機能がないため、デーモンが消えてしまうとデータも失われてしまうのが難点である。

 RoRでは、多くのセッションストアが用意されている(セッションストアについてはセッション管理の項で解説する)。Webアプリケーションサーバが1台であれば問題ではないが、HTTPロードバランサにより複数台のWebアプリケーションサーバにアクセスがランダムに振り分けられるようになると、複数のWebアプリケーションサーバ間のセッション情報共有が必要となる。

 セッション情報の共有の方法として、データベースに格納して共有する方法と、memcachedでメモリ共有する方法が存在する。しかし、セッション情報というアクセス頻度が高いデータを取り扱うにはメモリを使う方が高速であると判断した。

 図2のように、セッション情報はmemcachedを使用して、独立したサーバ(MemCacheサーバ)のメモリ上に格納されている。そして、複数のWebアプリケーションサーバからセッション情報の共有が可能になっている。

図2 MemCacheサーバによるセッション情報キャッシュ

 さらなる工夫として、ネットワーク負荷軽減とmemcachedの障害時対応を考慮している。通常のサービス用のネットワーク負荷を軽減するために、Webアプリケーションサーバとmemcached間のデータのやりとりは別ネットワークを使用した。

 また、memcachedには残念ながらレプリケーション機能などの障害時対応機能がない。そこで、memcachedのデーモンがダウンした場合に備えてセッション情報をデータベース格納に切り替える仕組みを導入をしている。この方法については、後日、掘り下げて解説したい。

 クエリ結果もキャッシュすることで、データベースへのアクセスを減らすことができる。MySQLにもクエリ結果のキャッシュする機能が存在するが、MySQLのキャッシュ機能はテーブル内のレコードが1件でも変更された場合、キャッシュをクリアしてしまう。

 しかし、memcachedのキャッシュの場合は、明示的に、キャッシュから削除をしたり、キャッシュに有効期限を設定したりしない限り、キャッシュがクリアされることはない。従って、更新頻度が高いテーブルなどはmemcachedを使った方がキャッシュ効果が高くなる。

 RoRにも3つのキャッシュ機能が存在する。ページキャッシュ、アクションキャッシュ、フラグメントキャッシュである。

 ページキャッシュは、最もシンプルに、ユーザーがある特定のURLに初めてアクセスした際に生成されるHTMLをキャッシュ保存する。キャッシュ呼び出しは、Webサーバで実行されるためRailsが呼び出しされない分、効率が良い。

 アクションキャッシュは、コントローラが呼び出された際に、そのコントローラのbeforeフィルタが実行され、すでにキャッシュされている場合は、次回からそのアクションは呼び出されない仕組みである。

 フラグメントキャッシュは、ページの部分的なキャッシュをする仕組みだ。サイドバーやフッタなど、動的ページのうち一部に静的情報が含まれた際などに役立つ。

 これらのキャッシュ機能は、状況に応じて使い分けることで大幅にサーバの負荷を軽減し、処理速度を上げることができる。ライフパレットでは、ほぼ全ページが動的ページであり、サイドバーやフッタなど一部に静的ページが含まれる構造だったため、フラグメントキャッシュを利用している。

4. スループットの向上策

 負荷対策・拡張性の確保のほかに、サイト全体のスループットを向上させるための施策としてApacheモジュールである「mod_expires」と「mod_deflate」を使った2つの策を紹介する。

 更新頻度が少ないファイルに対して、Webサーバから毎回応答を返すのは無駄である。そこで、Expiresヘッダをレスポンスに追加することで、ロードを繰り返す必要がないCSSやJavaScriptや画像データの有効期限を設定する。

 つまり、mod_expiresによって「このファイルは、有効期限の○○日までは、リロードしない」というルールを追加する。これらのファイルの有効期限を延ばすことで、リロード数(リクエスト回数)を減らし、パフォーマンス向上が図れるのである。

## mod_expires ######
ExpiresActive On
ExpiresByType text/css "access plus 1 days"
ExpiresByType text/javascript "access plus 1 days"
ExpiresByType application/x-shockwave-flash "access plus 1 days"
ExpiresByType image/gif "access plus 1 days"
ExpiresByType image/jpeg "access plus 1 days"
ExpiresByType image/png "access plus 1 days"
## mod_expires ######
httpd.confの設定例。それぞれ有効期限を1日後に設定している

 一方、mod_deflateを使うとサーバ通信のデータを圧縮化し帯域を節約することができる。ライフパレットでは、画像以外のテキストデータ(画像ファイルはすでにデータ圧縮されており、またサーバおよびブラウザでの圧縮/解凍処理のオーバーヘッドの方が大きくなるため)をデータ圧縮することで、帯域の節約をしている。

## mod_deflate ######
SetOutputFilter DEFLATE

BrowserMatch ^Mozilla/4 gzip-only-text/html
BrowserMatch ^Mozilla/4\.0[678] no-gzip
BrowserMatch \bMSI[E] !no-gzip !gzip-only-text/html
SetEnvIfNoCase Request_URI \.(?:gif|jpe?g|png)$ no-gzip dont-vary

DeflateFilterNote Input instream
DeflateFilterNote Output outstream
DeflateFilterNote Ratio ratio

DeflateCompressionLevel 5
DeflateMemLevel 8
## mod_deflate ######
httpd.confの設定例

2/3

Index
CGMサイト構築で悩む負荷対策と拡張性の確保
  Page1
CGMサイト構築の初期段階で考えること
アプリケーションレイヤにおける対策
 1. HTTPロードバランサによるロードバランス
 2. 大容量データの扱い
Page2
アプリケーションレイヤにおける対策(続き)
 3. キャッシュを効果的に利用する
 4. スループットの向上策
  Page3
データベースレイヤにおける対策
 1. DBロードバランサによるデータベースのロードバランス
 2. mysql_clusterによる拡張性・冗長性の確保
クッキーとセッション管理

RoRでCGMサイト構築虎の巻

 Ruby/Rails関連記事
プログラミングは人生だ
まつもと ゆきひろのコーディング天国
 ときにプログラミングはスポーツであり、ときにプログラミングは創造である。楽しいプログラミングは人生をより実りあるものにしてくれる
生産性を向上させるRuby向け統合開発環境カタログ
Ruby on Rails 2.0も強力サポート
 生産性が高いと評判のプログラミング言語「Ruby」。統合開発環境を整えることで、さらに効率的なプログラミングが可能になる
かんたんAjax開発をするためのRailsの基礎知識
Ruby on RailsのRJSでかんたんAjax開発(前編)
 実はAjaxアプリケーション開発はあなたが思うよりも簡単です。まずはRuby on Railsの基礎知識から学びましょう
Praggerとnetpbmで作る画像→AA変換ツール
Rubyを使って何か面白いものを作ってみよう!
 一般的な画像をアスキーアートに変換するツールを作ってみる。さらに出力にバリエーションを持たせてみよう
コードリーディングを始めよう
Railsコードリーディング〜scaffoldのその先へ〜(1)
 優れたプログラマはコードを書くのと同じくらい、読みこなす。優れたコードを読むことで自身のスキルも上達するのだ
  Coding Edgeフォーラムフィード  2.01.00.91


Coding Edge フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

>

Coding Edge 記事ランキング

本日 月間