アプリケーションレイヤにおける対策(続き)
3. キャッシュを効果的に利用する
多くの処理では、同じ処理の繰り返しによりサーバのリソースと無駄な時間を消費している。キャッシュを使うとサーバの負荷が大幅に軽減し、処理速度が上がり、ユーザーも快適にサイトを利用できるようになる。
CGMサイトの構築上、キャッシュがなくてはサイトとして成り立たないほどに必要なものであるが、多くの方法が存在する。本連載では、HTTPロードバランサ上でのメモリキャッシュと、memcachedによるセッション情報キャッシュとクエリ結果キャッシュ、Railsのキャッシュ機能(フラグメントキャッシュ)を紹介する予定だ。
HTTPロードバランサは、ネットワーク機器の中でも初めにリクエストを受け取る装置であり、またメモリキャッシュであるため、HTTPロードバランサ上でのメモリキャッシュはApacheとmod_mem_cacheで実現できる。頻繁に更新されない特定のデータ、例えばCSSやJavaScript、画像データなどはHTTPロードバランサ上のメモリにキャッシュさせる。
ただし、サイズが大きいデータをメモリにキャッシュさせてしまうと、メモリが不足してしまう可能性が高い。その場合にはメモリキャッシュではなく、ディスクキャッシュ(Apacheのmod_disk_cache)にすると良い。
## mod_mem_cache ###### |
httpd.confの設定例。images、javascripts、stylesheets配下をキャッシュさせている |
memcachedとは、オブジェクトをメモリにキャッシュするデーモンプログラムのことで、アクセス数の多いWebサイト(Wikipediaなど)においてデータベースの負荷を減らすために利用されることが多い。
データをHDDに書かず、メモリ上で扱うため動作は高速である。しかし、レプリケーション機能など障害時対応機能がないため、デーモンが消えてしまうとデータも失われてしまうのが難点である。
RoRでは、多くのセッションストアが用意されている(セッションストアについてはセッション管理の項で解説する)。Webアプリケーションサーバが1台であれば問題ではないが、HTTPロードバランサにより複数台のWebアプリケーションサーバにアクセスがランダムに振り分けられるようになると、複数のWebアプリケーションサーバ間のセッション情報共有が必要となる。
セッション情報の共有の方法として、データベースに格納して共有する方法と、memcachedでメモリ共有する方法が存在する。しかし、セッション情報というアクセス頻度が高いデータを取り扱うにはメモリを使う方が高速であると判断した。
図2のように、セッション情報はmemcachedを使用して、独立したサーバ(MemCacheサーバ)のメモリ上に格納されている。そして、複数のWebアプリケーションサーバからセッション情報の共有が可能になっている。
図2 MemCacheサーバによるセッション情報キャッシュ |
さらなる工夫として、ネットワーク負荷軽減とmemcachedの障害時対応を考慮している。通常のサービス用のネットワーク負荷を軽減するために、Webアプリケーションサーバとmemcached間のデータのやりとりは別ネットワークを使用した。
また、memcachedには残念ながらレプリケーション機能などの障害時対応機能がない。そこで、memcachedのデーモンがダウンした場合に備えてセッション情報をデータベース格納に切り替える仕組みを導入をしている。この方法については、後日、掘り下げて解説したい。
クエリ結果もキャッシュすることで、データベースへのアクセスを減らすことができる。MySQLにもクエリ結果のキャッシュする機能が存在するが、MySQLのキャッシュ機能はテーブル内のレコードが1件でも変更された場合、キャッシュをクリアしてしまう。
しかし、memcachedのキャッシュの場合は、明示的に、キャッシュから削除をしたり、キャッシュに有効期限を設定したりしない限り、キャッシュがクリアされることはない。従って、更新頻度が高いテーブルなどはmemcachedを使った方がキャッシュ効果が高くなる。
RoRにも3つのキャッシュ機能が存在する。ページキャッシュ、アクションキャッシュ、フラグメントキャッシュである。
ページキャッシュは、最もシンプルに、ユーザーがある特定のURLに初めてアクセスした際に生成されるHTMLをキャッシュ保存する。キャッシュ呼び出しは、Webサーバで実行されるためRailsが呼び出しされない分、効率が良い。
アクションキャッシュは、コントローラが呼び出された際に、そのコントローラのbeforeフィルタが実行され、すでにキャッシュされている場合は、次回からそのアクションは呼び出されない仕組みである。
フラグメントキャッシュは、ページの部分的なキャッシュをする仕組みだ。サイドバーやフッタなど、動的ページのうち一部に静的情報が含まれた際などに役立つ。
これらのキャッシュ機能は、状況に応じて使い分けることで大幅にサーバの負荷を軽減し、処理速度を上げることができる。ライフパレットでは、ほぼ全ページが動的ページであり、サイドバーやフッタなど一部に静的ページが含まれる構造だったため、フラグメントキャッシュを利用している。
4. スループットの向上策
負荷対策・拡張性の確保のほかに、サイト全体のスループットを向上させるための施策としてApacheモジュールである「mod_expires」と「mod_deflate」を使った2つの策を紹介する。
更新頻度が少ないファイルに対して、Webサーバから毎回応答を返すのは無駄である。そこで、Expiresヘッダをレスポンスに追加することで、ロードを繰り返す必要がないCSSやJavaScriptや画像データの有効期限を設定する。
つまり、mod_expiresによって「このファイルは、有効期限の○○日までは、リロードしない」というルールを追加する。これらのファイルの有効期限を延ばすことで、リロード数(リクエスト回数)を減らし、パフォーマンス向上が図れるのである。
## mod_expires ###### |
httpd.confの設定例。それぞれ有効期限を1日後に設定している |
一方、mod_deflateを使うとサーバ通信のデータを圧縮化し帯域を節約することができる。ライフパレットでは、画像以外のテキストデータ(画像ファイルはすでにデータ圧縮されており、またサーバおよびブラウザでの圧縮/解凍処理のオーバーヘッドの方が大きくなるため)をデータ圧縮することで、帯域の節約をしている。
## mod_deflate ###### |
httpd.confの設定例 |
2/3 |
Index | |
CGMサイト構築で悩む負荷対策と拡張性の確保 | |
Page1 CGMサイト構築の初期段階で考えること アプリケーションレイヤにおける対策 1. HTTPロードバランサによるロードバランス 2. 大容量データの扱い |
|
Page2 アプリケーションレイヤにおける対策(続き) 3. キャッシュを効果的に利用する 4. スループットの向上策 |
|
Page3 データベースレイヤにおける対策 1. DBロードバランサによるデータベースのロードバランス 2. mysql_clusterによる拡張性・冗長性の確保 クッキーとセッション管理 |
RoRでCGMサイト構築虎の巻 |
Ruby/Rails関連記事 |
プログラミングは人生だ まつもと ゆきひろのコーディング天国 ときにプログラミングはスポーツであり、ときにプログラミングは創造である。楽しいプログラミングは人生をより実りあるものにしてくれる |
|
生産性を向上させるRuby向け統合開発環境カタログ Ruby on Rails 2.0も強力サポート 生産性が高いと評判のプログラミング言語「Ruby」。統合開発環境を整えることで、さらに効率的なプログラミングが可能になる |
|
かんたんAjax開発をするためのRailsの基礎知識 Ruby on RailsのRJSでかんたんAjax開発(前編) 実はAjaxアプリケーション開発はあなたが思うよりも簡単です。まずはRuby on Railsの基礎知識から学びましょう |
|
Praggerとnetpbmで作る画像→AA変換ツール Rubyを使って何か面白いものを作ってみよう! 一般的な画像をアスキーアートに変換するツールを作ってみる。さらに出力にバリエーションを持たせてみよう |
|
コードリーディングを始めよう Railsコードリーディング〜scaffoldのその先へ〜(1) 優れたプログラマはコードを書くのと同じくらい、読みこなす。優れたコードを読むことで自身のスキルも上達するのだ |
|
- プログラムの実行はどのようにして行われるのか、Linuxカーネルのコードから探る (2017/7/20)
C言語の「Hello World!」プログラムで使われる、「printf()」「main()」関数の中身を、デバッガによる解析と逆アセンブル、ソースコード読解などのさまざまな側面から探る連載。最終回は、Linuxカーネルの中では、プログラムの起動時にはどのような処理が行われているのかを探る - エンジニアならC言語プログラムの終わりに呼び出されるexit()の中身分かってますよね? (2017/7/13)
C言語の「Hello World!」プログラムで使われる、「printf()」「main()」関数の中身を、デバッガによる解析と逆アセンブル、ソースコード読解などのさまざまな側面から探る連載。今回は、プログラムの終わりに呼び出されるexit()の中身を探る - VBAにおけるFileDialog操作の基本&ドライブの空き容量、ファイルのサイズやタイムスタンプの取得方法 (2017/7/10)
指定したドライブの空き容量、ファイルのタイムスタンプや属性を取得する方法、FileDialog/エクスプローラー操作の基本を紹介します - さらば残業! 面倒くさいエクセル業務を楽にする「Excel VBA」とは (2017/7/6)
日頃発生する“面倒くさい業務”。簡単なプログラミングで効率化できる可能性がある。本稿では、業務で使うことが多い「Microsoft Excel」で使えるVBAを紹介する。※ショートカットキー、アクセスキーの解説あり
|
|