Linuxのダンプ機能は「最低限必要」、でもどうする?

2004/10/16

 NTTデータ先端技術のオープンソース技術部長 鈴木幸市氏は「Linux Kernel Conference 2004」(主催:OSDNジャパン)で10月15日に講演し、大規模システムでのLinuxの利用について「システム・インテグレータは顧客に対する説明責任がある。システムが停止した場合の問題解決を担保されていないとLinuxは使えない」と指摘した。そのうえで「原因究明の手段を講じるのが重要」として、システム障害時にメモリ内容を保存するクラッシュダンプ機能による原因究明が「最低限必要」と訴えた。

NTTデータ先端技術のオープンソース技術部長 鈴木幸市氏

 鈴木氏は講演の中で横軸にLinuxカーネルの各バージョン、縦軸に提供されたパッチの行数を示す表を公表した。その表によると最新カーネルの2.6では、カーネル2.4や2.2の同バージョン時を上回る行数のパッチがすでにリリースされている。つまり、それだけパッチによるバグフィックスが必要な機能が多いということで、鈴木氏は「カーネル2.6はもう少し安定すると思ったが、パッチの行数が増え続けている。非常に心配している」と指摘した。

 システム障害の原因究明を行う際に有効なのが、障害が発生したときのメモリの内容を出力するダンプ機能。しかし、Linuxは標準ではメモリダンプ機能がない。そのためSIerらは何らかのダンプ用ツールを使う必要がある。ダンプ用ツールにはメインフレームなどで使われているハードを使ったカーネルダンプと、MachやVMwareのマイクロカーネルなどがあるが、Linuxで主に使われているのはカーネル内にダンプ機構を持たせる仕組み。

 カーネルダンプツールはいくつかある。1つはSGIが開発し、オープンソースとして公開された技術で、IBMとNEC、日立製作所、富士通が共同で拡張している「LKCD」。ディスクダンプ、ネットワークダンプ、メモリダンプをサポートし、開発活動も活発だが、「ディスクダンプでデバイスがビジーだとダンプが取れない」(鈴木氏)という弱点がある。また、富士通が開発した「diskdump」は、割り込みをせず、SCSIのポーリングモードを使うことでダンプ取得の確率が高いというメリットがあるが、一方でSCSIのドライバの修正が必要だったり、カーネルの再構築が必要になるという。

 鈴木氏はカーネル2.6環境での新しいダンプ取得法を紹介した。それはクラッシュしたカーネルを使わずにダンプを取る方法。従来型のダンプだとクラッシュしたカーネルを使ってダンプを取るため、メモリ内容が破壊されているなど一貫性に問題が出る可能性があった。新しいダンプ取得法は、カーネル2.6で実装されたカーネルから別のカーネルをブートする機能「kexec」を利用する。クラッシュしたカーネルから別のカーネルをブートし、そのカーネルでダンプを取る方法だ。すでにIBMのインドの研究所がkexecを介してダンプ専用カーネルを起動する技術を開発しているという。

 ただ、この方法にも問題があるという。それはkexecは実行される際に、古いカーネルの一部を上書きするため、ダンプを取得する場合は、上書きされる部分のメモリイメージを退避させる必要があるということだ。NTTデータとVA Linux Systems Japanが10月13日に発表した「ミニカーネルダンプ機能」はこの問題を解決するクラッシュダンプ機能。ミニカーネルダンプ機能は、kexecを変更し、任意の場所にダンプ用のミニカーネルをロードして、起動できるようにする。クラッシュしたカーネル内のコード、データ構造を使わずに、安全なミニカーネル内のコードとデータ構造で、ダンプ取得を実行できるという。ダンプの解析はLKCDの解析ツールである「lcrash」を使う。NTTデータ、VA Linux Systems Japanはミニカーネルダンプ機能をオープンソースソフトとして公開している。鈴木氏は「ミニカーネルダンプ機能ではライブダンプの取得が難しい。次の宿題だろう」と述べた。

 鈴木氏は大規模システムでのLinuxの利用について「カーネルダンプはいろいろ出てきたが、障害解析はまだまだ。最後は人海戦術、人の英知でやるしかないともいえ、人をどう育てるかが重要になるだろう」と語った。

(編集局 垣内郁栄)

[関連リンク]
NTTデータ先端技術
NTTデータの発表資料
VA Linux Systems Japan
OSDNジャパン

[関連記事]
ACOSに見る、メインフレームとオープンシステムの微妙な同棲生活 (@ITNews)
「あわよくば有償版に」、無料で商用利用可能なLinux版Sybase (@ITNews)
サーバOSの適正価格とは? ターボリナックス (@ITNews)
基幹系進出で4500億円のLinux市場を狙うNEC (@ITNews)
サーバ統合時代に生き残るOSは? (@ITNews)
ノベルがSUSEの新版を発表、買収報道には「賑やかしだ」 (@ITNews)

情報をお寄せください:



@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)