@IT|@IT自分戦略研究所|QA@IT|イベントカレンダー+ログ | ||
Loading
|
@IT > SPSS事例探求 第7回 東京慈恵会医科大学編 |
企画、制作:@IT営業企画局 掲載内容有効期限2002年12月末日 |
|
|
これまで6回にわたって紹介してきた“Clementine”の活躍は、ビジネスの世界に限らず、最近では医療分野にまでおよんでいる。今回は、東京慈恵会医科大学で臨床研究に従事されている、医学博士 浦島充佳氏に取材させていただいた。
浦島氏は、もともとは小児科医として、患者の治療にあたっていたという。しかし、その後、医療現場を離れ、米国のHarvard School of Public Healthなどで、マクロな視点で医療を捉えることを学んだそうだ。帰国後は、医療現場には戻らず、東京慈恵会医科大学の「臨床研究開発室・薬物治療学研究室」で薬物や治療法の効率性の評価(例えば、ある病気に対してAとBという異なるアプローチを試みた場合、どちらの治療効果が高いかを検証するなど)といった臨床研究に従事している。
浦島氏によれば、医療分野は、個々の患者の治療を扱う領域と、さまざまな治療法や医薬品の効果を検証するため、多くの症例・治療データの収集・分析を手がける領域とに大別されるそうだ。経済学用語に模して表現するならば、前者が「ミクロ医学」、後者が「マクロ医学」と形容できるという。 この「マクロ医学」と位置付けられる領域では、多くの患者からデータを収集・分析し、そこから得たさまざまな知見を現場へフィードバックする。それによって、医療現場の医師たちは、より効果の見込める治療方針を選択できるようになる。浦島氏は米国でこうした“データに基づく治療”に触れたことで、日本の医療に対して疑問を感じたという。
浦島氏が所属する研究室は2001年秋に設立されたばかりで、現在、企業の研究開発セクション同様、医療の効率化を目的とした研究を手がけている。欧米では、医学部や病院にこうした施設が併設されているケースが比較的多いそうだが、日本では非常に少ないという。そうした意味では、浦島氏が立ち上げに貢献したこのセクションは、日本でマクロ医学の研究を行う先駆けである。 浦島氏が「ミクロ医学」から「マクロ医学」へと軸足を移してきた理由は、日本と欧米の医療システムの違いを実感したことだけではない。
「そもそも病気の因子については、ある程度見当がつくのですが、患者のデータを分析して、検証するというのがなかなか難しいわけです。インフラの問題もあるのでしょうが、そもそも日本では、医療に関わるデータがきちんとしたプロトコル(データ収集の目的やデータ測定方法などの標準的な取り決め)に基づいて収集されていないことが多いのです。またこうした分野では、欧米に比べて遅れをとっているだけでなく、情報発信がとても少ないのはなぜか、という疑問を感じています。おそらく、現場のデータを収集・分析して、フィードバックするという医療システム自体が、日本ではまだまだ浸透していないからだと思います。こうした状況にはとてもジレンマを感じています」 浦島氏は、現在、医療データ分析のノウハウを教える講習会「慈恵クリニカルリサーチコース」の開催を計画している。参加者は、当初数十名程度を想定していたが、140名もの参加希望が寄せられたという。講習会では、EBMの分析フレームワークや、バイアスのないデータ収集方法などについて実習を交えて講義する予定とのこと。これだけの参加者が集まるということは、医師側のデータ分析に対するニーズが相当高いと考えられる。私たち一般の者からすれば、医療分野のデータ分析技術はかなり進んでいるような印象を持ちがちだ。しかし、意外にも、医学部では分析手法について学ぶことは少なく、医師主導で医療データを収集・分析することもあまりないそうである。 実際、浦島氏が研究を進めている上で直面する課題は、データ分析の対象となる人間がもつ「個人差」の複雑さだという。ここでいう「個人差」とは、例えば、同じ病気の患者に対して、同じ治療を施したとしても、必ずしも同じ効果が得られるわけではなく、たいていの場合、治療結果に差異が生まれるということである。このように、分析対象となるデータの変数が非常に多くなってくると、従来の統計解析手法(多変量解析など)だけでは、複雑な分析を行うことが難しく、仮説を検証するのに十分な分析結果が得られない。そこで“Clementine”のように、さまざまなアルゴリズムを用いて、ユーザーの意のままに分析が行える操作性に優れたデータマイニングツールが必要になるということだ。
従来の分析ツールに限界を感じていた浦島氏が“Clementine”の存在を知り、Webサイトを通じて問い合わせたのは、ちょうど1年ほど前だった。浦島氏は、SPSSの横関氏から詳しい説明を聞き、従来の統計解析手法にはなかった、ニューラルネットワークなどのデーマイニング手法を知ることになる。そのころ、浦島氏が所属する研究室は開設されたばかりで、同研究室にリサーチシステムを導入しようとツールを模索していた時期とも重なり、とんとん拍子で“Clementine”の採用が決まったという。
「“Clementine”を導入しようと決めたポイントは、変数が多い複雑なデータであっても、高度な分析が可能なツールであるという点だけでなく、同時に、従来の統計解析手法(SPSSの他のツール群)を用いた分析結果などとの比較検証が可能であるという点です。分析手法というのは、扱うデータの種類によって、そのデータの分析に適す、適さないということがありますが、SPSS製品であれば、各種ツールを用いて、さまざまな分析手法を試すことができ、よりそのデータにあった分析手法というのを選択することが可能になるわけです」 浦島氏は、そうした理由以外にも「複雑なデータの高度な分析がノートパソコン上で実行できる“Clementine”の手軽さ/使いやすさという点も高く評価している」とコメントしている。実際、浦島氏は“Clementine”を利用してみて、
「従来の多変量解析手法では、あらゆる要因を全部拾ってしまうために、重要な要因が埋もれてしまうことがありますが、決定木分析を使えば、それほど重要でないと思われる要因、つまりノイズをうまく排除することができるので、本来求めていた要因が明確に見えてくることがあります」 という感想を持っているそうだ。 浦島氏は“Clementine”を用いて、慈恵会医科大学付属病院に蓄積された数千のデータをまずは仮説フリー(なし)で解析し、病気の予後(治りやすさ)に強く関係する因子や、数万ある遺伝子の中から病気の原因や予後と関係する遺伝子を発見するといった、文字通りデータマイニング的な研究も行っているそうだ。
“Clementine”を用いて行っている浦島氏の数多くの分析事例の1つ、「気象条件からヘルパンギーナ(夏に流行る感染症、子供の罹患率が高い)の発症規模を予測するモデル」をご紹介しよう。 分析対象となるデータは、「国立感染症研究所」のサーベイシステムによって収集された、全国1000カ所での感染症発生記録と、気象庁から入手した気象データ(十数年分)である。分析手法は、「C&RT:Crassification
and Regression Tree」を採用した。最初に対象データの半分を使って予測モデルを作成し、次に残り半分のデータを使って予測モデルの精度を検証するというプロセスを踏んだところ、90%以上という、非常に高い予測精度をもつモデルが作成できたという。
多変量解析手法を用いてこの分析を行おうとした場合、どのデータがヘルパンギーナの発症要因として重要であり、どのデータはあまり重要ではないといったデータに対する仮説をたてることが非常に難しい。しかも、その仮説によっては、分析結果に相当のブレが出てしまう。しかし、この分析では、“Clementine”のC&RTというアルゴリズムを用いて、6〜7月にかけては、蒸気圧(mmHg)が低い場合より、蒸気圧が高い気象条件の方(つまり、蒸し蒸ししている気候)が、ヘルパンギーナの発症率が倍くらい多い、というように、対象データをツリー形式で分析することで、重要な要因を見落とすことなく、最終的に精度の高い予測モデルを構築することに成功している。
“Clementine”のさまざまな魅力を最初に浦島氏に伝えたのはもちろん、「スキルトランスファー」というビジョンを掲げるSPSSの横関氏ではあるが、「むしろ、浦島先生から医療分野における分析についてはいろいろと教わることが多いです」という。
「医療分野はいうまでもなく、生死に関わる領域なので、中途半端なことは許されません。ですから、分析ツールのアルゴリズムがよく分からないという理由で、分析ツールの導入には躊躇される先生も少なくありません。このような現状の中、積極的に医療データの分析に取り組んでおられる浦島先生には、そうした先生方をリードしていっていただければ、と思っています。SPSSとしてもできる限り、浦島先生のような取り組みをされる方たちをサポートしていきたいと思っています」と横関氏は語る。 浦島氏は、現在、主にC5.0、Kohonenネットワーク、ニューラルネットワークの3つの手法を活用して、マクロ医学の研究に取り組んでおり、その成果を週に1本程度のペースで発表すべくレポートにまとめ、情報発信を続けているそうだが、最近では海外からも注目を浴びつつあるとのこと。まもなく、遺伝子研究分野の学術誌にもフルペーパーの論文を提出する予定だそうだ。浦島氏いわく、“欧米に遅れをとっている”日本の臨床研究分野だが、浦島氏のような若手研究者がデータ分析に基づく臨床研究の成果を世界に向けて情報発信を続けていくことで、少しずつではあるが、欧米からの評価は確実に変わっていくであろう。 “Clementine”は、データマイニングの適用分野の幅を確実に広げている。この“SPSS製品導入事例探求シリーズ”で取り上げた、「ソフマップ」や「NTTソルコ」などCRM分野での活用事例、「慶應SFC」では産学連携の事例、「ギャガ・コミュニケーションズ」のレコメンデーション・エンジン開発への活用事例、「住友金属システムソリューションズ」の製造業における品質データマイニングの事例、「アサツーディ・ケイ」の画像イメージ予測モデル開発への活用事例など、さまざまな分析機能を持ち、SPSS製品などほかのツールとの連携にも優れたパワフルなツールであるからこそ、これだけ多種多様なニーズをもつユーザーに受け入れられているようだ。しかも、SPSSが提供する「スキルトランスファー」というサポートによって、必要なスキルを十分に身に付けることができるので、“Clementine”を導入するユーザーのレベルを問わず、ユーザーの意のままにデータマイニングが行えるようになる点もかなり魅力的である。ユーザーのニーズを素早く取り入れ、今後も進化を続ける“Clementine”は、その活躍の場を限定することなく、ますます発展していくであろう。
|
|