アットマーク・アイティ @IT@IT情報マネジメント@IT自分戦略研究所QA@ITイベントカレンダー  
 
 @IT > @IT Special PR:SPSS Data Mining Day 2007 イベントレポート後編
 
@IT Special

 

PR



「テキスト情報から「次の一手」を決めるマーケットの本音を探索 〜
『なずき』による感性分析を主軸とした新たなテキストマイニング 〜

株式会社エヌ・ティ・ティ・データ
法人ビジネス推進部 なずき推進室
商品企画・営業チームリーダ
尾崎 哲夫 氏

 尾崎氏は、近年、インターネットの一般家庭への浸透によって、ブログに代表されるCGM(Consumer Generated Media)と呼ばれるテキストデータが増加、そのデータの活用が注目されていることに触れ、定性的なテキストデータは、分析に大変な労力を要する場合が多いものの、分析者の仮説を超える思いがけない回答が得られる可能性を指摘する。

 従来、テキストマイニング手法としては、次の2つがあったという。

  • 単語分析・・・文中から単語単位で切り出す方法
  • 係り受け分析・・・文中から単語と単語の係り受けを切り出す方法

 例えば、「住宅購入の目的は何ですか」という設問に対する回答として「自宅で店をやるため」というものがあった場合、分析結果は以下のようになる。

単語分析
「自宅」「店」「やる」「ため」
係り受け分析
「自宅×店をやるため」

 こうした分析は、上記のような設問に対する答えであったり、要点が絞られているテキストデータであれば有効な情報を抽出できるが、特に制約のないブログのような自由記述の場合、文章が長くなりがちなため従来の分析方法では課題が残るという。というのは、出現するすべての単語、または係り受けを抽出してしまうためあまり意味のないごみ情報が多数抽出されてしまうため、効果的なテキストデータ分析が困難になってしまうからだ。

 そこで、テキスト情報から「感性情報」を見つけることが、テキスト情報の効果的な分析につながると考えて開発されたのがテキストマイニング・ツール「なずき」である。

「感性情報とは、人間の五感から得られるのが客観的な情報であるのに対して、個人の気分/経験/立場を反映した“主観的な認識”のことです。例えば、『真っ赤なスポーツカーだ。排気量は5000ccか』というのは客観的な情報、これに対して『きれいな色だなあ、燃費はイマイチだ』という言葉が“感性情報”ということになります」(尾崎氏)

 「なずき」では、単語+単語+ニュアンスの組み合わせから感性を示す表現を収集し、感性と表現の組み合わせのルール化を行っているという。これによって、感性情報の抽出と感性のタイプによる分析を実現している。同氏は次のような具体例を示してくれた。

(画像をクリックすると拡大します)
感性情報を抽出するために……
(資料提供:株式会社エヌ・ティ・ティ・データ)

 上記のような、単語+単語+ニュアンスの組み合わせから生じる感性表現と、感性のタイプの対応関係は360億のルール(知識)も「なずき」に格納されており、精度の高い評価情報の抽出が可能となっているそうだ。例えば、ある温泉旅館についてのWeb上に記載された口コミデータをなずきで分析すると、評価の対象となる「料理」「温泉」などに対するさまざまな評価、すなわち「好評」「苦情」「要望」など感性表現のタイプ別の件数が自動的に算出される。

 こうした評価情報は、従来は形容詞(良い、悪い)と簡単なニュアンス(である・ではない)の組み合わせによる「ポジティブ(肯定的)な表現vsネガティブ(否定的)な表現」といった2分法で行うのが精一杯だったが、なずきでは、多様な感性タイプ(最大81種類)別の分析ができるため、それだけ精緻な分析が可能という。

 また、テキスト情報活用の有効性について、仮説では抽出できない情報が得られること、加工されていない生の声(気持ち:感性)が現れること、ブログなどの活用によってリアルタイムに偏りのない多様な情報を収集/分析できることの3点を挙げて講演を終えた。

「大規模データ時代の顧客データマイニング〜
新しいパラダイムを創造するDWHアプライアンス〜」



日本ネティーザ株式会社 代表取締役
兼 北アジア・ゼネラルマネージャー
ダグラス・エッツェル 氏



日本電気株式会社
UNIVERGEシステム本部 DWH-SI部
マネージャー 外賀 伸治 氏

 当講演では、大規模データを対象とするデータマイニングシステムが、SPSS、日本ネティーザ、日本電気の3社がそれぞれの強みを結集することによって実現できることが示された。3社の強みとは、具体的には、SPSSがデータマイング、日本ネティーザがデータウェアハウス、日本電気がシステムインテグレーション(SI)である。

 SPSSの鈴木貴志氏による3社連携の全体像の紹介に続いて、日本ネティーザのエッツエル氏によって、まず同社のDWHアプライアンス(サーバ)の紹介が行われた。同氏は、現在のデータウェアハウスを取り巻く環境として、次の3つのポイントを挙げた。

  • 急増する大量データ
  • 高まる分析ニーズ
  • 早まる分析サイクル

 同氏は、データ量が増大したり、分析ニーズが複雑かつ高度化したり、分析スピードの短縮化が求められる場合、ある時点から急激にコスト負担が増大すると指摘する。そして、コストを抑えるために、分析範囲や分析対象となるデータの量そのものを制限せざるを得なくなったり、システム設計の見直しやチューニングに手間をかけなければならなくなる。その結果、データウェアハウスは利用されないシステムとなってしまう。

データウェアハウスの現状
(資料提供:日本ネティーザ株式会社)

 同社のDWHアプライアンス「Netezza Performance ServerTM(NPS)」は、従来のデータウェアハウスの10〜100倍のパフォーマンスを、通常の半額程度のコストで提供する製品であるという。

「NPSが、驚異的なパフォーマンスを実現しているのは、そもそもアーキテクチャが根本的に異なるからです。従来のシステムは、データが蓄積されたストレージからサーバまでのデータの流れがボトルネックになっていました。しかし、NPSでは、データの流れを効率化し、従来負荷のわずか1%に抑えるような仕組みとなっています」(エッツエル氏)

 このおかげで、大規模データに対する複雑な分析要求にも分析結果を迅速に返すことのできるデータウェアハウスが構築可能になるのだそうだ。

 次に、日本電気の外賀氏より、大規模データを活用した顧客分析例の説明が行われた。まず外賀氏は、企業が、継続的な顧客分析サイクルを実施することで、常に変化し続ける顧客のニーズや新たな消費スタイルを正確に把握し、迅速な意思決定を行うことができるようになることを強調、そして、大規模データに対して、仮説→実施→検証の顧客分析サイクルをできるだけ短い周期で回すことによって、顧客像がより明確になることを示した。

理想的な顧客分析サイクル
(資料提供:日本電気株式会社)

 大規模データを活用しようとすると、データの増大につれてデータ処理時間が夜間バッチでも追いつかなくなり、高価なハードウェアが必要とされてくるのが現状だという。すなわち、大規模データの顧客分析においては、「処理時間の壁」「コストの壁」をどうやって乗り越えるかが課題となる。

「このような壁を打ち破り、大規模データの分析を可能とするのが、3層分散アーキテクチャです。NPSからデータを取得し、Clementine Serverで高度なデータ加工やデータマイニングを行います。そして、「Clementine Client」から分析ストリームを介し、分析結果を得ることができます。こうしたアーキテクチャを採用することによって、ユーザーは多くのメリットを手にすることができます」(外賀氏)

 続けて同社の孝忠大輔氏より顧客分析のデモンストレーションが行われた。それは、1000店舗を擁するコンビニエンスストアの1年間のPOSデータの分析を行ったものであった。ここで扱われたデータは、どの顧客がどんな商品を買ったのかを識別できるものであり、5億レコード、約40GBのボリュームがある。同氏は、このデータを用いて、店舗別のRFM分析や、店舗別の顧客セグメント分析や併売分析などを実行してくれたが、大規模データにもかかわらず、レスポンスの良さには驚かされるものがあった。まさに、SPSS、日本ネティーザ、日本電気の3社の強みが合わさることで優れた分析システムが構築できることが実感できた。

「感性工学的アプローチによるコーポレートブランドの分析」



セイコーエプソン株式会社
ブランド・コミュニケーション推進部
野本 泰弘 氏



セイコーエプソン株式会社
ブランド・コミュニケーション推進部
布施 智一 氏

 野本氏、布施氏によれば、セイコーエプソンでは、商品デザイン分野で活用されている分析手法である「感性工学的アプローチ」を用いて、同社のコーポレートブランド力向上のためのプロセスと方法論を研究しているという。

 野本氏は、コーポレートブランドの研究に着手する以前は、消費者が「買いたい」と思ってもらえるためには、製品はどんなイメージやデザイン(形状)を持たせるべきかを研究していたそうだ。例えば、「“買いたい”プリンタとはどのような造形のプリンタなのか」といったテーマに取り組み、認知心理学の知見に基づき、「態度」「イメージ」「認知部位」の3つの階層構造で分析を行っていたという。

 この階層構造において「態度」とは、消費者の「買いたい」「魅力的」「かっこいい」といった製品に対する評価を指す。そして、「態度」は「イメージ」による影響を受けていると考えられる。「イメージ」とは、「斬新な」「シンプルな」「高級な」といった製品から受ける印象のことを指す。また、このイメージは、「認知部位」、すなわち、製品の全体形状や造形処理、色彩などの要素を持つ。逆にいえば、消費者は、認知部位(製品の形や色など)を見て、なんらかのイメージ(製品から受ける印象)を抱き、その結果として「買いたい」「魅力的」といった態度(製品への評価)を形成するということだ。

 野本氏は、この考え方をデザインだけでなく、ブランドにも適用することにしたという。そうした場合、「態度」に該当するのはそのブランドへの評価、すなわち「ブランドロイヤルティ」となり、同様に「イメージ」はブランドへの印象、そして「認知部位」は消費者がそのブランドに接触する場面、つまり「アクセスポイント(企業側が仕掛けるさまざまなコミュニケーション施策)」と置換することができる。

(画像をクリックすると拡大します)
ロイヤルティ分析のアプローチ(方法論)
(資料提供:セイコーエプソン株式会社)

 そして、この枠組みに基づき、つぎのような項目について検証を行ったそうだ。

  • 自社のロイヤルティユーザー(価格プレミアムユーザー*)はどのくらいいるのか?
  • 自社のロイヤルティユーザーはどんな人なのか?
  • 自社のブランドイメージとアクセスポイントの現状はどうなっているのか?
  • 自社のロイヤルティを高めるためには、どのブランドイメージとアクセスポイントが重要なのか?
  • 重要なブランドイメージとアクセスポイントとの関係はうまくいっているのか?
  • 価格プレミアムユーザーのアクセスポイントの顕著な特徴は何か?
  • 自社のロイヤルティを高めるためには、今後何をすればよいのか?
*価格プレミアムユーザー:機能性能が同じであった場合、「価格が高くても買っても良い」というユーザー

「価格プレミアムユーザーがどんな人たちなのか、については「決定木分析」、どんなブランドイメージが重要なのか、については「ロジスティック回帰分析」、アクセスポイント(企業側の施策)とイメージとの関係がうまくいっているかどうか、については「コレスポンデンス分析」「ラフ集合分析」「ジャッカードの類似指標」などの分析手法を活用して分析を行いました」(野本氏)

 次に、布施氏が行った情報機器業界のほかの8社との比較を通して、具体的に何が分かったかを説明してくれた。

 例えば、「コレスポンデンス分析」においては、ブランドイメージとアクセスポイントとの傾向の類似性について、 2次元上のプロットされた点の距離の近さによって、視覚的に関係性をとらえらることができた。また、「ジャッカードの類似指標」ではほかの8社との差分の大きさを色分けすることで、一目で自社の強みと弱みを視覚的に把握することができ、さらに「ラフ集合分析」では、ロイヤルティのある人とない人とのアクセスポイントの経験差をクロス集計し、分析することで新たな知見を得たという。

 最後に野本氏が、感性工学的アプローチを採用することのメリットを以下のようにまとめてくれた。

  • 他社との比較を通じて、ブランドイメージ(顧客が持つ)とアクセスポイント(企業側の施策)の関係について現状の強み・弱みがつかめること
  • ロイヤルティ向上という目的を達成するための方向性が明確になる

 また、今後は定量と定性の合わせ技として、定性情報を定量化し、両方を組み合わせた分析を行っていきたい、と締めくくり講演を終えた。


SPSSでは、“Clementine”をはじめとするSPSS製品や
データマイニングに関する各種資料をご用意いたしております。

資料をご希望の方は、SPSSのWebサイト内
資料請求ページ」にてお申し込みください。


提供:エス・ピー・エス・エス株式会社
企画:アイティメディア 営業局
制作:@IT 編集部
掲載内容有効期限:2007年9月27日
 
<開催概要>
日時
2007年7月12日(木)
会場
セルリアンタワー東急ホテル
主催
エス・ピー・エス・エス株式会社
協賛社
茨城日立情報サービス株式会社
日本電気株式会社
日本ネティーザ株式会社
<プログラム>
10:00-10:10
SPSS Opening Address
SPSS Inc.President & CEO
ジャック・ヌーナン 氏
SPSS Japan Inc. 上級副社長
村田 悦子 氏
10:10-11:10
基調講演
経験価値志向マーケティングとデータマイニング
神戸大学大学院 経営学研究科 教授
石井 淳蔵 氏
11:10-12:00
SPSSソリューション
The Power of Words 〜データマイニングのビジネス価値を高める言葉の力〜
SPSS Inc. Vice President
オリビエ・ジューヴ 氏
13:10-14:00
A-1
「データマイニングが生み出すビジネスチャンス」
明治学院大学 経済学部 国際経営学科 教授 清水 聰 氏
B-1
テキスト情報から『次の一手』を決めるマーケットの本音を探索 〜 『なずき』による感性分析を主軸とした新たなテキストマイニング 〜
株式会社エヌ・ティ・ティ・データ
法人ビジネス推進部
なずき推進室 商品企画・営業チームリーダ
尾崎 哲夫 氏
14:10-15:00
A-2
有機野菜などの会員制宅配組織『大地宅配』における購買分析
大地を守る会/株式会社大地 
販売促進チーム
表 恒伸 氏/前川 隆文 氏
B-2
大規模データ時代の顧客データマイニング〜新しいパラダイムを創造するDWHアプライアンス〜
日本ネティーザ株式会社 代表取締役 兼
北アジア・ゼネラルマネージャー
ダグラス・エッツェル 氏

日本電気株式会社 UNIVERGEシステム本部 DWH-SI部 マネージャー 外賀 伸治 氏
15:20-16:10
A-3
情報大航海時代に向けたNTTドコモにおける戦略的情報活用
株式会社NTTドコモ 情報システム部
情報戦略担当部長
久保田 明 氏
B-3
データマイニング活用指南〜PES3.0で分析業務がここまで変わる〜
SPSS Japan Inc.
セールスエンジニアリング
シニアマネージャ
鈴木 貴志 氏
16:20-17:10
A-4
感性工学的アプローチによるコーポレートブランドの分析
セイコーエプソン株式会社
ブランド・コミュニケーション推進部
野本 泰弘 氏/布施 智一 氏
B-4
「『個客』をどのように理解するか〜多様化するユーザー像とデータ分析〜」
タカラインデックスeRラボ株式会社
データベースマーケティング部 マネージャー
神谷 謙五 氏

SPSS 関連リンク集
SPSSホームページ

SPSSプレスリリース

ご購入前の製品に関するお問い合わせ

資料請求に関するお問い合わせ

そのほかのお問い合わせ

SPSS関連情報ポータル - SPSS Labo

SPSS製品のデモがご覧いただけます - SPSS Online Center

導入事例のご紹介 - Customer Case Studies

資料のダウンロード


 
@ITトップ@IT Special インデックス会議室利用規約プライバシーポリシーサイトマップ