「顧客の理解を、さらに深めるデータ分析」とは具体的にどのようなものか見ていきます。
従来の顧客分析では顧客の取引データや属性データ(年齢、性別、家族構成、職業、年収、リスク許容度など)を主に活用してきました。これに加えて顧客のニーズをより深く、早く知るために、顧客の日々の行動や生活スタイルを表すデータを活用します。
顧客の行動データとしては、例えばチャネルシステムの利用状況(営業店、ATM、コールセンター、Webなどをいつ、どのくらいの頻度で、どこで使用しているか)や、コンタクト結果のテキストデータなどを活用します。さらに顧客特定が可能な場合や顧客からのオプトイン(利用許諾)があれば、外部SNSのデータや提携先サービスのデータ、アカウントアグリゲーションサービスから得られる他行データや、Open APIで接続されるFinTech企業のデータなども有効です。こうした銀行内外のビッグデータを活用してこれまでにない視点で顧客の理解を深めることができます(図1参照)。
これらのデータを基に、「いつ、どこで、何を、どのように消費し、何に興味を持ち、どこに投資、蓄積しているのか」といった切り口で顧客全体を細分化します。この分析によって、顧客属性データや「取引データ×行動データ」からなる粒度の細かいセグメンテーション(マイクロセグメンテーション)に顧客を分類できます。顧客は静的な属性変化だけではなく日々の行動の変化によっても、このマイクロセグメント間を移っていくことになります。このマイクロセグメント間の移動をトリガーにして、その後の金融消費行動やライフイベント、離反行動などを予測することが可能になり、その予測に基づいて顧客へ事前のアプローチを行えるのです(概要は図2を参照)。
こうした分析手法の従来との違いを整理します(図3参照)。顧客接点や顧客行動のデータを活用してマイクロセグメントに分類することで、より顧客を正確に深く理解できます。また固定的、断面的な属性変化だけではなく行動の変化も捉えることで、より動的な洞察を行え、その結果として顧客のライフイベントや金融イベントの予測ができるようになります。そして、これらの分析は「顧客属性や取引金額の多寡などを基に人が仮説を立てる」アプローチではなく、「データを主体としデータが示すものから顧客を理解しよう」とするデータドリブンのアプローチです。
このような取り組みを進める上で、銀行の情報系システムはどのようなアーキテクチャを考えていくべきでしょうか。これを考える上では、本連載の前回記事にもある通りSoR(Systems of Record)とSoE(Systems of Engagement)、そしてSoI(Systems of Insight)の3つの領域を考慮する必要があります。
顧客の属性情報や取引データは主に勘定系などの基幹系システム群(SoR)から提供されます。一方、前述したような顧客行動の情報を得ようとすると、顧客との接点や関わりが強いシステム群(SoE)から得られるデータが重要となります。これらのデータは銀行チャネル(営業店やATM、Web、コールセンター、モバイルなど)での顧客行動データが主体となり、SoRにない情報が多く含まれています。また、構造化データだけではなく、テキストやログ、音声や映像などのマルチメディアデータを含む非構造化データが対象となります。
SoRの構造化データとSoEの非構造化データを併せてSoIの領域に提供します。双方のデータを活用して顧客の分析を行い、その結果を顧客チャネルにフィードバックしていきます。図4はこの効果的なサイクルを回すためのシステムアーキテクチャです。
このアーキテクチャではSoRとSoEからの構造/非構造データを併せて提供するビッグデータ基盤が重要な構成要素となります。データは可能な限り消去せずに蓄積したいというデータ利用者の根源的な望みを満たし、かつSoRの構造データだけではなくSoEの大量の非構造化データをいかに効率良く管理、提供していくかを考えるとき、図4のビッグデータ基盤は1つの解になります。
図4で挙げているApache Hadoop(以下、Hadoop)は、昨今急速に技術が向上し実際に活用されるようになってきました。データ管理に関して非常にコストパフォーマンスに優れたHadoopをビッグデータ基盤に適用することで、増大し続けるデータを低コストで管理でき、SoI領域に必要なデータを提供できます。
Hadoopのこうした活用例は銀行ではまだ多く見られませんが、みずほ銀行での取り組みはその一例です(参考)。Hadoopの技術発展によって今後エンタープライズレベルでの適用例は一層増してくるでしょう。
SoI領域では複雑なデータ抽出や非定型的なデータ処理、高度な計算処理が多用されるため、より分析処理に特化したデータベース技術と分析ツールの適用が望まれます。データ分析処理の形態は、さまざまな用途によって複雑さも変わってきますが、データ分析による提供される価値の違いから下記のように用途の分類を考えることができます。
昨今、データ管理や分析の場もクラウド環境が有力な候補になっています。図4のアーキテクチャ論理構造でも下層部分は、もちろんクラウドの適用候補になります(図5参照)。高い柔軟性を持つクラウド環境でデータを提供し、クラウド上の新しい技術、ツール、アルゴリズムを使うことで、新たなビジネスモデルの試行や検証に取り組みやすくなります。
クラウドを活用する上で、クラウドにどうデータを配置するかが1つの大きな検討ポイントです。CSCC(Cloud Standard Customer Council)のPDFレポートの表5ではクラウドへのデータ配置判断の優先検討要素として、柔軟性、必要システムリソース、データボリューム、ネットワーク帯域、データ近接度合い、管理統制が挙げられています。クラウド環境はマルチベンダーで提供されることも考えられるため、インタフェースのオープン性も重要になります。
Copyright © ITmedia, Inc. All Rights Reserved.