DXトレンドが進展し、全ての企業にとって不可欠な取り組みとなっている「データ活用」。だが「収集・蓄積」はできても、その先の「活用」、さらには「具体的な成果の獲得」にまで至っている企業は少ないのが現実だ。にもかかわらず、メディアなどで見掛けるベンダーメッセージは夢物語のようなものばかり――。では「大量データから簡単に“答え”を引き出せる」とうたっている「Teradata Vantage」の場合は、どうなのか? メッセージの裏側を聞いた。
デジタルトランスフォーメーション(DX)トレンドの進展に伴い、データの価値がこれまでになく高まっている。AI、IoTをはじめ、膨大に生成されるデータからビジネスに役立つ知見をいかに見つけ出すかというテーマは、自社のビジネスモデルや経営そのものを変革するなど、企業が将来像を描く上でも不可欠な取り組みとなっている。
だが、データ活用の取り組みにおけるスピードや深度は千差万別だ。最新技術への感度を高め、常に取り組みを進化させようとしている企業もあれば、新しい取り組みに着手できなかったり、うまく進められずに悩んでいたりする企業も少なくない。データ活用のための最新技術を採用したからといって、必ずしも有効な知見が得られるとは限らないのだ。
実際、長年企業のデータ活用を支援し、現在も企業の悩みを共有しながら最新技術の提供・支援を行っている日本テラデータの小永井崇氏(エンタープライズ・テクノロジーセールス事業部 事業部長)は次のように話す。
「データ活用が進んでいるように見える企業でも、『もっとやらなければ』という悩みを持っているお客さまは多くいらっしゃいます。例えば、『データはたまっているが、データサイエンティストがアクセスしたいデータがどこにあるのか分からない』『データの意味や体系が部門ごとに異なっているため、全社的に分析に生かすことが難しい』といったケースです。他にも、どこで生成されたデータで、どのような加工・変遷を経てきたのかを知りたい、データをどう信用していいか分からないといったトレーサビリティに関する声もよく聞かれるようになってきました」
データ活用というと「収集・蓄積」がまず注目されがちだが、実ビジネスのための「活用」に向けて、取り組みが進むほどに新たな課題に直面するといえる。事実、「活用」のフェーズに到達できずに悩む企業も増えているという。
「例えば、製造業では、センサーやテレマティクス、コネクテッドなどのデータが蓄積されてきています。こうしたデータは今まではなかったものですから、どう扱うべきか悩みも多い。データの体系が違っているためにシステム連携ができなかったり、製品や部門ごとにデータが分断されていて正しく整理されていなかったりするケースも目立ちます」
こうした状況を受けて、テラデータでも「Teradata Database」の後継製品、「Teradata Vantage」を新たに提供することで、課題の解消を支援している。ただ言うまでもなく、その時々の課題に着目して解決策を提示するのは、ITベンダーの命題だ。
例えば、データベースの分野でも、リレーショナルデータベース(RDBMS)に大規模データを扱う機能や並列処理の機能が追加され、PB(ペタバイト)クラスのデータも高速に処理できるように進化してきた。カラム型データベースや、OLTPとOLAPを統合できるデータベース、非構造化データを扱うためのNoSQLデータベース、メモリ内で処理するインメモリデータベース、ビッグデータ向けの大規模分散データベースなど、多様なデータベースが開発されてきた。
とはいえ、前述のように、新しいテクノロジーだからといって成果が出るとは限らない。ほとんど成果が出ないソリューションも少なくないのが現実だ。ユーザー目線で見れば、ベンダーが発信するメッセージは「良いことばかり言っている」ようにすら映ることもある。自社におけるIT活用の目的や課題を明確化することはもちろんとして、ベンダーメッセージをうのみにせず、正しく判断することも“成果”を獲得するための前提条件といえるだろう。
では、データベース業界をリードしてきたテラデータの新製品「Teradata Vantage」(以下、Vantage)はどうなのか? そこで小永井氏にベンダーメッセージに対してしばしば抱く懸念、言い換えると「ユーザーとして解決を望んでいる5つの質問」をぶつけてみた。
1つ目の質問は「本当にデータのサイロ化を解消できるのか」だ。
企業には多種多様なデータが存在する。それらはさまざまな部門に分散しており、オーナーも管理者も異なることがほとんどだ。例えば、工場などで発生するIoTデータを顧客向けサービスに生かそうとする場合、データが生成される場所、蓄積する場所、分析する場所、適用する場所がそれぞれ異なってくる。エッジの場合もあれば、パブリッククラウドの場合もある。これらを場所ごとに管理しようとすると、サイロ化が発生しやすくなる。
「実際に製造業のお客さまから、そうした要望を受け、PoC(概念検証)を実施しているケースがあります。場所もそうですが、データを利用するユーザー、利用するツール、適用する業務などによってもサイロ化が発生します。例えば、データサイエンティストやビジネスアナリストなどの分析担当者と、実際にデータを利用するユーザーとの分断です。以前のTeradata Databaseでもそうした問題は発生していました。分析担当者がPythonを使って分析する際、データベースからデータを切り出してデスクトップにダウンロードしたり、現場に適用するときも、またデータベースからデータを切り出してExcelにインポートして利用したりといった具合です。
こうしたサイロ化を解決する1つのアプローチは、データベースにそのままアクセスし、全てのデータをインデータベースで分析できる仕組みを作ることです。テラデータでは、この実現のために、具体的な機能を製品に実装しています。現在PoCを行っている企業では、工場のIoTデータとクラウドに蓄積したデータに対して、誰もが(一定権限の下)同じようにアクセスでき、すぐに活用できる環境を作ろうとしています。金融機関やカード会社、EC、通信などでも同様の取り組みを進めている企業が多くあります」
というのも、Vantageはオンプレミス、仮想化環境(VMware)、クラウド(Amazon Web Services、Microsoft Azure、Teradataクラウド)といった環境を問わずに展開できるプラットフォームだ。ライセンスの持ち込み/持ち出し(ポータビリティー)も可能で、オンプレミスとクラウド間でワークロードを移行できる。
サイロ化を解消する上では「QueryGrid」という、さまざまなデータへの透過的アクセスを可能にする技術が役立つ。すなわち、データを一元的に管理・活用できる環境が整うのだという。データ活用作業の複雑性と“余計なひと手間”を解消できることはビジネス展開の「スピード」に大いに寄与するのではないだろうか。
2つ目の質問は「本当に生かせるデータ、きれいなデータを使えるようになるのか」だ。
データを分析するためには、収集したデータを“分析できる形”に整備する必要がある。いわゆるデータの「事前準備(プレパレーション)」と呼ばれる作業で、この作業が分析業務の8割を占めるとも言われている。
「そうした生かせるデータ、きれいなデータを準備する上でのポイントは、複数のデータ型とフォーマットに対応し、異種混合のデータストアからデータを収集・加工できることです。また、さまざまなツールや言語に対応し、ユーザーが使い慣れた環境で準備作業ができることも重要です。
これはサイロ化の話にもつながるのですが、データを活用する上では1つのプラットフォームだけで対応することは現実的ではありません。テラデータでもVantageというプラットフォームで全てのデータ活用フェーズに対応しようとは考えていません。HadoopにはHadoopの良いところがありますし、オブジェクトストレージが適したシーンも多い。また、前述のQueryGridで仮想的な統合を実現するデータベースとしても、Oracle、Hiveなどが多い。企業システムは、決して1つの製品だけで構成されているわけではありません。だからこそ、複数のデータ型やフォーマット、ツールに対応し、シングルポイントでデータにアクセスし、必要なデータがどこにあるかを気にせずにデータを整備できることが重要なのです」
Vantageは、「Teradata Studio」「Jupyter」「RStudio」など、あらゆる分析ツールに対応している。言語も、R、Python、SAS、Javaなどが利用できる。プレパレーション関数や機能を豊富に用意することで、欠損データの補完・整形も確実に行える。
また、QueryGridでデータを連携させる場合も、接続先データベースで必要な処理をさせて、結果データだけを連携することが可能だという。最初に生成された実行プランが適切ではなかった場合も、どのようなデータがどれくらい返ってきたのかなどを自動的に判断し、実行プランの補正と最適化を行う。
もちろん、データ整備は企業ごとに千差万別であるため、「データを登録する際のプロセスをどう定義するか」といった領域まで、コンサルティングを含めてサポートしている。いわば、生かせるデータ、きれいなデータが使える環境を、テラデータのテクノロジーと長年のノウハウの両面で支援してくれるわけだ。“データマネジメントという永遠の課題”に本格的に取り組む上で良いきっかけになるのではないだろうか。
3つ目の質問は「増大し続けるデータを、各自が使い慣れたエンジンを使って、効率よく分析できるというのは本当か」だ。これは、既存のTeradata Databaseユーザーからよく寄せられる質問だという。
「データ分析では、最適な処理を最適な方法で行うことが重要です。分析に必要なコンポーネントをエンジンとして提供していて、われわれが独自に実装するものに加え、ユーザーが使い慣れたものを使うことで最適な処理ができます。現在提供しているエンジンには、『Advanced SQL Engine』『Machine Learning Engine』『Graph Engine』があります。それらをニーズによって使い分けていただけます」
Advanced SQL Engineは、SQLとNoSQLの両方の要素を取り入れた高度な分析エンジンだ。データ準備から加工、探索、スコアリングなど、複雑な条件でもSQLベースで簡単に実行できる。また、パス/パターン/時系列、経路分析(セッショナイズ)、アトリビューション(最終的な結果に対する各要素の影響度を算出する手法)などの分析手法も提供する。
Machine Learning Engineは、いわゆる機械学習のための関数を提供するものだ。統計、データ加工、ナイーブベイズ、位置分析、パス/パターン/時系列、連関、決定木、クラスタリング、テキストなどの分野で関数を用意している。
Graph Engineは、いわゆるグラフ理論に基づいたデータ分析を行うためのエンジンだ。人や製品、プロセス間の「関係性」を知ることができ、具体的な関数としては、ページランク、固有ベクトル中心性、Betweeness、近接性などを提供する。
これらのエンジンは、AIなど最新の取り組みにも対応するものだが、今後は、TensorFlowを使ったディープラーニングエンジンなども提供していく予定だという。
4つ目の質問は「『従来は見えなかったデータ』を可視化できるというのは本当か」だ。これは、Advanced SQL Engineが提供する「4Dアナリティクス」機能を使った分析の実践例を指している。
「4Dアナリティクスは、時間を基にした『時系列データ』、時点を基にした『テンポラルデータ』、場所を基にした『地理空間データ』を組み合わせて分析する手法です。例えば、『金融機関が、転居を繰り返す顧客を把握して、保険契約や住宅ローンを提供するタイミングを分析』したり、『サービスプロバイダーが、ユーザーに提供するサーバの位置を把握し、アクセス環境を最適化』したりといった使い方ができます。DXの取り組みでは、どうすれば顧客の体験価値を向上できるかが重要です。売り上げや注目履歴といったビジネスデータに加え、顧客の所在地(地理空間)、顧客の関心事や商品の供給率(時間ベース)、有効な販促期間と季節性(テンポラル)を組み合わせることで、これまで見えてこなかった顧客の姿を見ることができます」
こうした分析は、業務オペレーション分析と顧客分析を統合するものといえる。例えば、「現在販売促進中の商品に対して、購買意欲があり、かつ、自社店舗の近くに住んでいるロイヤリティーの高い顧客を特定し、対象顧客に対して最適なタイミングで、特別割引クーポンを送る」といったことが可能になる。「購買意欲が高い」「自社店舗の近くに住んでいる」「どのタイミングでクーポンが欲しいか」といった、“これまで見えてこなかったもの”を容易に可視化できるわけだ。この点はVantageの大きな付加価値の一つといえるだろう。
5つ目の質問は「Vantageにアップグレードするメリットは本当にあるのか」だ。テラデータに、実際にアップグレードした顧客の事例と感想を聞いてみた。これはある意味、最も気になる質問ではないだろうか。
ユーザー事例の有無や成果は、導入検討企業にとって大いに参考になる。小永井氏によると、Teradata DatabaseからVantageにアップグレードしている企業は100社を超えるなど、既存ユーザーからの関心は非常に高いという。
「国内初の企業としてはYahoo! Japan様があります。事前検証であるβプログラムに日本のユーザー企業としては唯一参加し、検証を行っていただきました。2019年5月に本格稼働を開始し、Advanced SQL Engineを活用したデータ分析を業務に取り入れていく予定です」
小永井氏は、Vantageの最大の魅力は「エクステンシブル」にあると強調する。
「Vantageでは、いろいろなエンジンを追加でき、既にあるデータソースを統合しながら、さまざまなツールを使い分けることができます。時代に合わせて顧客の環境も変われば、分析ニーズも変わります。その中で、新しい分析ニーズが登場したときも、Vantageならそのニーズに合った手法を、さまざまなリソースを組み合わせて、柔軟に対応していくことができるのです。Vantageはそんなシンプルな拡張性を提供していきます」
コンシューマーの世界では、スマートフォンにアプリを追加して必要な機能をスマートに取り込んでいくことができる。なぜエンタープライズの領域ではそうしたことができないのか?――近年はビジネス部門のユーザーを中心に、そうした不満を抱く向きも増えているが、Vantageはビジネスニーズの変容、データ活用リテラシーの向上と共に“育てていくことができる”というわけだ。既存資産の保護という意味でも合理的といえるだろう。
冒頭で述べたように、データ活用の取り組みはフェーズが進むほどに新たな課題が生じがちだ。その点、Vantageは多くの企業で顕在化している課題を解消しているとともに、各社各様のニーズに対してもVantageの拡張性と、テラデータの知見で共に立ち向かうことができる。
DXトレンドが進み、体験価値を高める新たなビジネスモデルが次々と生まれ、ビジネスのルールそのものが変わりつつある今、データ活用は企業の存続がかかったテーマだ。共に発展を狙うパートナー選びには、その真価を見出すためにもシビアな視点での評価が必要とされる。皆さんもVantageとテラデータを本気で評価、検討してみてはいかがだろうか。
本記事に関連して「テラデータ」と「Teradata Vantage」についてのアンケートを実施しています。回答された方から抽選で3名様にAmazonギフト券5000円分をプレゼントいたします。ぜひ下記アンケートフォームよりご回答ください。当選発表は発送をもって代えさせていただきます。
ログイン または 会員登録(無料)いただくとアンケートフォームが表示されます。オレンジ色の「アンケートに回答する」ボタンからアンケート回答をお願いいたします。
こちらのアンケートは終了しました
Copyright © ITmedia, Inc. All Rights Reserved.
提供:日本テラデータ株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2019年11月19日