グローバルな事例で学ぶ、「IoTデータレイク基盤」としてのSDSの活用方法:行動につながる知見をいかに効率的に生み出すか?
Dell EMCは2017年4月4日、セミナー「デジタル・イノベーションを促進するアプローチとテクノロジー〜IoT編」を開催。その講演模様をレポートする。
全ての企業がデジタル変革を活用した新たなイノベーションへ取り組むべき時代に入った――。こうした認識の下、Dell EMCは2017年4月4日、東京・秋葉原でセミナー「デジタル・イノベーションを促進するアプローチとテクノロジー〜IoT編」を開催。その中から、Dell EMCでSenior Director of Product Managementを務めるるクリス・アランジオ(Chris Arangio)氏の講演「グローバル事例から学ぶ!IoTデータレイク基盤としてのソフトウェアデファインドストレージ」をレポートする。
データと物理的リソースの共有をどう進めるか
アランジオ氏はEMCでの8年間に及ぶ勤務の間、SDS(ソフトウェアデファインドストレージ)を担当してきた経験から、2017年現在のIoT(Internet of Things)の動向について「センサーやインプットに焦点が当たっており、アプリケーションを支えるインフラが忘れられている傾向にある」と切り出した。
「顧客のレガシーなアプリケーションとインフラは縦型のサイロ型になっており、リソースの拡張や、データの活用が簡単に進まない。新しいアプリケーションを導入する際には物理的リソースを一緒に展開する必要がある。また、データをアプリケーション間で共有することも簡単にはいかない」
続いてアランジオ氏は「従来は、アプリケーションが必要とする最大限のリソースを用意しておかなければならなかったため、実際の運用ではリソースの利用率が低いという効率性の点でも問題がある」とし、「こうした多くの課題を、どのように解決するか?」と問題を提起した。
「リソースとデータの共有をいかに行うか」というこの問題を突き詰めると、データを一元的に格納できるプールを作ることになる。
「このような共有インフラを作っておけば、自動的にデータを共有できる環境ができ、データから共有できる知見が生み出されることになり、プールの中でその知見を全て活用できる」とアランジオ氏はSDS(Software Defined Storage)によるデータ活用の概要を解説した。
抽出された知見が行動につながるタイミングで提供
次にアランジオ氏はIoTの観点から、今、企業が抱えているそれぞれの課題について解説した。
「例えば、IoTをエンドツーエンドで完全に自動化したいという要望がある。そのためには、直ちに、行動に結び付けることができる知見が正しく生み出される必要がある」とし、「Dell EMCの技術はフォーチュン1000社の99%の顧客で使われているが、製造業、サービス、金融など全ての業種の顧客のほとんどがビッグデータやIoTを使って知見を得たいと考えている」と述べた。
「業界は異なっても、その基礎となるアーキテクチャの設計は同じだ。これをわれわれはワークフローという形で考える。まず、データの取り込みから始まり、データの保存、分析、可視化、その知見を基に何らかの行動をとるというワークフローだ」
そしてアランジオ氏は「大変シンプルだと考えるかもしれないが、実際は、これを大規模にできるかが問題となる。例えばデータの取り込みを大規模に行うにはどうするか? 世界中に何百万というセンサーを設置して、そのデータを取り込むなどはその例だ。また、どのようなストレージを作ればよいのか? データの分散という観点から地域的にデータの分散保存が確保されていつつ、データの取り込みや分析が完全に行えるストレージをどのように作ればよいのか?」と指摘した。
「分析機能では複数の課題に対して分析を行うことが必要だが、その分析結果を必要としている人に対して、その知見がビジネスにとって意味を持つ間に、具体的な行動をとることができるようなタイミングで提供することが重要だ」(アランジオ氏)
IoTや、ビッグデータが陥る“わな”
ここでアランジオ氏は実例として北米のあるヘルスケア企業を挙げた。
その企業では、Hadoopベースのヘルスケアデータの分析に1カ月をかけていた。アランジオ氏が「なぜ1カ月もかかったのか? どのくらいのデータを分析したのか?」と尋ねたところ「実際にジョブを走らせたのは1時間程度。一方、データを収集するのに29日程度かかった」という答えだった。
アランジオ氏は「ここがIoTや、ビッグデータが陥ってしまう“わな”だ」とした。「現実のビジネスに活用できるような知見にするためのアーキテクチャを作るところに非常に時間がかかる。鍵となるのは29日間に、担当者がデータのある場所に行って、その場その場のやり方でデータの分析を行ったことだ。これを1カ月もかからずに、毎時、知見を取り出すことができるようにする。それが課題だった」。
これらの問題を解決するためにSDSは非常に重要だという。
アランジオ氏は「ストレージは一般に、アプリケーションを作成するときに最後に考えられる項目だ。ところがわれわれの見ているところでは、最初に適切なストレージを選択しないと、IoTが最終的に機能しないものとなる。ストレージは当たり前のものと捉えられているが、実際にプロジェクトが成功するかどうかはストレージと、その拡張性、ストレージと分析の統合に因ることが大きい」と述べた。
そうした中で「われわれが提供しているのがECS(エラスティッククラウドストレージ)だ。ECSはグローバルに使用可能なコンテンツリポジトリ。単一サイト、複数サイトでも拡張が可能。サイト数が幾つあろうと、データ量がどのくらい大きくても、どこからデータが来ようと、ECSはデータの取り込みにも、分析にも柔軟に対応する。データ保護についても、さまざまなデータに同じように対応できる」とアランジオ氏はECSの有用性について語った。
ECSではプラットフォームにDR(Disaster Recovery:災害復旧)機能が内蔵されており、いったん導入すれば非常に強固なIoTプラットフォームが構築される。ここでアランジオ氏はECSのアーキテクチャについて解説した。
「まず、ECSは階層型のアーキテクチャであり、最下層にデータが置かれる場所であるデータソースがあり、その上のプレゼンテーション層では、異なるプロトコルを理解する。ここにオブジェクト、ファイル、ストリーミングストレージのプロトコルも今後加わる予定だ。
これらをグローバルに複数展開して、一元的に1つのインタフェースから管理可能であり、トポロジーについても、グローバルに分散されたトポロジーをグローバルに展開できる。リソースの共有についても一元的なデータプールの作成により、単一のアプリケーションへの対応でなく、全てのアプリケーションへの対応が可能となる」
欧州の自動車部品サプライヤーの事例
次に、アランジオ氏は実際の顧客事例において、IoTをどのように実現しているかを解説した。
最初に取り上げたのは欧州の自動車部品メーカーで、自動車メーカーにセンサーを供給し、センサーで収集したデータを全ての自動車会社が活用できるようにしている。一方、自動車会社は、収集されたテレメトリデータをHadoop、Sparkなどを使って車の中で何が起きているのかを把握、そこから知見を生み出し、活用しているという。その中には例えば「いつ車を保守に出すべきか」など、車のオーナーに提供される知見もある。
ここでアランジオ氏は「この10年間に車を購入した人は、自動車販売会社からさまざまな情報をメールで受け取っていると思うが、これは購入データを分析した結果、送られてくるものだ。ところが、1年半ほど前に車を購入した人では、まだ、2000マイルしか走っていないのに、1万マイルを走ったらチェックに来てほしいとのメールを受けた。デーラーに連絡したところ、まだ走行マイルが満たないので、保守の予定は組めないということだったという」と説明。
その上で「今後、この業務は走行距離な1万マイルを超えると、この部分の保守が必要となるという仮説に基づかないで、直接、問題が起きている部分を対象にできるようになる」と述べた。
さらに「メールで連絡するのではなく、車自体が自分自身の状態を知るようになったら、どうか? 例えば、利用客に知見を提供する他、メーカーに対して同一タイプの車に見られるシステム上の問題を早期の警告として指摘する」と解説。「カーメーカーは裁判やリコールを繰り返しているが、これらのコストを削減するためにECSはインテリジェンス、分析能力を提供することになる。つまりECSは「問題が実際に起きる前に予防的な行動をとることで大きな損失を防ぐ基盤となる」。
自然の生態のモニタリング会社の事例
またアランジオ氏は、別の事例として、自然の生態を監視するモニタリング会社を取り上げた。同社では、例えば地震感知や、人工衛星に搭載するセンサーまでさまざまなセンサーを使っている。
このデータを世界の研究者に提供し、彼らが分析して知見を生み出すという活動を行っている。「何万というサイトから、例えば動画や地震情報など、さまざまな異なる情報が来て、それを効率的に一元的に収集し、グローバルに活用できるようにすることはかなり複雑なものとなる。この顧客は、IoTという言葉が登場する前からこうした活動を行っているが、分析のモデルは変化しているものの、エコシステムに対するモニタリング能力が必要だという基本的なニーズは変わっていない」(アランジオ氏)。
この顧客は、従来はファイルシステムを使い、そこにデータを収集し、アクセスもそこに行っていた。ところが、多くの研究者がリアルタイムでアクセスし、十分な知見を生み出せるようにするという自分たちが目指していた目的は達成できていなかったという。
「これは先ほどのヘルスケアの企業と似ている。研究者がほとんどの時間をデータのクリーニングとか、データが置かれているファイルから分析するために自分のところにデータを持ってくる時間がかかっていた。このことは使用されているアーキテクチャ自体が間違っていることを示唆している。コストが掛かり効率も悪いが、そこから出てきた知見も果たして正しいものか疑わしくなる。研究者は全ての情報にアクセスしていたのか? アクセス性が良いとの理由から一部の情報しか使用していない恐れもある」
この顧客ではアクセス性を上げることで研究者が実際の研究に注力できるようにした。これを行うことで管理コストが下がったという。
収集したデータを、どのアプリケーションでもきっちり使えるインフラが重要
最後の例は、北米で500以上の店舗を持つ雑貨店。各店舗にキャッシュレジスターがある。各店舗に分散されているデータを1カ所に集め、グローバルな知見を得て活用したいと考えた。
「HadoopとPivotalの両方を使用し、課題をバッチとリアルタイムの両方で検知する取り組みを行った。最終的な目的は不正が起きる前に見つけ出すこと。不正の例としては顧客が実際に購入していないものを返品しようとすることで、他人のクレジットカードの使用だ。このため、自社のデータだけではなく、外部の与信データや、ビデオ監視データなどの活用も行っている」
これらの目的を達成するために、アランジオ氏は「どこで知見を得るかではなく、北米全体に何万台と広がっているキャッシュレジスターからデータを1カ所に集め、多くのアプリケーションがデータに対して同じように使えるようにすること必要だ」と述べた。
最後にアランジオ氏は、インフラストラクチャの重要性について強調した。「デジタルビジネスは、どのアプリケーションについても、集めたデータをきっちりと使えるような状態を維持するインフラストラクチャを構築できるかで決まってくる」
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- EMCジャパン、データセンターと企業の「モダナイズ」を実現する新製品群
EMCジャパンは、「モダンデータセンターへの変革」や「企業のデジタルトランスフォーメーションの実現」に向けた新製品群を発表した。2016年第3四半期より順次提供を開始する。 - EMCのバイアス氏が、同社のオープンソース戦略を説明
米EMCのテクノロジー担当バイスプレジデント、ランディ・バイアス(Randy Bias)氏は2015年10月21日、東京都内でプレス・アナリストに向け同社のオープンソース戦略を説明した。同社にとってオープンソースは、第3のプラットフォームの時代の主役だという。 - EMCジャパン、ソフトウエア定義型ストレージとコモディティサーバーを組み合わせた「ScaleIO Node」を発表
EMCジャパンが、ソフトウエア定義型ストレージソフトウエア「Scale IO」を搭載したサーバー製品を発表した。必要に応じてスイッチやラックも提供するという。