データ基盤の高速性・拡張性が、ビジネス差別化のカギを握る理由IoT/X Tech全盛時代、データ基盤の“新たな要件”とは?

国内でもデジタルトランスフォーメーションが進展し、IoTやX Techの取り組みが活発化している。これを受けて、「膨大なデータからいかに素早く潜在・顕在ニーズをつかむか」「データをいかに迅速にアクションに変えるか」というテーマが多くの企業にとって課題となっている。こうした中、データ基盤として国内でもフラッシュストレージの導入が進んでいるが、年々データ量が増大し、よりスピーディな分析・処理が求められるようになりつつある中で、差別化を支えるデータ基盤にはどのような要件が求められるのだろうか? 米Dell EMCに話を聞いた(聞き手:@IT編集長 内野宏信)。

» 2016年12月01日 10時00分 公開
[PR/@IT]

「膨大なデータをいかにスピーディにさばくか」は全業種にとって喫緊の課題

編集部 昨今、国内でもデジタルトランスフォーメーションのトレンドが着実に進んでいます。特にUberのような、“ITで生み出した新たな価値”が既存の業界構造を破壊してしまう“デジタルディスラプション”に対する危機意識は多くの企業が抱いており、IT活用の在り方を見直す動きが高まっていると思います。McCoolさんは昨今のビジネス環境をどのように見ていますか?

image 米Dell EMC シニアバイスプレジデント エマージングテクノロジーデビジョンDSSD担当ジェネラルマネージャー ジョン・マックール(John McCool)氏

McCool氏 グローバルと日本のマーケットには共通点が多く、アナリティクスやディープラーニングに高い関心が寄せられている傾向は同じだと思います。特にIoTについては、グローバルで見ても日本は非常に活発化していると感じます。実際、IoTのトレンドを受けて、多くの企業で「第三のプラットフォーム(※)」に向けた取り組みが進んでおり、われわれも「第二のプラットフォームから第三のプラットフォームへの橋渡し」の支援に注力しているところです。例えば顧客企業からは、「基幹系も含め、既存システムにあるデータをどう生かすか」「新しいプラットフォームと既存システムをどのように連携させて、両者のデータをどのように分析していくか」といった課題が数多く寄せられています。

※米IDCが提唱しているコンセプト。ビッグデータ、クラウド、モビリティ、ソーシャルという4領域で構成される情報基盤を指す。第一のプラットフォームはメインフレーム、第二のプラットフォームはクライアント/サーバシステムを指している

編集部 それはWebサービス系に限らず、あらゆる業種の企業において、ということですね? 実際、国内でも製造業に限らず、金融、流通・小売り、不動産、アパレルなど、各業種で分析やアプリケーションの機能を生かして“新たな利便性”を提供する“X Tech”に取り組む企業が増えています。

McCool氏 そうですね。例えば小売業なら、Web上に限らず、センサーを設置したリアル店舗など、顧客の行動履歴を取得する場はあらゆる環境に広がっています。そうした行動履歴データや基幹システムなどのデータを分析して、いかに収益・ロイヤルティ向上に役立てるかというテーマには多くの企業が取り組んでいます。製造業なら工場や製造機器に設置したセンサーデータを基にした故障予兆検知など、金融業なら取引データなどを分析してリスク分析、不正検知などに役立てています。こうした動きは各業種で着実に広がっていると思います。

 そしてこれらに共通するのは、「膨大なデータをいかにリアルタイムに分析してスピーディにアクションに変えるか」という問題です。特にビジネスで差別化を図る上では「リアルタイムに分析できるスピード」がポイントとなります。これを実現する上では、膨大なデータに対して極めて高速/低レイテンシーでアクセスできる必要があります。

 昨今の分析ニーズを受けて、各種クラウドサービスプロバイダーにも、優れたパフォーマンスと拡張性が求められていますよね。例えば「HDFS(Hadoop Distributed File System)上に展開された膨大なデータにスピーディにアクセスでき、リアルタイムで分析を行える」といったことがサービスの差別化要素になっています。ただ、年々デジタルビジネスの競争が激化している今、一般的な企業においてもそうした環境の必要性は確実に高まっています。そこで弊社でも、クラウドサービス同様の環境を顧客企業のネットワーク内に構築できる各種製品・サービスを用意しているのです。

最大1000万IOPS。48台のサーバと接続可能。パフォーマンスと拡張性を両立した「DSSD D5」

編集部 オールフラッシュストレージの企業導入が進んでいるのも、そうした課題認識を受けてのことだと思います。ただ「膨大なデータ量への対応/データアクセスの高速性」という要件に照らすと、選択肢としてはネットワーク接続・サーバ共有型のオールフラッシュアレイと、PCIeバスに直結するサーバサイドフラッシュがありますが、それぞれ課題もありますね。

McCool氏 オールフラッシュアレイのメリットは、高速なデータアクセス、優れた拡張性やメンテナンス性、複数サーバで共有できリソースを効率的に使えることが挙げられます。しかし、ネットワーク接続するオールフラッシュアレイは、PCIeバスに直結するサーバサイドフラッシュに比べるとパフォーマンスの制約を受けざるを得ません。一方、サーバサイドフラッシュは、極めて高速なデータアクセスを実現しますが、複数サーバで共有できない他、搭載できるフラッシュの容量も限られてしまいます。

 「直結」しているために、ストレージとサーバを切り離せないことも問題です。ストレージ容量を拡張しようとすると、コンピュートリソースも増やさなければならない。つまり、本来必要のないリソースまで追加しなければならないオーバープロビジョニングが発生してしまう。高パフォーマンスを得ることで拡張性が犠牲になっているわけです。

編集部 まさしくそうした「パフォーマンスと拡張性の両立」という課題を解決した製品が、2016年3月に発表したオールフラッシュストレージ「DSSD D5」というわけですね。

McCool氏 その通りです。DSSD D5は、サーバからストレージを切り離し、PCIeケーブルで複数のサーバと接続できるようにした共有型オールフラッシュストレージです。サーバにはPCIe Gen3を使って接続し、SAS/SATAより高速な通信プロトコルであるNVMe(Non-Volatile Memory Express)技術を利用することで、共有ストレージでありながらサーバサイドフラッシュのような低レイテンシーと広い帯域幅を実現しています。

ALT 図1 DSSD D5の特長。極めて高いレベルでパフォーマンスと拡張性を両立している《クリックで拡大》

 具体的には、96のポートを持ち、各サーバと2本のNVMe PCIeケーブルで接続するため最大48台のサーバと接続できます。レイテンシーは平均100マイクロ秒、スループットは100GB/秒、最大1000万IOPSというスペックです。これにより、高度なパフォーマンスが求められるアプリケーションでも確実に性能を発揮できるようになります。

 このように新しいアーキテクチャで設計されたフラッシュを、弊社では「ラックスケールフラッシュ」と呼んでいます。ある小売業で、オールフラッシュアレイで稼働させていた業務アプリケーションをラックスケールフラッシュに移行しただけで、Oracle Databaseへのクエリーが6倍高速になったという事例もあるなど、データ処理の大幅な高速化をシンプルに実現できるのです。

用途特化型アプリケーションや、IoTに不可欠なリアルタイム分析などで威力を発揮

編集部 ではDSSD D5がマッチする適用領域とは具体的にはどのようなものなのか、ユースケースを教えて下さい。

McCool氏 1つはデータベースの高速化です。既存のフラッシュでは対応できないレベルのリアルタイム分析が求められる領域に適しています。2つ目は、Hadoopベースのビッグデータ向けアプリケーションの高速化。HDFS上でのSQLクエリーやSparkアプリケーションなどを高速化できます。3つ目は、GPFS(General Parallel File System)などのカスタムアプリケーションの高速化。政府官公庁、金融、小売、製造、医療、通信、メディアといった各業種で用いられる用途特化型アプリケーションの高速化にも適しています。

編集部 発表後、8カ月が経過しましたが、これまでにどのような事例がありますか?

McCool氏 日本では東芝と共同で、ビル・ファシリティ分野におけるディープラーニングのテストベッドを実施しています。このテストベットは、IoTにディープラーニングを活用した初のテストベッドとして、インダストリアル インターネット コンソーシアム(IIC)から承認を得ました。DSSDは、このディープラーニングプラットフォームを支える高速ストレージとして使用されています。これにより、従来のようにデータサイエンティストが膨大なデータを見て分析するのではなく、ディープラーニングを活用したいというニーズに応えることができるようになりました。

ALT 図2 「ディープラーニング ファシリティ テストベッド」の概要。DSSD D5は、このディープラーニングプラットフォームを支える高速ストレージとして使用されている

 ただ、ディープラーニングでは、ニューラルネットワークに極めて高い計算処理性能が求められます。よって複数のサーバをつなげる必要があるのですが、そうなるとノード間のデータのやり取りがボトルネックになる。そこでDSSD D5を用いて、パフォーマンスをスケーラブルに拡張できるようにしたのです。これはグローバルで見ても先端を行く事例だと思います。

参考リンク:「Dell EMCと東芝、共同提案したビルやファシリティ向けIoTテストベッド「ディープ ラーニング ファシリティ テストベッド」をIICが承認」(Dell EMCのプレスリリース)

 海外では、ヘルスケア業界向けサービスプロバイダーの米CMAの事例があります。オールフラッシュアレイに展開していたOracle RACをDSSD D5に移行したところ、20分かかっていた11TBのデータベースのフルスキャンが、3分以下にまで短縮されました。

 HPC(High Performance Computing)分野では、米TACC(Texas Advanced Computing Center)が、「Wrangler」と呼ばれるHPCにDSSDを採用しています。2億5000万IOPS、1TB/秒というスループットに対応するため、DSSDが選ばれました。ゲノムDNA配列の解析手法である「DNAシークエンシング」などにかかる時間を大幅に短縮した実績が報告されています。

優れたパフォーマンスが、アプリケーションの可能性を拡大

編集部 昨今の経営環境では、ニーズの変化を察知してアクションを起こすまでの「スピード」が差別化の条件になるといわれています。また、ITインフラに掛かるコストの多くを運用管理コストが占めていることから、「インフラ運用を効率化して、その分のリソースを収益向上につながるような作業に割くべきだ」といったことも指摘されています。その点、先に「オールフラッシュアレイで稼働させていた業務アプリをDSSD D5に移行した“だけ”で、Oracle Databaseのクエリーが6倍高速になった」という話がありました。DSSD D5はビジネスの生産性と同時に、エンジニアの生産性にも寄与しそうですね。

McCool氏 そうですね。例えばデータベースエンジニアがデータベースのパフォーマンスを高めようとする場合、データをコピーして「参照向けデータ」を作ることでアクセス性を高める、データにインデックスを作成してアクセス速度を高める、マテリアライズドビューを利用する、クエリーをチューニングする、などデータアクセスを高速化するさまざまなアプローチがあります。

 しかしストレージのパフォーマンスが飛躍的に高まると、こうした作業がほぼ不要になるのです。インデックス作成などの作業がなくなることで、生産性が3倍高まったという例もあります。そうして作業時間が減れば、その分を別の作業に充てることができますし、運用管理コストの削減にもつながるわけです。

編集部 デジタルトランスフォーメーションが進む中、アプリケーションの機能はますます高度化し、扱うデータも増え、ビジネスでは“これまでになかった価値”が常に求められています。人・コストの両面で、どこにリソースを割くべきか、あらためて見直すべきだということかもしれませんね。

 ただ一般に、IoTやX techにおけるデータ分析というと、まずパブリッククラウドの利用を考える向きが多いと思います。DSSD D5のようなデータ基盤をオンプレミスに持つ意義を教えていただきたいのですが。

image 「スモールスタートしたばかりで、小さく遅いアプリケーションのうちはパブリッククラウド上の運用でも問題ありませんが、データ量が膨大になり、リアルタイム処理が求められるようになると、オンプレミスでデータを持った方が合理的です」

McCool氏 例えば、高度なパフォーマンスが求められるアプリケーションを運用する場合、低レイテンシーや帯域幅の重要性が一層増してくるといえます。スモールスタートしたばかりの、小さく遅いアプリケーションのうちはパブリッククラウドでも問題ありませんが、データ量が膨大になり、リアルタイム処理が求められるようになると、回線やレイテンシーが課題となって、それを補完するために自ずとコストがかさんでくるはずです。

 特に解析など、大量データの高速処理が不可欠な分野は、最初からデータをオンプレミスに置くことが成果を得るポイントになると考えます。セキュリティやガバナンスの面でも、オンプレミスの方が管理しやすいケースは多いのではないでしょうか。

編集部 昨今は“クラウドありき”で考える傾向も強いですが、インフラは目的に応じて使い分けることが重要というわけですね。ただ、多くの日本企業はデジタルディラプションに対する危機感はあるものの、そうしたインフラの使い分けも含め、デジタルトランスフォーメーションに向けて何から取り組めばいいのか分からない、といった声も多くあります。

McCool氏 それは日本に限らず、世界中の企業が抱えている悩みだと思います。デジタルビジネス時代に適応した、新しいビジネスモデル、新しいアプリケーションを企画・開発・運用すること、その基盤を整えることは決して簡単ではありません。そこでDell EMCでは、データとコンピューティングの領域において、第三のプラットフォームに向けた既存システムの合理的なモダナイゼーションを、あらゆる側面から支援しているのです。

 中でもDSSD D5の圧倒的なパフォーマンス・拡張性は、社内向け/社外向け問わず、アプリケーションで実現できる“新たな価値”の可能性を大きく広げることになります。“既存のテクノロジーでは解決できなかったパフォーマンスの課題”を抱えている企業にとって、DSSD D5は大いに役に立つはずです。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:EMCジャパン株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2016年12月31日

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。