DXのためのデータ整備にはこう取り組むべき、セミナーで議論注目を集める「データ仮想化」、実践のポイントとは

DXではデータの活用がカギとなる。そして、データ活用の成否を左右するのがデータの整備、つまりデータマネジメントだ。本稿では、企業がデータマネジメントにどう取り組むべきかをテーマに開催されたオンラインセミナーの内容をレポートする。

» 2024年03月06日 10時00分 公開
[PR/@IT]
PR

 DX(デジタルトランスフォーメーション)やAI(人工知能)技術の活用が進む中、データマネジメントの重要性が認識されるようになった。DXやAI活用を支えるのはデータであり、データをどうマネジメントするかで変革の成否が大きく変わるからだ。

 とはいえ、自社がどうデータマネジメントに取り組めばいいのかイメージがつかめない、自信が持てないといった企業のIT担当者は珍しくないのではないだろうか。

 本稿では、企業がデータマネジメントにどう取り組むべきかをテーマに開催されたオンラインセミナーの模様をレポートする。

データ整備ができないと、データ活用はうまくいかない

 基調講演には風音屋 代表取締役 ゆずたそ(横山翔)氏が登壇。「データマネジメント入門 −DX推進を支えるDX基盤の重要性−」と題して、データマネジメントがなぜ重要なのか、何が必要なのか、どのように実現するのか、ポイントを解説した。

風音屋 ゆずたそ(横山翔)氏 風音屋 ゆずたそ(横山翔)氏

 ゆずたそ氏は、これまでに30社以上のデータ分析を支援し、プロダクト成長に貢献したキャリアを持つ。『データマネジメントが30分でわかる本』の著者としても有名だ。

 データ活用やDXが注目されているが、プロジェクトを進めると「必要なデータが入力されていない」「データ品質が低い」「どうデータを連携させるか分からない」など、データ整備の課題が次々と浮上する。

 「そうした課題に対して重要なキーワードがデータマネジメントです。データマネジメントはデータを資産として安全、安心、簡単に使えるようにする活動です」(ゆずたそ氏)

 データマネジメントはなぜ重要なのか。その大きな理由は、さまざまなデータが多様な施策で活用されることにある。事業運営においては、商品の販売数、登録数、利用率など複数の指標がある。こうした多様なデータを施策の効果測定や傾向分析、新商品開発などに生かす必要がある。

 だが、データを活用しようとすると立ちはだかる壁は幾つもある。「誰も見ないダッシュボード」「なかなか本番に至らない機械学習スクリプト」「世の中のキラキラした事例に比べて自社は失敗だらけ」などだ。こうした壁の背景に、データマネジメントの課題が透けて見えるという。

 「よくあるのは『データが体系的、組織的に管理されていない』『急いで分析したいのにすぐに分析できない』『暫定対応で手元のシートで独自集計する』といったサイクルが繰り返される構造です。データを整備しなければデータを活用できませんし、ビジネス価値を生み出すこともできません」(ゆずたそ氏)

自社に適した分野を選定、「総合格闘技」として楽しみながら取り組む

 では、どんな取り組みを進めればよいのか。ゆずたそ氏は、「DWH(データウェアハウス)とBI(ビジネスインテリジェンス)」「データセキュリティ」「データストレージとオペレーション」「データ品質管理」「データガバナンス」などの項目があることを紹介した。

 「どの領域に注力するかは、状況によって変わります。組織運営を考えるなら、データガバナンスに注力し、責任やルールが決まっていないといった課題を解決することをお勧めします。既存データが使い物にならないといった課題を解消するにはデータ品質に注力すべきです」(ゆずたそ氏)

 では、データマネジメントをどのように実現していけばよいのか。ゆずたそ氏は、「アーキテクチャの検討」「実際のシステムを開発するプロセス」「システムを開発した後に安定して運用するプロセス」という3つのフェーズでポイントを解説した。その上で次のように述べた。

 「データマネジメントはいわば総合格闘技です。マネジメントやエンジニアリングの面白さや難しさが詰まったやりがいのある分野です。難しい中でも楽しんで取り組んでほしいと思います」(ゆずたそ氏)

複雑なETLやセキュリティを解消する「Starburst Enterprise」の導入効果とは

 続いてデータアナリティクス企業のStarburst Data ソフトウェアエンジニア Trinoメンテナーの蛯原裕弥氏が登壇。「Starburst Enterpriseの機能と利用効果」と題して、データマネジメントを推進する際にデータをどうつなぎ、分析していけばよいかを同社の製品機能の面から解説した。

Starburst Data 蛯原裕弥氏 Starburst Data 蛯原裕弥氏

 Starburst Dataは、オープンソースの分散SQLクエリエンジン「Presto」の後継である「Trino」をベースにしたデータ仮想化ツール「Starburst Enterprise」を展開する。

 Starburst Enterpriseを採用するメリットは大きく分けて3つあると蛯原氏は説明した。

 1つ目は、多様なデータに対するフェデレーションだ。オンプレミスや、オンプレミスとクラウドを併用するハイブリッドクラウド、複数の異なるクラウドをつなぐクロスクラウドでの分析が可能になる。

 2つ目はレガシーなデータレイクをモダナイズできることだ。IcebergやDelta Lakeといったオープンなテーブル形式を使うことで、DWHと同レベルの機能を提供しながら、ベンダーに依存することなくスケーラブルな仕組みに移行できる。

 3つ目はDWHの補完だ。既存のDWHを置き換えることなく、データレイクとDWHの長所を生かした分析が可能になる。

Starburst Enterpriseのメリット(提供:Starburst Data) Starburst Enterpriseのメリット(提供:Starburst Data)

 企業インフラにはさまざまなデータがあり、エンジニアが複雑なETL(抽出/変換/ロード)を用いての加工や、セキュリティを確保しているのが実態だ。「Starburst Enterpriseは、既存のデータベースやDWHにアクセスするための単一のアクセスポイントを提供できます。セキュリティについても、データ形式を問わずカラムレベルおよびレコードレベルで一元的に権限をコントロールできます」(蛯原氏)

データマネジメントの構成要素であるデータ仮想化、自社に最適なパターンの検討を

 続いて、デル・テクノロジーズ データワークロード・ソリューション本部 DA/AI担当シニアスペシャリスト 小野良夫氏が登壇。「デル・テクノロジーズが提供するデータ仮想化ソリューション」と題して、同社がデータマネジメントをどう考え、どのような価値を提供できるのかを解説した。

デル・テクノロジーズ 小野良夫氏 デル・テクノロジーズ 小野良夫氏

 DXやAIは一般的に、全社レベルでのデータマネジメントが前提となる。だが、ほとんどの企業では扱うデータ量が膨大なためシステムのサイロ化が進み、データベースがオンプレミスとクラウドに分散している状況だ。「従来はETLでデータを1カ所に集めていましたが、現在の状況では時間と手間がかかり付加価値につながりにくい状況です」(小野氏)

 こうした課題の解決策の一つが「データ仮想化」だ。データ仮想化の定義はさまざまだが、単一のアクセスポイントを経由して複数のデータソースにアクセスできるようにすることが重要だという。

全社データ共通基盤のポイント(提供:デル・テクノロジーズ) 全社データ共通基盤のポイント(提供:デル・テクノロジーズ)

 「データ仮想化はデータマネジメントを実現するインフラの一つです。デル・テクノロジーズが考えるデータマネジメントは、既存のDWHとBIの機能だけでなく、多様なデータと安全にリアルタイム連携することや、品質の高いデータを提供してデータ活用の生産性を向上させるための基盤や人材、プロセスの管理も含みます」(小野氏)。例えば、セールスで活用するために個人情報をマスクしながらリアルタイムに連携させるといった取り組みが可能だという。

 デル・テクノロジーズは2023年2月にStarburst Dataと戦略的なパートナーシップを締結し、検証済みのハードウェア構成である「Dell Validated Design」、Starburst Enterpriseライセンス、コンサルティングと構築を行うプロフェッショナルサービスを提供することで、顧客のハイブリッドクラウドにおけるデータ活用の取り組みをサポートしている。

全社データ基盤を構築してデータドリブンマネジメントを推進するNTT Com

 最後のセッションでは、NTTコミュニケーションズ(以後、NTT Com) デジタル改革推進部データドリブンマネジメント推進部門 担当部長 西塚 要氏が登壇し、「データドリブン企業に変革するためにTrinoがわが社で果たした役割」と題して、NTT Comの自社事例を紹介した。

NTT Com 西塚 要氏 NTT Com 西塚 要氏

 NTT Comでは、デジタル改革推進部データドリブンマネジメント推進部門がデータ活用の環境整備、分析支援、データ活用人材の育成などに取り組んでいる。

 同部門は、「データ収集」「蓄積」「分析」の3つの役割を持つ。トップダウンのアプローチとしては、経営分析に生かすためのKPI(重要業績評価指標)のモニタリングや意思決定支援に取り組む。またボトムアップのアプローチとして、セールス、サービス、オペレーション、スタッフなどの業務部門が抱える課題を、データを用いて解決に導いている。

 「DXを推進するに当たって、組織の壁、システムの壁、データの壁という3つの壁に直面しました。取り組んだ時点ではサイロ化が進行し、合計1000に上る全社システムがあり、必要なデータの収集に長い時間がかかり、マネジメントもできていませんでした」と西塚氏は振り返る。

 そこでNTT Comは2020年に全社データ組織を立ち上げ、各組織に乱立していたデータ基盤を統合し、全社データ基盤としてシステム規定に明記。データマネジメントの整備を進めた。

 全社データ基盤は「Datalake for Everything」(DLX)と呼ばれ、セキュリティ、ハイパフォーマンス、スタビリティ、ユーザビリティ、オブザーバビリティという5つの信条の基にオンプレミスで構築された。

 DLXにはTrinoも採用した。採用の理由は、標準SQLに準拠したアクセスのワンストップ提供、容易なスケールアップ、処理速度などを評価したという。

 「活用シーンとしては、膨大なデータから探索的にビジネスインサイトを探すアドホッククエリ、汎用(はんよう)的に利用できるデータマートの作成、BI連携による生データやデータマートの可視化などです。発展的な利用として生成AIとTrinoの接続にも取り組んでいます」(西塚氏)


デル・テクノロジーズ 堀田鋭二郎氏 デル・テクノロジーズ 堀田鋭二郎氏

 セミナーの最後には、デル・テクノロジーズ データワークロード・ソリューション本部 本部長 堀田鋭二郎氏が登壇し、次のように締めくくった。

 「デル・テクノロジーズのカスタマーソリューションセンター(CSC)は、Starburstのデモやシステム検証、ハンズオン、ワークショップも実施しています。また、デル・テクノロジーズは、プロフェッショナルサービスによるデータマネジメントコンサルティングも提供しています。IT基盤のみならず、人材育成、プロセス定義でユーザーのデータ活用を促進します」(堀田氏)


オンデマンド配信中
「データマネジメント環境改善になぜ “データ仮想化”が注目されているのか?」

データマネジメントやデータ仮想化についてもっと知りたい方は、こちらのページから今回紹介したセミナーのオンデマンド版をぜひご視聴ください。パネルディスカッションや各社セッションを全てご覧いただけます。

dell_webinar

Copyright © ITmedia, Inc. All Rights Reserved.


提供:デル・テクノロジーズ株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2024年3月14日

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。