「データは“AIの燃料”」──AI時代に求められるデータマネジメントのポイントとはビジネスに生成AIをどう組み込むべきなのか

生成AIのビジネス活用に注目が集まっている。だが自社で収集、蓄積してきたデータとAIをどう組み合わせればよいのか。有識者は「生成AI時代には2つのアプローチが重要になる」と指摘する。データマネジメントの観点からポイントを聞いた。

» 2023年11月24日 10時00分 公開
[PR/@IT]
PR

 AI(人工知能)のビジネス活用が本格化してきた。最近は特に生成AIが注目されており、さまざまな領域で取り組みが進んでいる。AIへの期待感は高まるばかりといった状況だ。こうした中でその重要性が再認識されているのが「データ」だ。企業がAIを活用する場合、「これまで収集、蓄積してきたデータをどのようにしてAIで活用するか」といったデータマネジメントの資質が問われることになる。

 AI時代におけるデータマネジメントの重要性を認識し、取り組みを強化しているのが、デル・テクノロジーズだ。

画像 デル・テクノロジーズのローシャン・クマール氏

 ハードウェアベンダーのイメージがある同社だが、データマネジメントの領域でもさまざまな製品やサービスを提供している。デル・テクノロジーズのローシャン・クマール氏(非構造化データソリューションシステムエンジニアリングディレクター アジア太平洋、日本、中華圏担当)は、こう話す。

 「データは“AIの燃料”と言えます。データがなければAIは成立しません。デル・テクノロジーズの創業者、マイケル・デル氏は『世の中で起こっている興味深い事柄を見ると、その中心にはいつもデータがある。データマネジメントが不可欠であり、データを安全に保護するためのコンピュータエンジンも必要になる』と述べています」

 データマネジメントは、これまでも多くの企業が取り組み、奮闘してきた歴史がある。ただ、今日のデータは、量、質、生成頻度といった面でこれまでにない成長を遂げており、「企業は新たな課題に直面するようになった」とクマール氏は指摘している。

 「調査会社の調べによると、今後もデータは爆発的に増加する見込みです。エッジ領域などデータセンターの外で生成されるデータが全体の多くを占め、グローバル企業のほとんどがマルチクラウド戦略を採用すると予測されています。そうなれば、データの分散化やサイロ化の課題はますます深刻化するでしょう。生成AIを含むAIがビジネスに不可欠な存在になりつつある中、適切なデータマネジメント戦略が求められています」

AI時代のデータマネジメントにおける5つの課題

 クマール氏は、企業がデータマネジメントで直面する課題を5つ挙げる。

  • マルチクラウド化によるデータの分散
  • データのサイロ化とデータコピーの困難さ
  • プロプライエタリなツールとプラットフォーム
  • セキュリティとガバナンス
  • AIプロセスへのデータの渡し方

マルチクラウド化によるデータの分散

 企業はオンプレミスや単一のクラウドだけでなく、複数のパブリッククラウド、プライベートクラウド、エッジなどを併用しており、それぞれの環境でデータを管理することが増えた。そのため、しっかりと対策していない環境ではデータの分散化が進んでいる。

データのサイロ化とデータコピーの困難さ

 オンプレミス、クラウドなどさまざまな環境に分散したデータを収集するには、データをコピーする必要がある。だが、クラウドの場合、データ転送のためにコストがかかる上、大規模なデータになるとコピーすること自体が難しい。さらに、複数のコピーが作成され、分散化が進むという悪循環にも陥りやすい。

プロプライエタリなツールとプラットフォーム

 データの収集から廃棄に至る一連のライフサイクルの中で多種多様なオープンソースソフトウェア(OSS)が活用されるようになった。それらに対応していないプロプライエタリ(独自の、専用の)ツールやプラットフォームはデータ活用のための環境を準備できなくなっている。また、OSSであっても利用できる数が膨大で管理の難易度が上がっている。

セキュリティとガバナンス

 収集したデータの中には機密性の高いものもある。社内のアクセス権限管理はもちろん、ランサムウェアをはじめとするサイバー攻撃への対策も必要だ。

AIプロセスへのデータの渡し方

 AI活用に向けたデータマネジメントの仕組みやアプローチを整備する必要がある。

 「こうした5つの課題に対応するために、企業はこれまで2つのアプローチを採用してきました。データを1カ所に集める『Single Source of Truth』(単一の情報源)と、データへのアクセスを1つに統合する『Single Point of Access』(単一のアクセスポイント)です」

企業を支援するため、まず自分たちから変わる

 単一の情報源は、統合DWH(データウェアハウス)のようなデータ基盤を構築し、そこにデータを集めるアプローチだ。データレイクやデータレイクハウスなどがそれに当たる。単一のアクセスポイントは、データ仮想化技術を使って、データを1カ所に集めるのではなく、クラウドなどに置いたまま管理する仕組みだ。

 デル・テクノロジーズはデータ分析を得意とするStarburstとパートナーシップを構築している。同社が提供する「Starburst」は、データウェアハウスやデータレイクなど複数のデータソースに格納されているデータに対し、単一のクエリで一括アクセスできるデータ分析エンジンだ。

画像 単一の情報源(上)と単一のアクセスポイント(下)

 「この2つのアプローチは、それぞれデメリットとメリットがあり、環境やニーズに応じて使い分けることが重要です。注意したいのは『基盤や手法を構築したら終わり』ではないことです。ビジネス環境やプロジェクトの進捗(しんちょく)状況、データのライフサイクル、テクノロジーの進化などに応じてデータマネジメント基盤を更新、モダナイズし続けることが重要です」

 例えばデータレイクを構築しても、分析のための環境が整わなければ価値創出につなげられない。AIに学習させるデータがあっても、それを組み込むことができなければ「宝の持ち腐れ」になってしまう。ETLツールも同様だ。データを分析してモデルを構築しても、途中でビジネス環境が変化し、適用段階では実態と合わなくなっていることもある。

 「ビジネス環境の変化は速く、企業ニーズも多様になったことで、どのようなデータマネジメント基盤を構築すればよいか正解がない状況です。それぞれの環境に合わせた各社なりのアプローチを採用する必要があります。また、生成AIのような新しい技術を取り込むことも重要です。そこでデル・テクノロジーズは、企業におけるAI活用という観点から、デル・テクノロジーズ自身のデータマネジメント戦略やソリューションの強化に取り組んでいます」

 デル・テクノロジーズは2023年10月に「最高AI責任者」(Cheif AI Officer)という新たな役職を設け、着任したジェフ・ブードロー氏の下「Dell Generative AI Solutions」(デル生成AIソリューション)のポートフォリオを拡充すると発表している。

 クマール氏は「新たなソリューションを通じて企業が抱える5つの課題を解消します。データの分散化、サイロ化については、AI活用に向けたデータマネジメント戦略として、単一の情報源と単一のアクセスポイントの両方のアプローチを組み合わせたソリューションを提供します」と述べている。

検証済み構成やプロフェッショナルサービスで企業のAI活用を支援

 デル・テクノロジーズはさまざまなサービスを含んだ生成AI向けのいわゆる“検証済み構成”であるデル生成AIソリューションを提供している。GPUを搭載した「Dell PowerEdge」サーバや「Dell PowerScale」ストレージなどで構成されており、オンプレミスで情報の安全性を確保しながら、生成AIモデルをカスタマイズ、調整できるパッケージになっている。

画像 生成AI向けの“検証済み構成”デル生成AIソリューション

 「オンプレミスでAIモデルのカスタマイズと調整ができるため、顧客の多様なニーズに応えられます。最近増えている『自社内でAIモデルをすぐに構築できる“AIファクトリー”を作りたい』というニーズであれば『Project Helix』で生成AI活用のためのセルフサービス型プラットフォームを提供します。データを保管するストレージについてはファイルストレージのDell PowerScaleをはじめ、オブジェクトストレージの『Dell ECS』『Dell ObjectScale』などがあります。Dell PowerScaleについては、ハードウェアアプライアンスに加え、『Amazon Web Services』(AWS)で稼働する『APEX File Storage for AWS』も提供していますのでオンプレミス、クラウドを問わずデータマネジメントが可能です。また、料金については『Dell APEX』を使うことで月額サブスクリプションでの利用が可能です」

 プロフェッショナルサービス「Dell Professional Services for Generative AI」もある。AI活用に悩む顧客に対してデータの準備から、導入、教育までを支援し、プロプライエタリなツールとプラットフォーム、AIプロセスへのデータの渡し方などに関する課題を解決する。

 GPUを搭載したDell PowerEdgeやDell PowerScaleをパッケージ化した「Dell AI Starter Kit」(AI スターターキット)も提供する。データマネジメント領域では、Databricks、Snowflake、Starburstといったソリューションパートナーとパートナーシップを結び、オープンな立場でソリューション開発に取り組む。

画像 AI スターターキットの概要図

 「近年ニーズが高まっているセキュリティも、デル・テクノロジーズのさまざまなサイバーセキュリティソリューションやパートナーソリューションと連携して対応していきます。ランサムウェア対策としては、ストレージのスナップショット機能の活用やバックアップ製品によるデータ保護、マルチクラウド環境でのサイバーレジリエンスの強化などがあります」

 クマール氏は、企業のAI活用について次のようにまとめた。

 「AI活用をスタートするためにはデータマネジメントが重要です。生成AIの利用を検討するなら、まずはデータマネジメントにしっかり取り組んでほしいと思います。デル・テクノロジーズはレファレンスアーキテクチャや検証済み構成、プロフェッショナルサービスを提供してお客さまのAIに関する全ての取り組みをセキュアにサポートします。デル・テクノロジーズと共に、“責任あるAIチャンピオン”になって、AIによる成果を社会に広げていきましょう」

インテル® Xeon® スケーラブル・プロセッサー・ファミリー搭載 Dell VxRailがもたらすメリット

 デル・テクノロジーズとVMwareが共同で設計し、あらゆるコンポーネントの最適化と検証を経て出荷されるDell VxRailは、DXを実現する次世代ITインフラに新たなユーザ体験をもたらします。

 データセンターのモダナイゼーションを促進する、ハイブリッドクラウドを導入する、あるいは開発者向けKubernetesプラットフォームを構築するなどの幅広い用途において、Dell VxRailが提供するターンキーエクスペリエンスで、継続的なイノベーションが可能になります。

 Dell VxRailは、極めて高いパフォーマンスと総保有コスト低減のメリットをもたらすインテル® Xeon® スケーラブル・プロセッサー・ファミリーを搭載。クラウド、5Gエッジ・コンピューティング、人工知能を活用したデータ中心型コンピューティングの新たな時代における多種多様なデータセンター・ワークロードのニーズに対応します。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:デル・テクノロジーズ株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2023年12月13日

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。