ChatGPTなどの生成AIでデータマネジメントはどう変わるのか、「業界初」のサービス機能の中身

生成AIでデータ分析が変わるなら、その前段のデータマネジメントはどう変わるのか。「業界初」のデータマネジメント機能の仕組みや使い勝手について聞いた。

» 2023年07月18日 12時44分 公開
[三木泉@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 生成AIでデータ分析が変わるという認識が広がっている。では、分析につながるデータマネジメントのプロセスはどう変えられるのだろうか。生成AIを活用した「業界初」のデータマネジメント機能の仕組みや使い勝手について、開発元であるInformaticaの最高製品責任者、ジテッシュ・ガイ(Jitesh Ghai)氏に聞いた。

Informaticaのジテッシュ・ガイ氏

 マルチクラウドのデータマネジメントを提供するInformaticaは2023年5月、「CLAIRE GPT」という生成AI適用ソリューションを発表した。

 「CLAIRE GPTは人間の言葉でデータマネジメントができるようにするものだ」とガイ氏は表現する。ChatGPTなどのチャットインタフェースにプロンプトを入力していくことにり、分析に必要なデータマネジメント作業が実行できる。

 主なターゲットはデータエンジニア、ビジネスアナリスト、データサイエンティスト、パワーユーザーだ。技術スキルの高い人なら作業の効率化に使えるし、従来はデータマネジメントと縁がなかった人でも活用できる。

 「CLAIRE GPTは既存ユーザーの生産性を高める一方で、ユーザーを広げることができる」(ガイ氏、以下同)

具体的に、どんなプロンプトで何ができるのか

 まず、どんなプロンプトで何ができるのか。InformaticaはCLAIRE GPTの発表時に、数個のプロンプトで必要なデータセットの特定からデータ分析に至るプロセスを実行するデモを見せている。

 デモは、架空のOmnee社によるAcme社の買収後、2社の顧客情報を統合し、クロスセルのための分析につなげるというシナリオで行っている。

 最初に入力したプロンプトは「OmneeとAcmeの間のクロスセル分析に使える顧客情報データセットを示せ」。するとOmneeではSAP、AcmeではSalesforceの該当データセットを表示する。

CLAIRE GPTのホーム画面には、指示のレコメンデーションが表示されている。最初の指示として、「OmneeとAcmeの間のクロスセル分析に使える顧客情報データセットを示せ」と入力している

 次に、「このSAPとSalesforceのデータセットを読んで、(マスタデータ管理を行う)Customer 360に書くパイプラインを作れ」と指示すると、データパイプラインが図示される。この図ではリアルタイムの複製、日次バッチなど、データ取り込みに関する推奨選択肢も示され、ユーザーは必要に応じて選択の上、確定する。

指示に従ってパイプラインが作成された

 すると「(パイプラインを)実行しますか?」と質問してくる。そこで「はい」を選ぶと実行される。

 次に「既存の(顧客情報)マッチング処理モデルをリストせよ」と指示すると、機械学習モデルが精度と共にリスト表示される。いずれかを選択し、「Customer 360における顧客情報の重複を除去しろ」と指示すると実行される。

 これで分析の準備が整ったことになる。デモでは次に、「顧客のティア(ランク)ごとにクレジットカード保有の有無を示せ」と指示し、グラフを出力させている。

特別なプロンプトエンジニアリングは不要

 CLAIRE GPTは、各種のデータマネジメント関連サービスに対するインタフェースの統合、自然言語の利用によるデータマネジメントの容易化/民主化、の2つのメリットをもたらすという。

 「データカタログ、データ統合、マスタデータ管理などのサービスを活用する際に、別個のインタフェースを持つ個々のサービスにアクセスする必要がない。チャットという単一のインタフェースで、あらゆるデータマネジメント機能が使える」

 CLAIRE GPTは、ChatGPTなどの大規模言語モデル(LLM)とInformaticaのLLMの二重構造になっている。

 「ChatGPTなどのLLMは、ユーザーの意図を把握するのに優れている」

 そこでCLAIRE GPTでは、ChatGPTなどのLLMが読み取ったユーザーの意図を、データマネジメントに特化したInformaticaのLLMに渡す。そして同社のLLMは、データカタログ、データ統合、データガバナンスなどの各種サービスとの橋渡しをする。

 「メタデータでトレーニングされ、データマネジメントを自動化するのは当社のLLMのほうだ。当社のLLMがユーザーの意図に応じて適切なモデルを選択し、選択されたモデルはデータマネジメントのジョブを自動生成する。結果はChatGPTと同様のインタフェースで返される。だから、特別なプロンプトエンジニアリングは不要だ」

 この二重構造は、ユーザー組織のデータ保護にも直結するとガイ氏は強調する。

 では、ユーザーがあいまいな指示をしたらどうなるのか。

 「あいまいな指示の場合、追加的な質問を投げかける。ある程度具体的な指示であれば、実行のための選択肢を提示する。例えば『顧客データをSalesforceからSnowflakeに持っていきたい』と言うと、『変更データの複製も、バルク取り込みもできます、ETLもできます』と選択肢を示すことができる」

 本記事ではこれまで「ChatGPTなどのLLM」という表現をしてきたが、CLAIRE GPTはChatGPTの他、Azure OpenAI Service、Google PalmなどのLLMと幅広く連携していくという。

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

4AI by @IT - AIを作り、動かし、守り、生かす
Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。