生成AIでデータ分析が変わるなら、その前段のデータマネジメントはどう変わるのか。「業界初」のデータマネジメント機能の仕組みや使い勝手について聞いた。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
生成AIでデータ分析が変わるという認識が広がっている。では、分析につながるデータマネジメントのプロセスはどう変えられるのだろうか。生成AIを活用した「業界初」のデータマネジメント機能の仕組みや使い勝手について、開発元であるInformaticaの最高製品責任者、ジテッシュ・ガイ(Jitesh Ghai)氏に聞いた。
マルチクラウドのデータマネジメントを提供するInformaticaは2023年5月、「CLAIRE GPT」という生成AI適用ソリューションを発表した。
「CLAIRE GPTは人間の言葉でデータマネジメントができるようにするものだ」とガイ氏は表現する。ChatGPTなどのチャットインタフェースにプロンプトを入力していくことにり、分析に必要なデータマネジメント作業が実行できる。
主なターゲットはデータエンジニア、ビジネスアナリスト、データサイエンティスト、パワーユーザーだ。技術スキルの高い人なら作業の効率化に使えるし、従来はデータマネジメントと縁がなかった人でも活用できる。
「CLAIRE GPTは既存ユーザーの生産性を高める一方で、ユーザーを広げることができる」(ガイ氏、以下同)
まず、どんなプロンプトで何ができるのか。InformaticaはCLAIRE GPTの発表時に、数個のプロンプトで必要なデータセットの特定からデータ分析に至るプロセスを実行するデモを見せている。
デモは、架空のOmnee社によるAcme社の買収後、2社の顧客情報を統合し、クロスセルのための分析につなげるというシナリオで行っている。
最初に入力したプロンプトは「OmneeとAcmeの間のクロスセル分析に使える顧客情報データセットを示せ」。するとOmneeではSAP、AcmeではSalesforceの該当データセットを表示する。
次に、「このSAPとSalesforceのデータセットを読んで、(マスタデータ管理を行う)Customer 360に書くパイプラインを作れ」と指示すると、データパイプラインが図示される。この図ではリアルタイムの複製、日次バッチなど、データ取り込みに関する推奨選択肢も示され、ユーザーは必要に応じて選択の上、確定する。
すると「(パイプラインを)実行しますか?」と質問してくる。そこで「はい」を選ぶと実行される。
次に「既存の(顧客情報)マッチング処理モデルをリストせよ」と指示すると、機械学習モデルが精度と共にリスト表示される。いずれかを選択し、「Customer 360における顧客情報の重複を除去しろ」と指示すると実行される。
これで分析の準備が整ったことになる。デモでは次に、「顧客のティア(ランク)ごとにクレジットカード保有の有無を示せ」と指示し、グラフを出力させている。
CLAIRE GPTは、各種のデータマネジメント関連サービスに対するインタフェースの統合、自然言語の利用によるデータマネジメントの容易化/民主化、の2つのメリットをもたらすという。
「データカタログ、データ統合、マスタデータ管理などのサービスを活用する際に、別個のインタフェースを持つ個々のサービスにアクセスする必要がない。チャットという単一のインタフェースで、あらゆるデータマネジメント機能が使える」
CLAIRE GPTは、ChatGPTなどの大規模言語モデル(LLM)とInformaticaのLLMの二重構造になっている。
「ChatGPTなどのLLMは、ユーザーの意図を把握するのに優れている」
そこでCLAIRE GPTでは、ChatGPTなどのLLMが読み取ったユーザーの意図を、データマネジメントに特化したInformaticaのLLMに渡す。そして同社のLLMは、データカタログ、データ統合、データガバナンスなどの各種サービスとの橋渡しをする。
「メタデータでトレーニングされ、データマネジメントを自動化するのは当社のLLMのほうだ。当社のLLMがユーザーの意図に応じて適切なモデルを選択し、選択されたモデルはデータマネジメントのジョブを自動生成する。結果はChatGPTと同様のインタフェースで返される。だから、特別なプロンプトエンジニアリングは不要だ」
この二重構造は、ユーザー組織のデータ保護にも直結するとガイ氏は強調する。
では、ユーザーがあいまいな指示をしたらどうなるのか。
「あいまいな指示の場合、追加的な質問を投げかける。ある程度具体的な指示であれば、実行のための選択肢を提示する。例えば『顧客データをSalesforceからSnowflakeに持っていきたい』と言うと、『変更データの複製も、バルク取り込みもできます、ETLもできます』と選択肢を示すことができる」
本記事ではこれまで「ChatGPTなどのLLM」という表現をしてきたが、CLAIRE GPTはChatGPTの他、Azure OpenAI Service、Google PalmなどのLLMと幅広く連携していくという。
Copyright © ITmedia, Inc. All Rights Reserved.