次に、ユーザーが質問を入力し、AIが回答を生成するアプリケーションを作成します。
Google Cloudのコンソール画面よりVertex AIを選択し、その中から「Vertex AI Search」を選択します。
すると、「新しい検索アプリの作成」として幾つかの候補が表示されますが、今回は「カスタム検索(一般)」を使ってRAGアプリケーションを構築するので、その欄の「作成」から先に進みます。
検索アプリケーションの構成を設定する画面が表示されるので、以下の要領で入力し、「続行」ボタンで先に進みます。
項目 | 入力値(例) |
---|---|
Enterpriseエディションの機能 | オフ(チェックしない) ※有料ですが、オンにすることで、抽出回答、抽出セグメント、検索のチューニングおよび、Webサイト検索が可能になります ※この設定はいつでも変更できます |
高度なLLM機能 | オン(チェックする) ※有料ですが、オンにすることで、検索サマリー、フォローアップ付きの検索、回答とフォローアップを含む検索が可能になります。ただし、Webサイト検索の場合は、Webサイトの高度なインデックス登録も必要です ※この設定はいつでも変更できます |
アプリ名 | 任意の名前(アプリ名は半角英数字) |
会社名または組織名 | 任意の組織名 |
アプリのロケーション | global(グローバル) |
データの選択画面が表示されたら、データソースとして先ほど登録したCloud Storageを設定します。「データストアを作成」を選択してください。
「データソースを選択」する画面が表示されるので、「Cloud Storage」を選択します。
「Cloud Storageのデータをインポート」の設定画面では以下の要領で入力します。
項目 | 入力値(例) |
---|---|
What kind of data are you importing? | 非構造化ドキュメント(PDF、HTML、TXT など) |
同期の頻度 | 1回限り ※継続的にデータをアップデートしたいケースでは、「定期的」や「ストリーミング」を選択しましょう |
インポートするフォルダまたはファイルを選択します | 「フォルダ」を選択、「gs//:*」のテキストボックスの右端にある「参照」を選択し、「ステップ1:データストアの作成」で作成したバケットを選択します |
「続行」ボタンを選択すると、「データストアの構成」という画面に戻ります。下記を参考に設定を入力し、「作成」ボタンを押すと、データストアが作成されます。
項目 | 詳細項目 | 入力値(例) |
---|---|---|
データストア名 | ― | 任意の名前(半角英数字) |
ドキュメント処理オプション | ドキュメントの解析 | 初期値のまま ※デフォルトのドキュメントパーサーを「OCR Parser」にしたりすることで、スキャンしたドキュメントのPDFなどにも対応できます |
ドキュメント チャンキング | 初期値のまま ※RAGのチャンクサイズを変更できます |
|
生成 AIのオプション | 生成 AI 機能から除外 | オフ(チェックしない) |
「検索アプリを作成する」画面に戻ってくるので、作成したデータストアが選択されていることを確認し、「作成」ボタンを選択し、アプリケーションを作成します。
このステップにより、前回の記事で解説したRAGの主要コンポーネントである「リトリーバー」と「ジェネレーター」が、コーディングなしで構築されます。
作成と設定が完了すると、すぐにプレビュー画面でAIの動作をテストできます。
早速、試してみましょう(画像クリックでアニメーション表示)。
無事に、船員法から回答を生成できましたね。この「根拠の提示」機能こそ、RAGの最大のメリットの一つです。これにより、ユーザーは回答が正しい情報に基づいていることを確認でき、ハルシネーションのリスクを大幅に抑制できます。汎用(はんよう)モデルが苦手とする、社内用語や独自の業務プロセスに関する質問にも、正確に答えられるようになります。
余談ですが、「システムの概要」として表示されているパイプラインは、どのようにアプリケーションが動作しているのかを示しているので、余裕のある時に読んでみるのも面白いと思います。
せっかくなので、社内ポータルサイトにAIアプリケーションをデプロイしてみましょう。プレビューの右隣にあるシステム開発を選択してみてください。
次に、ウィジェットタブを選択し、以下を参考に設定して「保存」します。
項目 | 入力値(例) |
---|---|
認証タイプの選択 | 公開アクセス ※ 社内ポータルサイト自体は特定の人しか閲覧できない前提です。実際は「JWTまたはOAuthベース」であったり、ウィジェットではなく「API」で実装をしたりすることが多いでしょう |
ウィジェットで許可するドメインを追加する | 社内ポータルサイトのドメイン |
ページの下の方に「ウェブ アプリケーションに次のコードをコピーします」という欄があるので、そこに表示されているHTMLタグを社内ポータルサイトのHTMLにコピーペーストし、デプロイします(画像クリックでアニメーション表示)。
何ということでしょう、2005年で時が止まったかのような社内ポータルサイトが、令和の最新テクノロジーによって、ナウなヤングにブッ刺ささりサイトに大変身。無機質だった情報の掲示板が、人と情報をつなぎ、組織に一体感をもたらす新しい"ポータル"へと生まれ変わった、まさに奇跡の瞬間です。
と、調子に乗って言い過ぎてしまいましたが、何のために書いていたのか分からない退屈な日報をはじめとしたドキュメントなど、社内で積み上がってきたナレッジを、RAGによって活用できるようになります。これって実は凄いことではないでしょうか?
とはいえ、実際には、プロキシの設定や認証情報の設定など、色々と考えることがあるため、ここまで簡単なデプロイはできないケースもあると思います。ただ、リソースとなるデータさえあれば、高額になりがちなアプリケーション開発コストを大きく削減できるのは大きなメリットです。
Vertex AI Searchのようなマネージドサービスを活用することで、前回記事で挙げた自前構築のデメリットは大幅に軽減されます。
コストとリソースの課題:高価な計算資源や高度な専門知識を持つ人材を確保しなくても、RAGシステムを迅速に構築・運用できます。
セキュリティとガバナンス:外部サービスに機密情報を送信することなく、自社の管理下で安全にデータを扱えます。
性能とカスタマイズ:組織独自のナレッジをAIに組み込むことで、汎用サービスでは不可能なレベルの精度と専門性を実現し、組織内でのナレッジ共有を加速させます。
生成AIを「使う」から「作る」へのシフトは、もはや一部の専門家だけのものではありません。Vertex AI Searchのようなクラウドサービスは、RAGという強力なアーキテクチャを、多くの企業にとって現実的な選択肢に変えました。
これにより、企業は生成AIの利便性を享受しつつ、情報漏えいやハルシネーションといった重大なリスクをコントロールし、社内に眠る独自のデータという資産を最大限に活用できます。 次のステップとして、あなたの組織のナレッジを、Vertex AI Searchで価値あるAI資産に変えてみてはいかがでしょうか。
次回は、AWSでの生成AIアプリケーション構築法を紹介します。
Copyright © ITmedia, Inc. All Rights Reserved.