RAG(Retrieval-Augmented Generation:検索拡張生成)とは?AI・機械学習の用語辞典

用語「RAG」について説明。ChatGPTなどのチャットAIに独自の情報源を付与する仕組みのことで、具体的には言語モデルによるテキスト生成に特定の情報源(ナレッジベース)の検索を組み合わせること。これには、生成内容の正確さを向上させるメリットがある。

» 2024年03月13日 05時00分 公開
[一色政彦デジタルアドバンテージ]
「AI・機械学習の用語辞典」のインデックス

連載目次

用語解説

 生成系AI/LLM(大規模言語モデル)のRAGRetrieval-Augmented Generation検索拡張生成)とは、ChatGPTやGeminiに代表されるチャットAIに独自の情報源を付与する仕組みのことで、具体的には言語モデルによるテキスト生成に特定の知識や情報源(例えばナレッジベースなど)への検索を組み合わせることである。これにより、回答内容がより専門的かつ正確になるため、事実とは異なる内容や文脈と無関係な内容の出力がもっともらしく生成される問題(=ハルシネーション《Hallucination》と呼ばれる)をより回避しやすくなるというメリットがある。

図1 「RAG」のイメージ 図1 「RAG」のイメージ
ちなみに、AIによる生成内容を特定の情報源で裏付けるプロセスはグラウンディングGroundingとも呼ばれる。

RAGの基本的な流れ

 図1に示した基本的なRAGの流れを簡単に説明しておこう。この流れは、あくまで典型的なパターンを説明したものだ。実装方法の詳細は、実装者によって異なる場合があるので注意してほしい。

  • (1) 質問: ユーザーが、チャットAIアプリに質問を入力。
  • (2) 検索: チャットAIアプリは内部で、質問内容を基にナレッジベース(ベクトルデータベースなどの情報源)を検索。
  • (3) 結果データ: チャットAIアプリは内部で、検索結果を取得。
  • (4) 質問+結果データ: チャットAIアプリは内部で、質問と検索結果を使ってLLMに質問。
  • (5) 回答: チャットAIアプリは内部で、質問に対する回答を取得。
  • (6) 回答: チャットAIアプリは、ユーザーに回答を表示。

 (2)の「ナレッジベースの検索」には、意味的に関連する情報を見つけ出せるベクトル検索や、「キーワード検索+ベクトル検索」で両者の良いとこ取りをしようとするハイブリッド検索がよく用いられる(検索方法については、「ベクトル検索」の用語解説でより詳しく解説している)。ナレッジベースとなるベクトルデータベースベクトルストアとも呼ばれる)としてはPineconeやAzure AI Searchなどの多種多様なものが存在する(各種ベクトルストアについては「ベクトルデータベース」の用語解説でより詳しく解説している。筆者が時間をかけて広範に調査して書いた力作なのでぜひ参考にしてもらえるとうれしい)。

RAGの工夫と発展

 RAGは有用ではあるが、完璧でも万能でもない。質問の仕方などによって思ったように適切な回答が得られない場合がある。場合によっては、適切な回答を得るための工夫が必要になる。

 その代表的な工夫のテクニックに「HyDE(Hypothetical Document Embeddings:仮説文書の埋め込み)」などがある。HyDEは、LLMに仮説的に回答を作らせてからナレッジベースをベクトル検索するテクニックである(詳しくは論文を参照してほしい)。HyDE以外にも「FLARE」や「Multi Query Retriver」「Ensemble Retriever」などがある(まずはこちらのスライド資料を一読するのがお勧めだ)。

 また、RAGの技術は発展途上であり、新しい手法も考案されている。例えば、2024年3月1日に公開されたLLMアプリ(チャットAIアプリを含む)用のライブラリ「LlamaIndex」のブログ記事「Towards Long Context RAG(長いコンテキストRAGに向けて)」では、2024年2月16日に公開されたGoogleのLLM「Gemini 1.5 Pro」が最大100万トークンのコンテキストウィンドウを有する(=非常に長いテキストを入力できる)ことを受けて、新しいRAGのアーキテクチャを提案している。

「AI・機械学習の用語辞典」のインデックス

AI・機械学習の用語辞典

鬯ゥ謳セ�ス�オ�ス�ス�ス�コ鬯ョ�ヲ�ス�ョ髯キ�サ�ス�サ�ス�ス�ス�ソ�ス�ス�ス�ス鬯ッ�ッ�ス�ィ�ス�ス�ス�セ�ス�ス�ス�ス�ス�ス�ス�」鬯ッ�ョ�ス�エ髣費ソス�ス�・�ス�ス�ス�ウ�ス�ス�ス�ィ�ス�ス�ス�ス髯懶ス」�ス�、�ス�ス�ス�ク�ス�ス�ス�イ鬯ゥ蠅捺��ス�ソ�ス�ス�ス縺、ツ€�ス�ス�ス�ス�ス�ス�ス�」鬯ッ�ョ�ス�エ鬯ゥ蟶壽桶�ス�ュ鬮ョ�」�ス�ソ�ス�ス�ス�ス�ス�ィ鬮ッ蛹コ�サ繧托スス�ソ�ス�ス�ス�ス�ス�ス�ス�ス�ス�コ鬮」蛹�スス�オ髫エ謫セ�ス�エ�ス�ス隶難ス」�守「托スュ雜」�ス�「�ス�ス�ス�ス�ス�ス�ス�ゥ鬯ゥ蟷「�ス�「髫エ雜」�ス�「�ス�ス�ス�ス�ス�ス�ス�シ鬯ゥ蟷「�ス�「髫エ荳サ�ス隶捺サゑスソ�ス邵コ�、�つ€鬯ッ�ョ�ス�ヲ�ス�ス�ス�ェ鬩包スカ闔ィ�ス�ス�ヲ�ス�エ�ス縺、ツ€髯キ闌ィ�ス�キ�ス�ス�ス�ス�ス�ス�ス�サ鬯ッ�ッ�ス�ェ�ス�ス�ス�ュ�ス�ス�ス�ス�ス�ス�ス�イ鬯ゥ謳セ�ス�オ�ス�ス�ス�コ鬮ッ�キ�ス�キ�ス�ス�ス�カ�ス�ス�ス�ス�ス�ス�ス�ス New

Copyright© Digital Advantage Corp. All Rights Reserved.

スポンサーからのお知らせPR

Deep Insider 鬯ョ�ォ�ス�ェ髯区サゑスソ�ス�ス�ス�ス�コ髣包スオ隴∵コキ�ク�キ�ス�ケ隴趣ス「�ス�ス�ス�ウ鬩幢ス「�ス�ァ�ス�ス�ス�ュ鬩幢ス「隴趣ス「�ス�ス�ス�ウ鬩幢ス「�ス�ァ�ス�ス�ス�ー

鬮ォ�エ陝キ�「�ス�ス�ス�ャ鬮ォ�エ鬲�シ夲スス�ス�ス�・鬮ォ�エ陝カ�キ�ス�」�ス�ッ髣厄スォ�ス�」

注目のテーマ

4AI by @IT - AIを作り、動かし、守り、生かす
Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。