retrieval-augmented-generation(れとりーばるおーぐめんてっどじぇねれーしょん)
最終更新:2026/4/25
検索拡張生成は、大規模言語モデルが外部知識源から情報を取得し、それを用いて応答を生成する技術である。
別名・同義語 RAG検索拡張
ポイント
従来の言語モデルは学習データに依存するが、検索拡張生成は最新情報や特定のドメイン知識を活用できる。
概要
検索拡張生成(Retrieval-Augmented Generation, RAG)は、大規模言語モデル(LLM)の性能を向上させるための手法の一つです。LLMは、大量のテキストデータで事前学習されていますが、学習データに含まれない情報や、学習時点以降に更新された情報に対しては、正確な応答を生成することが困難です。RAGは、この問題を解決するために、LLMが応答を生成する前に、外部の知識源(データベース、ウェブサイト、ドキュメントなど)から関連情報を検索し、その情報を基に応答を生成します。
仕組み
RAGの基本的な流れは以下の通りです。
- 質問の入力: ユーザーが質問を入力します。
- 検索: 入力された質問に基づいて、外部の知識源から関連情報を検索します。この検索には、ベクトルデータベースやキーワード検索などが用いられます。
- 情報の取得: 検索された関連情報を取得します。
- 応答の生成: LLMは、入力された質問と取得された関連情報を組み合わせて、応答を生成します。
利点
RAGには、以下のような利点があります。
- 最新情報の活用: 外部の知識源から最新情報を取得できるため、常に最新の情報に基づいた応答を生成できます。
- 特定のドメイン知識の活用: 特定のドメインに関する知識を外部の知識源に格納することで、そのドメインに関する専門的な応答を生成できます。
- 説明可能性の向上: 応答の根拠となる情報を提示できるため、応答の信頼性を高めることができます。
- 幻覚(ハルシネーション)の軽減: 外部知識源を参照することで、LLMが誤った情報を生成するリスクを軽減できます。
応用例
RAGは、様々な分野で応用されています。