retrieval-augmented-generation（れとりーばるおーぐめんてっどじぇねれーしょん）

最終更新：2026/4/25

検索拡張生成は、大規模言語モデルが外部知識源から情報を取得し、それを用いて応答を生成する技術である。

別名・同義語 RAG検索拡張

ポイント

従来の言語モデルは学習データに依存するが、検索拡張生成は最新情報や特定のドメイン知識を活用できる。

概要

検索拡張生成（Retrieval-Augmented Generation, RAG）は、大規模言語モデル（LLM）の性能を向上させるための手法の一つです。LLMは、大量のテキストデータで事前学習されていますが、学習データに含まれない情報や、学習時点以降に更新された情報に対しては、正確な応答を生成することが困難です。RAGは、この問題を解決するために、LLMが応答を生成する前に、外部の知識源（データベース、ウェブサイト、ドキュメントなど）から関連情報を検索し、その情報を基に応答を生成します。

仕組み

RAGの基本的な流れは以下の通りです。

質問の入力: ユーザーが質問を入力します。
検索: 入力された質問に基づいて、外部の知識源から関連情報を検索します。この検索には、ベクトルデータベースやキーワード検索などが用いられます。
情報の取得: 検索された関連情報を取得します。
応答の生成: LLMは、入力された質問と取得された関連情報を組み合わせて、応答を生成します。

利点

RAGには、以下のような利点があります。

最新情報の活用: 外部の知識源から最新情報を取得できるため、常に最新の情報に基づいた応答を生成できます。
特定のドメイン知識の活用: 特定のドメインに関する知識を外部の知識源に格納することで、そのドメインに関する専門的な応答を生成できます。
説明可能性の向上: 応答の根拠となる情報を提示できるため、応答の信頼性を高めることができます。
幻覚（ハルシネーション）の軽減: 外部知識源を参照することで、LLMが誤った情報を生成するリスクを軽減できます。

応用例

RAGは、様々な分野で応用されています。

カスタマーサポート: 顧客からの問い合わせに対して、製品マニュアルやFAQなどの知識源から関連情報を検索し、正確な回答を生成します。
医療: 医療文献や臨床ガイドラインなどの知識源から情報を検索し、医師の診断や治療を支援します。
金融: 金融ニュースや市場データなどの知識源から情報を検索し、投資判断を支援します。
教育: 教材や参考書などの知識源から情報を検索し、学生の学習を支援します。