SPONSORED

retrieval-augmented-generation(れとりーばるおーぐめんてっどじぇねれーしょん)

最終更新:2026/4/25

検索拡張生成は、大規模言語モデルが外部知識源から情報を取得し、それを用いて応答を生成する技術である。

別名・同義語 RAG検索拡張

ポイント

従来の言語モデルは学習データに依存するが、検索拡張生成は最新情報や特定のドメイン知識を活用できる。

概要

検索拡張生成(Retrieval-Augmented Generation, RAG)は、大規模言語モデルLLM)の性能を向上させるための手法の一つです。LLMは、大量のテキストデータで事前学習されていますが、学習データに含まれない情報や、学習時点以降に更新された情報に対しては、正確な応答を生成することが困難です。RAGは、この問題を解決するために、LLMが応答を生成する前に、外部の知識源(データベース、ウェブサイト、ドキュメントなど)から関連情報を検索し、その情報を基に応答を生成します。

仕組み

RAGの基本的な流れは以下の通りです。

  1. 質問の入力: ユーザーが質問を入力します。
  2. 検索: 入力された質問に基づいて、外部の知識源から関連情報を検索します。この検索には、ベクトルデータベースやキーワード検索などが用いられます。
  3. 情報の取得: 検索された関連情報を取得します。
  4. 応答の生成: LLMは、入力された質問と取得された関連情報を組み合わせて、応答を生成します。

利点

RAGには、以下のような利点があります。

  • 最新情報の活用: 外部の知識源から最新情報を取得できるため、常に最新の情報に基づいた応答を生成できます。
  • 特定のドメイン知識の活用: 特定のドメインに関する知識を外部の知識源に格納することで、そのドメインに関する専門的な応答を生成できます。
  • 説明可能性の向上: 応答の根拠となる情報を提示できるため、応答の信頼性を高めることができます。
  • 幻覚(ハルシネーション)の軽減: 外部知識源を参照することで、LLMが誤った情報を生成するリスクを軽減できます。

応用例

RAGは、様々な分野で応用されています。

  • カスタマーサポート: 顧客からの問い合わせに対して、製品マニュアルやFAQなどの知識源から関連情報を検索し、正確な回答を生成します。
  • 医療: 医療文献や臨床ガイドラインなどの知識源から情報を検索し、医師の診断や治療を支援します。
  • 金融: 金融ニュース市場データなどの知識源から情報を検索し、投資判断を支援します。
  • 教育: 教材や参考書などの知識源から情報を検索し、学生の学習を支援します。

SPONSORED