トップPサンプリング（とっぷぴーさんぷりんぐ）

最終更新：2026/4/25

トップPサンプリングは、大規模言語モデルにおけるテキスト生成手法の一つで、確率分布からトークンを選択する際に、累積確率がPを超えるまで候補を絞り込み、その中からランダムにトークンを選択する。

別名・同義語 Nucleus Sampling

ポイント

この手法は、生成されるテキストの多様性と品質のバランスを調整するために用いられ、温度パラメータと組み合わせて使用されることが多い。

概要

トップPサンプリング（Nucleus Sampling）は、大規模言語モデルがテキストを生成する際のサンプリング手法の一つです。従来のサンプリング手法であるトップKサンプリングの改良版として提案されました。トップKサンプリングでは、確率の高い上位K個のトークンからランダムに選択しますが、Kの値の設定が難しいという課題がありました。トップPサンプリングでは、確率の高いトークンを累積確率の順に並べ、累積確率がP（例えば0.9）を超えるまでトークンを選択します。その後、選択されたトークンの中からランダムに一つを選択します。

トップKサンプリングとの比較

トップKサンプリングは、常に固定数のトークン（K個）を選択するため、文脈によっては不自然なテキストが生成される可能性があります。例えば、確率分布が急峻な場合、上位K個のトークンに偏りすぎて多様性が失われることがあります。一方、トップPサンプリングは、累積確率に基づいて動的にトークンの選択数を調整するため、より自然で多様なテキストを生成することができます。

パラメータPの意味

パラメータPは、累積確率の閾値を表します。Pの値が大きいほど、より多くのトークンが選択候補となり、生成されるテキストの多様性が高まります。逆に、Pの値が小さいほど、選択候補が少なくなり、生成されるテキストの予測可能性が高まります。一般的に、Pの値は0.75〜0.95の範囲で設定されることが多いです。

実装と応用

トップPサンプリングは、GPT-2、GPT-3、LLaMAなどの大規模言語モデルで広く採用されています。また、テキスト生成だけでなく、機械翻訳や対話システムなど、様々な自然言語処理タスクに応用されています。温度パラメータと組み合わせることで、生成されるテキストの創造性と一貫性をより細かく制御することができます。