温度スケーリング(おんどすけーりんぐ)
最終更新:2026/4/25
温度スケーリングは、機械学習モデルの予測確率を調整する手法であり、モデルの過信度を抑制するために用いられる。
別名・同義語 モデルキャリブレーションソフトマックス温度
ポイント
温度スケーリングは、モデルの出力分布を平滑化することで、より多様な予測を促し、汎化性能の向上に貢献する。
温度スケーリングとは
温度スケーリングは、特に深層学習モデルにおいて、モデルの予測確率を調整する後処理手法です。モデルが過信している場合、予測確率が極端に偏り、汎化性能が低下することがあります。温度スケーリングは、この問題を緩和するために、モデルの出力(ロジット)を温度パラメータで割ることで、確率分布を平滑化します。
温度パラメータ
温度パラメータ(T)は、1以上の正の値を取ります。Tが1の場合、出力はそのままです。Tが1より大きい場合、確率分布はより平坦になり、モデルの予測はより不確実になります。逆に、Tが1より小さい場合、確率分布はより鋭くなり、モデルの予測はより確実になります。
数学的表現
モデルの出力ロジットをzi、温度パラメータをTとすると、温度スケーリング後の確率piは以下の式で表されます。
pi = exp(zi / T) / Σj exp(zj / T)
適用例
温度スケーリングは、画像認識、自然言語処理、音声認識など、様々なタスクで利用されています。特に、モデルのキャリブレーション(予測確率と実際の正解率の一致度)が低い場合に有効です。
注意点
温度パラメータTは、通常、検証データを用いて最適化されます。Tの値が適切でない場合、性能が低下する可能性があります。また、温度スケーリングは、モデルの根本的な問題を解決するものではなく、あくまで予測確率を調整する手法であることに注意が必要です。