ローマスペクトルモデル（ろーますぺくとるもでる）

最終更新：2026/4/22

ローマスペクトルモデルは、音声信号のスペクトル包絡を表現するための数学的モデルである。

別名・同義語スペクトル包絡モデル音声スペクトルモデル

ポイント

このモデルは、特に音声合成や音声認識の分野で、人間の音声の特徴を効率的に捉えるために用いられる。

概要

ローマスペクトルモデルは、音声信号のスペクトル包絡を、いくつかのパラメータで表現するモデルです。人間の音声は複雑なスペクトル構造を持っていますが、このモデルを用いることで、その構造を簡潔に表現し、効率的な処理を可能にします。

ローマスペクトルモデルは、1970年代にイタリアのローマ大学で開発されました。初期の音声合成システムにおいて、その有効性が認められ、その後、様々な音声処理分野で広く利用されるようになりました。

ローマスペクトルモデルは、通常、複数の共振器（フォーマント）の周波数と帯域幅、およびスペクトルの傾きをパラメータとして用います。これらのパラメータは、音声信号のスペクトル包絡を近似するように調整されます。モデルのパラメータは、線形予測分析（LPC）などの手法を用いて推定することができます。

ローマスペクトルモデルは、主に以下の分野で応用されています。

ローマスペクトルモデルは、他のスペクトルモデル（例えば、線形予測モデルやメルスペクトルモデル）と比較して、特定の音声特徴をより正確に表現できるという利点があります。しかし、モデルのパラメータ推定が複雑になるという欠点もあります。