音声スペクトル(おんせいすぺくとる)
最終更新:2026/4/22
音声スペクトルは、音声を周波数成分に分解し、それぞれの周波数における振幅を視覚的に表現したものである。
別名・同義語 スペクトログラム周波数スペクトル
ポイント
音声スペクトルは、音の特性を分析するための重要なツールであり、音響学、音声認識、音楽情報処理などの分野で広く利用されている。
音声スペクトルの概要
音声スペクトルは、時間領域で表現された音声信号を周波数領域に変換することで得られる。人間の耳は、音の高さ(周波数)と大きさ(振幅)を感知しており、音声スペクトルはこれらの情報を視覚的に表現する。
音声スペクトルの生成方法
音声スペクトルを生成するためには、主にフーリエ変換という数学的な手法が用いられる。フーリエ変換は、複雑な波形を、異なる周波数と振幅を持つ正弦波の重ね合わせとして表現する。
音声スペクトルの種類
音声スペクトルには、いくつかの種類がある。
- 線形スペクトル: フーリエ変換を直接適用して得られるスペクトル。
- メルスペクトル: 人間の聴覚特性に合わせて周波数軸を非線形に変換したスペクトル。音声認識などの分野でよく用いられる。
- ケプストラム: スペクトルのスペクトルを分析するための表現。
音声スペクトルの応用
音声スペクトルは、様々な分野で応用されている。