目的
音量を不必要に上げることなく、様々な環境化でも聞き取りやすい音声を生成できる音声明瞭化装置を提供する。
効果
人間が騒音下で話す際に用いる特有の発声(ロンバード声)の特徴を模擬しており明瞭性向上が期待できる。高域成分の強調の度合いは、入力音声の特性に応じて逐次調整される。
また、全体の音量を上げることなく、不明瞭な音の少ない比較的聞き取りやすい音声を得ることができる。
技術概要
明瞭な音声を生成する音声明瞭化装置であって、
対象とする音声信号のスペクトルに対して、当該スペクトルのスペクトル包絡の複数個の局所的なピークに沿った曲線で表されるピーク概形を抽出するピーク概形抽出手段と、
該ピーク概形抽出手段が抽出したピーク概形に基づいて前記音声信号のスペクトルを変形するスペクトル変形手段と、
該スペクトル変形手段によって変形されたスペクトルに基づいて音声を生成する音声合成手段とを含む音声明瞭化装置。