背景雑音歪みの補正処理方法及びそれを用いた音声認識システム

開放特許情報番号
L2003009843
開放特許情報登録日
2003/12/19
最新更新日
2015/9/9

基本情報

出願番号 特願2003-320183
出願日 2003/9/11
出願人 独立行政法人産業技術総合研究所
公開番号 特開2005-084653
公開日 2005/3/31
登録番号 特許第4058521号
特許権者 国立研究開発法人産業技術総合研究所
発明の名称 背景雑音歪みの補正処理方法及びそれを用いた音声認識システム
技術分野 電気・電子
機能 制御・ソフトウェア、検査・検出
適用製品 音声の雑音成分、背景雑音歪み、音声認識、フロントエンドにおける音声特徴量の補正処理、雑音重畳音声、音声認識精度、隠れマルコフモデル
目的 雑音信号が変化する場合でも、補正精度を向上させることができる背景雑音歪みの補正処理方法及びそれを用いた音声認識システムの提供。
効果 隠れマルコフモデル(HMM)に基づいて音声の特徴量補正をすることにより、雑音の変化に対してより頑健な音声の特徴量補正を実現することができる。HMMを用いることにより、音声特徴量の時間的構造が利用できるようになり、また、ビタビアルゴリズムに補正処理を組み込むことで、観測フレームまでの累積出力確率を利用できるようになる。
技術概要
この技術は、背景雑音歪みの補正処理方法において、隠れマルコフモデル(HMM)を音響モデルとする音声認識システムを用いて、ビタビ(Viterbi)アルゴリズムにより算出される入力特徴量時系列と隠れマルコフモデル(HMM)の累積出力確率を、フレーム数で除算し、真数値に換算した値により重み付けした隠れマルコフモデル(HMM)の分布の事後確率を用いて、背景雑音による音声特徴量の歪みを抑圧する。また、隠れマルコフモデル(HMM)を音響モデルとする音声認識システムにおいて、雑音信号を含む音声信号を入力する手段と、入力信号のパワーに基づく区間(フレーム)検出部と、入力特徴量時系列の算出部と、ビタビアルゴリズムにより算出した入力特徴量時系列とHMMの累積出力確率をフレーム数で除算し、真数値に換算した値により重み付けされるHMMの分布の事後確率の算出部と、雑音信号を含む音声特徴量の歪み抑圧部と、この抑圧部に接続される音声認識部とを具備する。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2017 INPIT