音声認識装置及び音声認識プログラム

開放特許情報番号
L2010002525
開放特許情報登録日
2010/3/26
最新更新日
2010/3/26

基本情報

出願番号 特願2003-322135
出願日 2003/9/12
出願人 日本放送協会
公開番号 特開2005-091518
公開日 2005/4/7
登録番号 特許第4362054号
特許権者 日本放送協会
発明の名称 音声認識装置及び音声認識プログラム
技術分野 電気・電子、情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 音声認識装置
目的 入力音声に雑音が重畳された場合であっても、多種多様な雑音重畳音声に対応した音響モデルを用いることなく、音声認識の認識誤りを低減させることが可能な音声認識装置及び音声認識プログラムを提供する。
効果 雑音が重畳された音声であっても、雑音のデータをモデル化した雑音モデルに基づいて、入力音声がどの出力系列に対応するのかを示す音響尤度を補正することができる。これによって、音響尤度の信頼度が低下した場合は、言語モデルによる語彙、文法、意味等の言語的制約に重みを付けて認識を行うことが可能になるため、雑音環境下における音声認識の誤りを低減させることができる。また、音響モデルを多種多様な雑音重畳音声に対応させてモデル化する必要がなく、雑音モデルのみを構築すればよいので、モデルの構築を簡単に行うことができる。
技術概要
図1は音声認識装置の構成を示したブロック図である。この音声認識装置10Bは、音声認識装置10に、音声モデル19aを記憶した音声モデル記憶手段19を付加し、信頼度算出手段15の機能を変更した信頼度算出手段15Bで構成する。音声モデル記憶手段19に記憶した音声モデル(第二音響モデル)19aは、音響モデル12aよりデータ量を削減したモデルである。この音声モデル19aは、例えば、音響モデル12aを混合正規化分布モデルによりモデル化することで生成される。信頼度算出手段15Bは、雑音モデル記憶手段11に記憶されている雑音モデル11aと、音声モデル記憶手段19に記憶されている音声モデル19aとに基づいて、音響分析手段14から時系列に出力される時刻tの特徴ベクトルx↓tが、音声である度合いを示す信頼度P(S|x↓t)を算出する。このように、音響モデル12aのデータ量を削減した音声モデル19aを用いることで、音声認識の演算量を削減することができる。図2は参考例の音声認識装置の構成を示したブロック図、図3は参考例の音声認識装置の動作を示すフローチャートである。
イメージ図
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT