出願番号 |
特願2009-196757 |
出願日 |
2009/8/27 |
出願人 |
独立行政法人情報通信研究機構 |
公開番号 |
特開2011-048163 |
公開日 |
2011/3/10 |
登録番号 |
特許第5288378号 |
特許権者 |
国立研究開発法人情報通信研究機構 |
発明の名称 |
音響モデルの話者適応装置及びそのためのコンピュータプログラム |
技術分野 |
情報・通信、電気・電子 |
機能 |
機械・部品の製造、制御・ソフトウェア |
適用製品 |
音響モデルの話者適応装置及びそのためのコンピュータプログラム |
目的 |
高い汎化能力を持ち、少ない適応データで話者独立な音響モデルを適応化させることが可能な話者適応装置及びそのためのコンピュータプログラムを提供する。また、高い汎化能力を持ち、少ない適応データで話者独立な音響モデルを適応化させるための線形回帰行列を求めることが可能な話者適応装置及びそのためのコンピュータプログラムを提供する。 |
効果 |
SMELRを用いて変換行列を推定することにより、比較的少ない適応データを用いて、話者独立な音響モデルから精度高く話者適応音響モデルを推定できる。さらに、話者独立な音響モデルとの間でインターポレーションを行なうことで、適応発話数が40より小さい場合でも、最適な重みを使用することにより話者独立な音響モデル又はSMLERによる音響モデルのいずれかを単独で用いた場合よりも高い単語認識精度を得ることができる。 |
技術概要
 |
図1は話者適応装置を実現するためのプログラムのメインルーチンの制御構造を示すフローチャート、図2は図1に制御構造を示すプログラムにおいて、フレームセレクション処理を実現するプログラムの制御構造を示すフローチャート、である。話者適応装置は、話者適応のための変換行列及び話者適応用データを記憶する記憶装置と、話者独立な音響モデルに変換行列を適用し、話者適応音響モデルを算出する音響モデル変換部150と、話者適応用データのうち正解データの事後確率が所定範囲に存在するフレームを選択するフレーム選択部142と、選択されたフレームを用い、ソフトマージン推定の目的関数の値を算出する目的関数算出部144、146と、最適化アルゴリズムを用い、目的関数の値を極小化するよう変換行列を更新する更新部148と、更新後の変換行列を用い、音響モデル変換部150、フレーム選択部142、目的関数算出部144、146、及び更新部150を終了条件が充足されるまで繰返し動作させる繰返し制御部154とを含む。図3はこの形態を実現する汎用のコンピュータシステムのハードウェア外観を示す図、図4はコンピュータシステムの内部構造のブロック図、である。 |
イメージ図 |
|
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|