技術概要
|
音声認識装置は、音声データと正解単語列とを含む学習データから単語及び単語のクラスに基づく統計的言語モデルを学習する。音声認識装置は、学習した統計的言語モデルに含まれるクラスに属する単語のリストを、音声認識対象に応じた単語のリストに書き換える。音声認識装置は、入力された音声データを、統計的音響モデルと、統計的言語モデルと、単語及びクラスに基づく言語的な特徴により音声認識における単語の誤り傾向を修正するための誤り修正モデルとを用いて音声認識する。音声認識装置は、キーボード等を用いたユーザーの入力に従って音声認識結果を修正して正解単語列を得ると、正解単語列に含まれる各単語を音声データに基づいて時刻順に整列する。音声データが入力されるたびに逐次、音声認識結果と整列させた正解単語列とのそれぞれに含まれる単語及び単語が属するクラスに基づく言語的な特徴から単語誤りの傾向を学習し、学習した単語誤りの傾向に応じて現在の誤り修正モデルを更新する。
これにより、統計的言語モデルの学習に用いた学習データの語彙と音声認識させたい語彙とが異なる場合でも、音声認識対象に適合した誤り修正モデルを逐次学習し、音声認識に適用することができる。 |