出願番号 |
特願2006-236286 |
出願日 |
2006/8/31 |
出願人 |
日本放送協会 |
公開番号 |
特開2008-058679 |
公開日 |
2008/3/13 |
登録番号 |
特許第4705535号 |
特許権者 |
日本放送協会 |
発明の名称 |
音響モデル作成装置及び音声認識装置並びに音響モデル作成プログラム |
技術分野 |
情報・通信 |
機能 |
制御・ソフトウェア |
適用製品 |
音響モデル作成装置及び音声認識装置 |
目的 |
過学習が生じることなく、蓄積音声の有効的な利用を行うことができる音響モデル作成装置及び音声認識装置並びに音響モデル作成プログラムを提供する。 |
効果 |
予め蓄積音声に基づいて作成されている参照音響モデルの音素環境分類木の構造を用い、学習音声について、当該音素環境分類木のノードの統計量パラメータを算出して、音響モデルを作成しているので、過学習が生じることなく、蓄積音声の有効的な利用を行うことができる。 |
技術概要
|
音響モデル作成装置1は、参照音響モデルを取得する参照音響モデル取得手段3と、学習音声を取得する学習音声取得手段5と、音響モデルにおいて各音素の前後に連続する連続音素に従って各音素の音素環境を分類した音素環境分類木のノードに対応付けられる学習音声の音素サンプルから統計量パラメータを算出する学習音声統計量パラメータ算出手段7と、参照音響モデルにおいて各音素の前後に連続する連続音素に従って各音素の音素環境を分類した音素環境分類木のノードの中の最上位のルートノードと、このルートノードから下位へと分岐する複数のリーフノードとについて、リーフノードに対応付けられる統計量として、学習音声統計量パラメータ算出手段7で算出した統計量パラメータを代入する学習音声統計量パラメータ代入手段9と、この統計量パラメータについて、音素サンプルのサンプル数から得られた信頼度が、予め定義した基準値を満たさない場合に、リーフノードよりも上位のリーフノードに対応付けられる統計量パラメータを用いて新たな統計量パラメータを算出し、音響モデルを作成するモデル作成手段11と、を備える。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|