出願番号 |
特願2008-053923 |
出願日 |
2008/3/4 |
出願人 |
日本放送協会 |
公開番号 |
特開2009-210829 |
公開日 |
2009/9/17 |
登録番号 |
特許第4869268号 |
特許権者 |
日本放送協会 |
発明の名称 |
音響モデル学習装置およびプログラム |
技術分野 |
情報・通信 |
機能 |
制御・ソフトウェア、検査・検出、機械・部品の製造 |
適用製品 |
音響モデル学習装置およびそのプログラム |
目的 |
字幕と発話内容の一致率が低いオフライン字幕を利用した場合にも、高い認識率によって音響モデルの学習データを自動生成し、多様な発話スタイルに対応できる音響モデルを作成できる音響モデル学習装置を提供する。 |
効果 |
字幕が付与されている様々な番組音声から、大量の音響モデルの学習データを効率的に得ることができる。また、字幕と実際の音声との一致率が低い番組音声からも、より効率的に、音響モデルの学習データを得ることが可能となる。また、これまで認識できなかった番組や話者の認識が可能になったり、音声認識の認識精度の向上が可能になったりする。 |
技術概要
|
音響モデル学習装置が、音素と該音素に対応する音響特徴量とを関連付けた音響モデルを記憶する音響モデル記憶部と、音響モデル記憶部から読み出した音響モデルを用いて音声の認識処理を行い、認識結果データを出力する認識処理部と、音声に対応するテキストデータと認識処理部が出力した認識結果データとに基づき、これら両データの一致区間を選択し、選択した前記一致区間に含まれる音素と当該音素に対応する音響特徴量との組を学習データとして出力する選択処理部と、選択処理部が出力した学習データを用いて、前記の音響モデルを更新する音響モデル適応化部を備える。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|