出願番号 |
特願2010-064175 |
出願日 |
2010/3/19 |
出願人 |
日本放送協会 |
公開番号 |
特開2011-197410 |
公開日 |
2011/10/6 |
登録番号 |
特許第5271299号 |
特許権者 |
日本放送協会 |
発明の名称 |
音声認識装置、音声認識システム、及び音声認識プログラム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造、制御・ソフトウェア |
適用製品 |
音声認識装置、音声認識システム、音声認識プログラム |
目的 |
音声認識の正解精度を向上させるための音声認識装置、音声認識システム、及び音声認識プログラムを提供する。 |
効果 |
本発明によれば、音声認識の正解精度を向上させることができる。また、モデルの精度を向上させ、リアルタイムに修正内容を反映させることができる。さらに、同じ発話に対する音声認識結果を繰り返し取得して、自動的に誤り修正装置の画面上の文字を最新の状態に変更することができる。
また、字幕テキスト等の最終結果をより正しく、より少ない遅れ時間で提供することができる。
字幕制作の他にも、オンラインで音声認識結果の確認及び誤り修正が施される音声文字化システム等に広く利用できる。 |
技術概要
|
入力音声に対する音声認識結果と誤り修正結果とを用いて音声認識を行う音声認識装置において、前記入力音声の音響特徴量を抽出する音響分析手段と、予め設定された音響モデル、言語モデル、及び発音辞書を用いて、候補単語のネットワークからなる単語ラティスを生成する単語ラティス生成手段と、前記単語ラティス生成手段により得られる前記単語ラティスから最尤単語列を選択する最尤単語列選択手段と、前記最尤単語列に対して修正された単語列を用いて前記音響モデルを学習させる音響モデル識別学習手段と、前記音響モデル識別学習手段により学習された音響モデルを用いて、前記修正された単語列に対する単語ラティスを再構成する単語ラティス再構成手段とを有することにより、上記課題を解決する。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|