出願番号 |
特願2012-270107 |
出願日 |
2012/12/11 |
出願人 |
日本放送協会 |
公開番号 |
特開2014-115499 |
公開日 |
2014/6/26 |
登録番号 |
特許第6183988号 |
特許権者 |
日本放送協会 |
発明の名称 |
音声認識装置、誤り修正モデル学習方法、及びプログラム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造、制御・ソフトウェア |
適用製品 |
音声認識装置、誤り修正モデル学習方法、及びプログラム |
目的 |
音声の書き起こしテキストの作成にかかるコストを軽減しながら誤り修正モデルを学習することができる音声認識装置、誤り修正モデル学習方法、及びプログラムを提供する。 |
効果 |
本発明によれば、音声の書き起こしテキストの作成にかかるコストを軽減しながら誤り修正モデルを生成することができる。 |
技術概要
 |
適応化言語モデルを生成する言語モデル適応化部と、放送音声データを音声認識する適応化言語モデル使用音声認識部と、使用音声認識部による音声認識結果を用いて音響モデルを適応化し、適応化音響モデルを生成する音響モデル適応化部と、前記適応化言語モデル及び前記適応化音響モデルを用いて前記放送音声データを音声認識する適応化音響モデル使用音声認識部と、音声認識結果を構成する各単語についての信頼度を計算する信頼度計算部と、前記適応化音響モデル使用音声認識部による前記音声認識結果を構成する各単語に前記信頼度計算部により計算された前記信頼度に応じて正解または誤りを示すラベルを付与し、部分正解単語列を生成する部分正解単語列抽出部と、適応化していない言語モデル及び音響モデルを用いて前記放送音声データを音声認識する放送音声認識部と、前記部分正解単語列において正解のラベルが付与された単語を正解とみなして前記放送音声認識部による前記音声認識結果に期待される認識誤り数を算出し、算出した前記期待される認識誤り数に基づいて、言語的な特徴により音声認識のスコアを修正する式である誤り修正モデルを学習する誤り傾向学習部と、を備えることを特徴とする。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|