出願番号 |
特願2012-048232 |
出願日 |
2012/3/5 |
出願人 |
日本放送協会 |
公開番号 |
特開2013-182261 |
公開日 |
2013/9/12 |
登録番号 |
特許第6027754号 |
特許権者 |
日本放送協会 |
発明の名称 |
適応化装置、音声認識装置、およびそのプログラム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造、検査・検出 |
適用製品 |
適応化装置、音声認識装置、ならびにそのプログラム |
目的 |
音声区間ごとの認識のし易さを考慮して音響モデルの適応化を行う適応化装置、および適応化プログラム、ならびにそのような適応化を行なう音声認識装置を提供する。 |
効果 |
本発明は、音声の音響的特徴を用いた統計的処理に利用可能である。特に、本発明は、音声認識処理に利用可能である。さらに、本発明は、音声認識処理を利用して放送番組等の音声に対応したテキストデータ(字幕データ)を生成する処理に利用可能である。 |
技術概要
|
音素と音響特徴量との間の統計的関係を表わすデータを含んでなる音響モデルを読み込み、前記音響モデルに基づいて、読み込まれる音声データと前記音声データに対応するテキストデータとを時間的にアラインすることにより、時刻に対応付けた音響尤度データを含んでなる第1アライメント結果データを生成する第1アライメント部と、
前記音声データの認識結果データを読み込み、前記音響モデルに基づいて、前記音声データと読み込んだ前記認識結果データとを時間的にアラインすることにより、時刻に対応付けた音響尤度データを含んでなる第2アライメント結果データを生成する第2アライメント部と、前記時刻ごとに前記第1アライメント結果データに含まれる音響尤度データと前記第2アライメント結果データに含まれる音響尤度データとを比較する重点区間検出部と、
前記重点区間検出部による比較結果に応じた重み付けを音声区間に付与しながら前記音響モデルを適応化する適応化処理部と、を具備する、ことを特徴とする適応化装置。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|