音声言語コーパス生成装置およびそのプログラム
- 開放特許情報番号
- L2020001527
- 開放特許情報登録日
- 2020/8/5
- 最新更新日
- 2020/8/5
基本情報
出願番号 | 特願2016-031925 |
---|---|
出願日 | 2016/2/23 |
出願人 | 日本放送協会 |
公開番号 | |
公開日 | 2017/3/2 |
登録番号 | |
特許権者 | 日本放送協会 |
発明の名称 | 音声言語コーパス生成装置およびそのプログラム |
技術分野 | 情報・通信 |
機能 | 機械・部品の製造 |
適用製品 | 音響モデルを学習するためのコーパスを生成する音声言語コーパス生成装置およびそのプログラム |
目的 | 特定の番組において、発話区間中に認識仮説と字幕(字幕テキスト)とに不一致があっても、ある条件下で、字幕を書き起こしとみなすことで、高精度な音響モデルを学習するために必要な音声言語コーパスを構築する音声言語コーパス生成装置およびそのプログラムを提供する。 |
効果 | 特定の番組単位で、字幕テキストを、音響モデルを学習するためのコーパスとして適用可能な否かを、予め特定の番組において学習したミスマッチ確率により判定することができる。
既存の字幕テキストから大規模な音声言語コーパスを構築することができ、さらに、認識精度を高めた音響モデル生成することが可能になる。 |
技術概要 |
特定の番組の音声認識に使用する音響モデルを学習するための音声言語コーパスを生成する音声言語コーパス生成装置であって、
前記特定の番組の番組音声を音声認識した認識仮説と字幕テキストと書き起こしとから、前記字幕テキストと前記認識仮説との対応パターンに対応付けて、前記字幕テキストと前記書き起こしとが一致しないミスマッチ確率を算出するミスマッチ確率算出手段と、 前記特定の番組と同じ分類に属する番組の前記音声言語コーパスの候補となるコーパス候補番組音声を音声認識したコーパス候補認識仮説と、予め付されたコーパス候補字幕テキストとの対応パターンに対応した前記ミスマッチ確率により、前記コーパス候補字幕テキストの発話区間ごとの誤り率を算出し、当該誤り率が閾値以下の発話区間のコーパス候補番組音声およびコーパス候補字幕テキストを、前記音声言語コーパスとして選択するコーパス選択手段と、 を備えることを特徴とする音声言語コーパス生成装置。 |
実施実績 | 【無】 |
許諾実績 | 【無】 |
特許権譲渡 | 【否】 |
特許権実施許諾 | 【可】 |
登録者情報
登録者名称 | |
---|---|
その他の情報
関連特許 |
|
---|