学習データ生成装置及びそのプログラム

開放特許情報番号
L2019000798 この特許をより詳しくイメージできる、登録者からの説明資料をご覧頂けます
開放特許情報登録日
2019/6/7
最新更新日
2024/5/21

基本情報

出願番号 特願2014-211298
出願日 2014/10/16
出願人 日本放送協会
公開番号 特開2016-080832
公開日 2016/5/16
登録番号 特許第6426971号
特許権者 日本放送協会
発明の名称 学習データ生成装置及びそのプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 学習データ生成装置及びそのプログラム
目的 高精度な学習データをより多く生成できる学習データ生成装置及びそのプログラムを提供する。
効果 音声認識の精度が低いために音声認識テキストと字幕テキストとの単語が一致しない場合でも、音声認識テキストの単語を置換する。これにより、学習データ生成装置は、音声認識テキストと字幕テキストとの単語一致区間が増加するため、高精度な学習データをより多く生成することができる。
技術概要
放送番組の音声認識に用いる音響モデルの適応化に必要な学習データを、準教師あり学習により生成する学習データ生成装置であって、
テキストコーパスから予め生成した第1言語モデルと、放送番組の字幕テキストから予め生成した第2言語モデルとを線形補間することで、第3言語モデルを生成する第3言語モデル生成手段と、
第3言語モデル及び予め生成した音響モデルを用いて、放送番組を音声認識する音声認識手段と、
放送番組の音声認識結果を表す音声認識テキストと字幕テキストとの単語を、時刻順で対応付けるアライメントを行うアライメント手段と、
音声認識テキストと字幕テキストとの間で対応付けられた単語毎に、置換対象であるか否かを判定し、置換対象の場合、音声認識テキストの単語を字幕テキストの単語に置換する置換手段と、
放送番組の発話区間毎に、置換手段で置換された音声認識テキストと字幕テキストとが一致するか否かを判定し、一致すると判定された発話区間の音声データに、当該発話区間に対応した字幕テキストの単語をラベルとして付与することで、学習データを生成する学習データ生成手段と、
を備えることを特徴とする学習データ生成装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2024 INPIT