音声認識誤り修正装置及びそのプログラム

開放特許情報番号
L2018002100
開放特許情報登録日
2018/10/8
最新更新日
2018/10/8

基本情報

出願番号 特願2013-019376
出願日 2013/2/4
出願人 日本放送協会
公開番号 特開2014-149490
公開日 2014/8/21
登録番号 特許第6325770号
特許権者 日本放送協会
発明の名称 音声認識誤り修正装置及びそのプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 音声認識誤り修正装置及びそのプログラム
目的 修正作業が容易で、正しい修正単語列を高精度に推定できる音声認識誤り修正装置及びそのプログラムを提供すること。
効果 修正者の発話の音声認識又は修正者の手書き文字の認識の結果と仮説ラティスとを相補的に統合し、統合した仮説ラティスから統合スコアを算出するため、正しい修正単語列を高精度に推定することができる。修正者がキーボードを用いる必要がなく、修正作業を容易に行うことができる。修正者が即座に漢字表記を思い出せない場合でも、音声認識誤りを迅速に修正することができる。修正者の発話を正確に音声認識し、正しい修正単語列をより高精度に推定することができる。
統合スコアを正確に算出し、正しい修正単語列をより高精度に推定することができる。
技術概要
番組音声の音声認識結果を示す単語列に含まれる音声認識誤りを、正しい修正単語列で修正する音声認識誤り修正装置であって、
修正者の発話による音声認識誤り部分の音声認識を行う音声認識手段と、修正者による音声認識誤り部分の手書き文字認識を行う手書き文字認識手段と、音声認識又は手書き文字認識の何れかを予め選択し、予め選択した音声認識又は手書き文字認識の結果として、正しい修正単語列の候補である修正単語列候補、及び、修正単語列候補毎の認識スコアを出力するスイッチと、を備える音声認識誤り部分認識手段と、
番組音声の音声認識で評価された各単語及び各単語の音響スコアを対応付けた枝と、各単語の位置を示す枝の節点とで構成された仮説ラティスが入力され、入力された仮説ラティスの音声認識誤り部分の始点及び終点に位置する枝の節点に、修正単語列候補及び認識スコアが対応付けられた枝を接続することで、仮説ラティスを統合する仮説ラティス統合手段と、
統合された仮説ラティスの音声認識誤り部分で始点から終点までの枝の経路毎に、統合スコアを算出し、算出した統合スコアが最高になる枝の経路を正しい修正単語列として推定する音声認識誤り部分修正手段と、を備える。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT