音声認識誤り修正装置

開放特許情報番号
L2018002189
開放特許情報登録日
2018/10/15
最新更新日
2018/10/15

基本情報

出願番号 特願2014-170540
出願日 2014/8/25
出願人 日本放送協会
公開番号 特開2016-045414
公開日 2016/4/4
登録番号 特許第6358744号
特許権者 日本放送協会
発明の名称 音声認識誤り修正装置
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア、検査・検出
適用製品 音声認識誤り修正装置
目的 簡易なシステム構成でより精度の高い音声認識誤り修正装置を提供する。
また、発話者が原稿を最後まで読み上げる前であっても、途中の適切な段階で出力文(修正後の文)を確定することをも可能にする音声認識誤り修正装置を提供する。
効果 複雑な構成のシステムを必要とせず、音声認識結果の誤りを修正することができる。
また、従来技術を用いたときにブロック境界に起因して生じていた自動修正誤りの発生を低減することができる。
また、修正後の認識結果を早く確定させて出力することが可能となる。
本発明は、音声認識結果を利用した字幕等のコンテンツの作成に利用することができる。例えば、放送事業や、その他のコンテンツ提供事業において、利用することが可能である。
技術概要
原稿テキストに対応して、音声認識結果として入力される単語を順次受理しながら状態遷移していく有限状態トランスデューサーであって、音声認識結果に含まれる単語の誤りをも受理しながら状態遷移していく有限状態トランスデューサーの、状態に関する情報、および状態遷移に関して遷移元状態と遷移先状態と入力シンボルと出力シンボルと遷移重みとを含む情報、とを記憶する有限状態トランスデューサー情報記憶部と、
状態の尤度を表すスコアを記憶するノードデータ記憶部と、
ノードデータ記憶部を更新するノードデータ更新部と、
処理開始を受け付けると、その時点における最尤ノードを決定するとともに、最尤ノードまでの状態遷移を遡ることにより、状態遷移が確定済みの所定の時刻までのトレースバック処理を行い、トレースバック処理した状態遷移のパスを出力候補とするとともに、出力候補となったパスに関して、当該パスに誤りに関する状態遷移が含まれる割合に応じた誤りスコアを算出し、算出された誤りスコアに基づいて誤りの度合いが所定の閾値より小さい場合に当該パスの出力候補を、確定出力とする原稿探索部と、
確定出力を出力する出力部と、
を具備する音声認識誤り修正装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT