音声認識誤り修正支援装置およびそのプログラム

開放特許情報番号
L2022000512
開放特許情報登録日
2022/3/31
最新更新日
2022/3/31

基本情報

出願番号 特願2019-081066
出願日 2019/4/22
出願人 日本放送協会
公開番号 特開2019-197210
公開日 2019/11/14
登録番号 特許第6949075号
特許権者 日本放送協会
発明の名称 音声認識誤り修正支援装置およびそのプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 音声認識の誤り修正を支援する音声認識誤り修正支援装置およびそのプログラム
目的 単語単位で音声の再生を可能とし、音声認識の完了済みまたは音声認識中のコンテンツであっても、複数の修正端末での待ち時間を抑えて、迅速に音声認識の誤りを修正することが可能な音声認識誤り修正支援装置およびそのプログラムを提供する。
効果 素材コンテンツを音声認識した認識結果を、修正端末の編集画面上に表示し、任意の単語位置で音声を再生して認識結果を把握することができるとともに、複数の修正端末で修正内容を共有して認識誤りを修正することができる。
また、本発明によれば、複数の修正端末による修正を後書き優先で行うことで、修正端末間で排他制御を行うことなく、修正端末の待ち時間を減らすことができる。
技術概要
コンテンツに含まれる音声に対する音声認識の誤りを複数の修正端末を介して修正する音声認識誤り修正支援装置であって、
テキストデータである音声の認識結果を発話内容の切り替わりごとのセグメントに分割する認識結果分割手段と、
記憶手段と、
修正端末が接続されるたびに修正端末に対するプロセスとして複製され、修正端末を介して修正内容を取得し、音声認識の誤りを修正する編集手段とを備え、
編集手段は、
項目情報とともにセグメントに含まれる単語列を表示するか否かを指定するボタンを表示し、ボタンの選択により、編集画面を表示してセグメントの単語列を展開するか、編集画面を非表示とするかの制御を行う編集画面制御手段と、
編集画面上で指定されたテキスト内における単語の時間情報に基づいて、対応する音声を、修正端末に出力する音声出力手段と、
編集画面で修正された修正内容を用いて、憶手段に記憶されている認識結果を後書き優先で更新するとともに、認識結果が後書きされた旨の更新通知を他の編集手段に通知して修正端末に対応する前記修正内容を反映させる誤り修正手段と、
を備えることを特徴とする音声認識誤り修正支援装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2024 INPIT