音声特性処理装置、音声認識装置およびプログラム
- 開放特許情報番号
- L2023000479
- 開放特許情報登録日
- 2023/5/22
- 最新更新日
- 2023/5/22
基本情報
出願番号 | 特願2018-091616 |
---|---|
出願日 | 2018/5/10 |
出願人 | 日本放送協会 |
公開番号 | |
公開日 | 2019/11/14 |
登録番号 | |
特許権者 | 日本放送協会 |
発明の名称 | 音声特性処理装置、音声認識装置およびプログラム |
技術分野 | 情報・通信 |
機能 | 制御・ソフトウェア |
適用製品 | 音声特性処理装置、音声認識装置およびプログラム |
目的 | 音声認識結果の単語列に関連付く音声特性を容易に把握することを可能とする音声特性処理装置、音声認識装置およびプログラムを提供する。 |
効果 | 音声認識結果として得られる認識単語列を、その認識単語列が発話された時の音声特性に基づいて提示することが可能となる。 |
技術概要 |
入力される音声の音響特徴量を取得し、前記音響特徴量の次元圧縮処理により音声特性情報を生成し、前記音声特性情報を出力する音声特性解析部と、
前記音響特徴量に少なくとも基づく音声認識処理により生成された認識単語列を取得するとともに、前記音声特性解析部が出力した音声特性情報を取得し、前記認識単語列と前記音声特性情報とを時間軸方向に対応付けし、対応付けされた前記音声特性情報に基づき前記認識単語列の文字属性を含む提示属性を用いて、前記認識単語列を提示する音声特性提示部と、 を具備し、 前記音声特性提示部は、前記音声特性情報を色相と彩度と明度の成分からなるHSV色空間内の色に写像することによって決定される文字フォントの色を前記提示属性として用いて、前記認識単語列を文字列として視覚的に出力するものであり、 前記音声特性提示部は、前記音声特性情報を写像することによって決定されたHSV色空間の座標値を、さらに、RGB(赤/緑/青)色空間の座標値またはCMYK(シアン/マゼンタ/イエロー/ブラック)色空間の座標値に変換して前記文字フォントの色とする、 音声特性処理装置。 |
実施実績 | 【無】 |
許諾実績 | 【無】 |
特許権譲渡 | 【否】 |
特許権実施許諾 | 【可】 |
登録者情報
登録者名称 | |
---|---|
その他の情報
関連特許 |
|
---|