音声認識装置及びプログラム

開放特許情報番号
L2019001825
開放特許情報登録日
2019/10/16
最新更新日
2019/10/16

基本情報

出願番号 特願2014-166016
出願日 2014/8/18
出願人 日本放送協会
公開番号 特開2016-042152
公開日 2016/3/31
登録番号 特許第6487650号
特許権者 日本放送協会
発明の名称 音声認識装置及びプログラム
技術分野 情報・通信
機能 制御・ソフトウェア、機械・部品の製造
適用製品 音声認識装置及びプログラム
目的 複数話者のシングルチャンネルの混合音声から、特定話者による相づち等の音声を分離し、主音声を認識することが可能な音声認識装置及びプログラムを提供する。
効果 複数話者のシングルチャンネルの混合音声から、特定話者による相づち等の音声を分離し、主音声を認識することが可能となる。
技術概要
複数話者のシングルチャンネルの混合音声から特定話者による特定発話を分離し、特定発話が分離された主音声を認識する音声認識装置であって、
予め収録された特定話者による特定発話の音声信号を周波数分析して特徴量を計算し、特定発話の音声信号の特徴量に基づいて発話モデルを学習するモデル学習部と、
混合音声の信号を周波数分析して特徴量を計算し、混合音声の信号の特徴量と発話モデルにおける特定発話の音声信号の特徴量とに基づいて、混合音声の信号と特定発話の音声信号とのマッチングを行い、混合音声から、特定発話の音声信号を含む特定発話区間を検出する特定発話区間検出部と、
発話モデルを用いて、特定発話区間検出部により検出された特定発話区間における特定発話の音声信号の推定スペクトルを生成すると共に、混合音声の信号を周波数分析してスペクトルを生成し、特定発話区間における特定発話の音声信号の推定スペクトルと、混合音声のうち特定発話区間の音声信号のスペクトルとに基づいて、混合音声の信号から特定発話の音声信号を周波数領域において分離し、特定発話が分離された主音声信号のスペクトルを生成する話者分離計算部と、を備える音声認識装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2023 INPIT