発話区間検出装置及び発話区間検出のためのコンピュータプログラム

開放特許情報番号
L2013002142
開放特許情報登録日
2013/10/23
最新更新日
2016/10/27

基本情報

出願番号 特願2012-046358
出願日 2012/3/2
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2013-182150
公開日 2013/9/12
登録番号 特許第5988077号
特許権者 国立研究開発法人情報通信研究機構
発明の名称 発話区間検出装置及び発話区間検出のためのコンピュータプログラム
技術分野 情報・通信
機能 機械・部品の製造、検査・検出、制御・ソフトウェア
適用製品 発話区間検出装置及びコンピュータプログラム
目的 背景に人の声が入る環境下でも頑健に特定話者の発話区間を検出できる発話区間検出装置を提供する。
効果 背景に人の声が入る環境下でも頑健に特定話者の発話区間を検出できる発話区間検出装置を提供できる。
音声認識の精度を高めることができ、複数のマイクロフォンを使用したりする必要もなく、例えば携帯電話等に適宜組込むことが容易に行なえる。
技術概要
発話区間検出装置は、特定話者の音響モデル108、不特定話者の音響モデル106、及び、無音状態の音響モデル110を記憶する音響モデル記憶装置と、音声信号のフレームごとに音響特徴量を算出して出力する特徴抽出部102と、一連の音響特徴量からなるフレームの各々が、特定話者、不特定話者、及び無音状態からの音声である尤度を音響モデル108,106及び110を用いて算出する尤度算出部124、126、及び128と、算出された尤度に基づいて特定話者の音声信号から得られた区間を推定するモデル適用部122とを含む。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2017 INPIT