雑音抑圧音声認識装置およびそのプログラム

開放特許情報番号
L2019001201
開放特許情報登録日
2019/7/23
最新更新日
2019/7/23

基本情報

出願番号 特願2015-060541
出願日 2015/3/24
出願人 日本放送協会
公開番号 特開2016-180839
公開日 2016/10/13
登録番号 特許第6464005号
特許権者 日本放送協会
発明の名称 雑音抑圧音声認識装置およびそのプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 雑音抑圧音声認識装置およびそのプログラム
目的 雑音が重畳した入力音声から、音声認識対象の音声(母語音声)による音声区間を検出するとともに、当該区間に重畳されている雑音を抑圧して音声認識を行う雑音抑圧音声認識装置およびそのプログラムを提供する。
効果 本発明によれば、雑音が重畳した入力音声であっても、音声と雑音とをモデル化した統計モデルを用いることで、音声認識対象の音声による音声区間を精度よく検出することができる。また、本発明によれば、検出した音声区間に重畳されている雑音の種類に応じた雑音抑圧処理を施すことができるため、音声認識の精度を高めることができる。
技術概要
入力音声から、フレーム単位で音響特徴量を抽出する音響特徴量抽出手段と、
音響特徴量と音声認識対象である母語音声を含む音声の種類ごとの関係、および、音響特徴量と雑音の種類ごとの関係とを予め学習した統計モデルを記憶する統計モデル記憶手段と、
統計モデルに基づいて、音響特徴量抽出手段で抽出された音響特徴量から、フレームごとに、音声の種類ごとの各クラスが出現する事後確率と、雑音の種類ごとの各クラスが出現する事後確率とを、各クラスのクラス特徴量として算出するクラス特徴量算出手段と、
種類ごとの各クラスが出現する事後確率に基づいて、母語音声の音声区間を検出する音声区間検出手段と、
雑音の種類ごとの雑音区間を検出する雑音区間検出手段と、
音声区間に対応する雑音区間における雑音の種類に応じて、予め定めた雑音抑圧手法を選択する雑音抑圧処理選択手段と、
雑音抑圧処理選択手段で選択された雑音抑圧手法で、音声区間における雑音の音響特徴量を抑圧した音響特徴量を生成する雑音抑圧手段と、
雑音抑圧手段で生成された音響特徴量により音声認識を行う音声認識手段と、
を備えることを特徴とする雑音抑圧音声認識装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2019 INPIT