音声信号と非音声信号の判別装置及び方法

開放特許情報番号
L2006003972
開放特許情報登録日
2006/6/23
最新更新日
2015/9/16

基本情報

出願番号 特願2006-058038
出願日 2006/3/3
出願人 独立行政法人産業技術総合研究所
公開番号 特開2007-233267
公開日 2007/9/13
登録番号 特許第4595124号
特許権者 国立研究開発法人産業技術総合研究所
発明の名称 音声信号と非音声信号の判別装置及び方法
技術分野 情報・通信
機能 機械・部品の製造、検査・検出
適用製品 音声信号と非音声信号の判別装置
目的 ユーザーの入力音声を、周辺の雑音や人間のくしゃみ、咳音のような非音声区間までも音声信号として誤認識することを防ぎ、さらに、健常者の日常発声からのピッチ範囲を超える高い周波数成分を持つ障害者の音声のピッチの場合にも、非音声と判定する誤りを無くすようにする。また、音声入力と鼻歌入力とを識別する装置をさらに設けること無く、音声認識のための入力とマルチメディア検索のための鼻歌入力を処理する。
効果 信頼性の高いピッチ軌跡の測定から広帯域にわたってより正確なピッチを測定できる方法を導入することにより、音声だけではなく、咳音、呼吸音のような声帯から生成される類似音声や、音声と誤判定されるほど大きなパワーが測定される摩擦性雑音に対しても優れた音声/非音声の判別性能が得られる。その結果、音声認識処理を行う前に非音声の入力を効率的に棄却できる。ユーザーが音声以外の音を出さないように注意しなくても、自然な音声を入力することで音声認識装置を利用できる。
技術概要
音声または音響信号を入力して、該信号が音声信号か非音声信号かを判別する装置において、入力信号の始端と終端と判定される区間における信号処理のための各分析区間であるフレーム毎にピッチを測定する装置と、測定されたピッチを検証し、ピッチが測定されたフレームに対する信頼度を判定する装置と、信頼性あるピッチと判定されたフレームを対象に、ピッチが音声周波数範囲にあるか否かを判定するピッチ周波数範囲判定装置と、音声周波数範囲にあると判定された信号に対して、ピッチ発生率計算装置により計算されたピッチの発生率に基づき、音声信号か非音声信号かを判別する装置と、から成る音声信号と非音声信号の判別装置である。また、ピッチ発生率計算装置に加えて、過去のピッチと現在のピッチとの変化を測定し、その変化量が音声の変化量の閾値による判定を行う基本周波数変化量測定装置と、特定話者のピッチ範囲を事前に設定し、入力されたピッチが特定話者のピッチ範囲であるかの判定を行う話者特定ピッチ範囲判定装置との少なくとも1つを用いて音声信号か非音声信号かを判別する。図1は信頼性の高いピッチ測定方式を用いる音声/非音声の判別装置の構成を示す図である。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

アピール情報

導入メリット 【改善】
改善効果1 音声が入力された時、ピッチを同時に測定するので、音声認識装置への入力だけではなく、測定されたピッチを鼻歌に変換して、音楽検索装置への入力として用いられる。そのため、時間的な効率と計算量の減少などの効果がある。

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2017 INPIT