音声/音楽混合比推定装置およびそれを用いたオーディオ装置

開放特許情報番号
L2007004104
開放特許情報登録日
2007/8/31
最新更新日
2007/8/31

基本情報

出願番号 特願2001-330154
出願日 2001/10/29
出願人 日本放送協会
公開番号 特開2003-131686
公開日 2003/5/9
登録番号 特許第3933909号
特許権者 日本放送協会
発明の名称 音声/音楽混合比推定装置およびそれを用いたオーディオ装置
技術分野 情報・通信
機能 その他
適用製品 放送装置、放送オーディオ装置、音声/音楽の混合比推定装置
目的 背景音楽(BGM:背景音)によりナレーション音声が聞きづらくなる場合にも、その人に適応させるようにしてナレーションを聞きやすくする技術、オーディオ信号のナレーション音が効果的に強調され聞きやすくすることが可能な技術を提供する。
効果 放送されているオーディオ信号に含まれるナレーション音声成分とBGM(背景音)音楽成分の混合比を推定することができ、この混合比の推定結果に従って、ナレーション音と効果音のバランスの制御方法を適応的に切り替えることで、オーディオ信号のナレーション音が効果的に強調された聞きやすい音を提供することが可能となる。
技術概要
図1に示す、音声/音楽混合比推定装置を用いたオーディオ装置は、純粋なナレーション音声と音楽を用いて音声信号及び音楽信号の特徴データもしくは特徴ベクトルをあらかじめ学習して記憶しておく学習済み特徴データ記憶手段1と、放送されているオーディオ信号の音声と音楽の特徴データもしくは特徴ベクトルを抽出する音声/音楽特徴データ抽出手段2と、学習済み特徴データ記憶手段1からの特徴データと音声/音楽特徴データ抽出手段2からの放送されているオーディオ信号の特徴データを入力して、オーディオ信号のナレーション音声と音楽の混合比を推定する音声/音楽混合比推定手段3と、音声/音楽混合比推定手段3による混合比の推定結果に従って、ナレーション音と効果音のバランスの制御方法を切り替える混合比推定適応音声強調回路4とを備える。図2は音声/音楽特徴データ抽出手段2の構成例であり、周波数分析手段21等からなり音声/音楽特徴データを抽出する。図3は音声/音楽混合比推定手段3の構成を示すブロック図である。図4は混合比推定適応音声強調回路4の構成を示すブロック図で、条件に合致した時に必要な音声強調路をとおった同じ音が出力される。
イメージ図
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2017 INPIT