混合音信号中の混合比率推定方法及びシステム並びに音素認識方法

開放特許情報番号
L2009006473
開放特許情報登録日
2009/11/13
最新更新日
2018/1/8

基本情報

出願番号 特願2011-523664
出願日 2010/7/21
出願人 国立研究開発法人産業技術総合研究所
公開番号 WO2011/010647
公開日 2011/1/27
登録番号 特許第5334142号
特許権者 国立研究開発法人産業技術総合研究所
発明の名称 混合音信号中の混合比率推定方法及びシステム並びに音素認識方法
技術分野 情報・通信
機能 検査・検出
適用製品 音素認識技術、カラオケ、音楽プレイヤー、音楽ビデオ
目的 混合音信号中の対象音信号とノイズ信号との混合比率を推定することができる混合音信号の混合比率推定方法及びシステムの提供。
効果 本技術によれば、歌詞が認識できることで、歌詞が未知の楽曲を歌詞を手がかりに検索できる。また、音素の自動認識技術は、歌詞と音楽の時間的対応付けに適用することができ、歌詞をカラオケのように表示する音楽プレイヤーや音楽ビデオのテロップ自動作成などに応用できる。
技術概要
本技術は、混合音信号から離散的に取得した1フレーム信号に含まれる対象音信号とノイズ信号との混合比率を、コンピュータを用いて推定する混合音信号の混合比率推定方法を改良の対象とする。対象音信号には、音声信号(歌声信号を含む)や楽器の音響信号等が含まれる。またノイズ信号は、混合音信号に含まれる対象音信号以外の信号を言う。また「離散的に取得した1フレーム信号」とは、所定の時間幅のハニング窓を1フレームとして用いて混合音信号から取得した信号である。ここで、1以上の学習用対象音信号の周波数成分とパワースペクトルの確率分布の関係を示す1以上の対象音スペクトルテンプレートを用意する。また1以上の学習用ノイズ信号の周波数成分とパワースペクトルの確率分布の関係を示す1以上のノイズ・スペクトルテンプレートを用意する。そして1以上の対象音スペクトルテンプレートと1以上のノイズ・スペクトルテンプレートとを組み合わせて合成することにより1以上の確率的スペクトルテンプレートを作成する。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT