音高推定方法及び装置

開放特許情報番号
L2003002230
開放特許情報登録日
2003/3/14
最新更新日
2015/8/25

基本情報

出願番号 特願平11-305770
出願日 1999/10/27
出願人 独立行政法人産業技術総合研究所、後藤 真孝
公開番号 特開2001-125562
公開日 2001/5/11
登録番号 特許第3413634号
特許権者 国立研究開発法人産業技術総合研究所、後藤 真孝
発明の名称 音高推定方法及び装置
技術分野 生活・文化
機能 検査・検出
適用製品 メロディーライン、ベースライン、歌声、鍵盤楽器(ピアノ等)、ギター、ベースギター、ドラムス
目的 歌声や複数種類の楽器音を同時に含む音楽音響信号を対象に、メロディーとベースの音高(基本周波数の意味で用いる)を推定する音高推定方法及び装置の提供。
効果 基本周波数成分の有無を問わず、意図的に制限した周波数帯域から得られる部分情報だけを利用して、ロバストに優勢な音高の軌跡を推定できる。また音源数を仮定せずに混合音をモデル化し、EMアルゴリズムを適用することで、各高調波構造が相対的にどれくらい優勢かを表す基本周波数の確率密度関数を推定することができる。
技術概要
この技術は、各音の高調波構造に対応する確率分布の混合分布として混合音をモデル化する。その重みの値をEM(Expectation−Maximization)アルゴリズムを用いて推定することで、基本周波数成分の存在に依存せずに、最も優勢な高調波構造を求めている。メロディーは中高域において最も優勢な高調波構造を持ち、ベースは低域においても最も優勢な高調波構造を持つことが多いため、これを周波数帯域に対して適用すれば、メロディーとベースの音高が推定できる。即ち、最も優勢な音高を推定するに際して、まず、入力音響信号に対してマルチレート信号処理をおこなって瞬時周波数を計算し、瞬時周波数に関連した尺度に基づいて周波数成分の候補を抽出する。次に、2種類のバンドパスフィルタ(メロディーライン用とベースライン用)を適用し、各出力に基づいて、基本周波数(音高)の確率密度関数を求める。そして、マルチエージェントモデルを導入し、その確率密度関数の中で有望な各ピークの軌跡を異なるエージェントが追跡して信頼度を評価し、最も信頼度の高いエージェントが持つ優勢な基本周波数の軌跡を出力する。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT