音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法

開放特許情報番号
L2008002721
開放特許情報登録日
2008/6/6
最新更新日
2015/9/18

基本情報

出願番号 特願2008-025703
出願日 2008/2/5
出願人 独立行政法人産業技術総合研究所
公開番号 特開2009-186687
公開日 2009/8/20
登録番号 特許第5046211号
特許権者 国立研究開発法人産業技術総合研究所
発明の名称 音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 音楽音響信号と歌詞の時間的対応付けを自動で行うシステム
目的 子音を正しくアラインメントできない、歌詞に書かれていない発声(例えば歌手のシャウトなど)に歌詞を割り当ててしまう、歌声の基本周波数が高い場合は歌声区間検出が必ずしも正確に検出できない、という問題をすべて解消できる音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法、並びにシステムに用いるプログラムを提供する。
効果 従来よりも歌声の基本周波数が高い場合における歌声区間の検出を正確に行うことができる。また、歌詞に書かれていない発声(例えば歌手のシャウトなど)をフィラーが吸収して、これらの発音に歌詞を割り当ててしまう問題が発生するのを防止することができる。さらに、アラインメント部は、少なくとも非歌声区間には音素が存在しないという条件の下で、アラインメント動作を実行するので、非歌声区間の影響を極力排除した状態で、音素ネットワーク中の複数の音素と各時刻における優先音音響信号とを時間的に対応付けることができる。
技術概要
図1は、音楽音響信号と歌詞の時間的対応付けを自動で行うシステム1をコンピュータを用いて実現する場合に、コンピュータ内に実現される機能実現部の構成を示すブロックである。また図2は、図1の形態をプログラムをコンピュータで実行することにより実施する場合のステップを示すフローチャートである。このシステム1は、音楽音響信号記憶部3と、非摩擦音区間抽出部4と、優勢音音響信号抽出部5と、歌声区間推定用特徴量抽出部7と、歌声区間推定部9と、時間的対応付け用特徴量抽出部11と、音素ネットワーク記憶部13と、歌声用音響モデル15を備えたアラインメント部17とを備える。歌声区間推定用特徴量抽出部7は、各時刻における優勢音音響信号から歌声が含まれている歌声区間と歌声が含まれていない非歌声区間とを推定するために利用可能な歌声区間推定用特徴量を抽出する。12次元の正規化対数倍音パワーと、1次元の基本周波数F0と、1次元の基本周波数F0の微分係数(ΔF0)をここで利用可能な歌声区間推定用特徴量として用いる。図3は歌声区間推定部の具体的な構成を示すブロック図である。図4は歌声区間推定部をプログラムにより実現する場合のフローチャートである。
イメージ図
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT