ページの本文に

ウインドウを閉じる

音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法

開放特許情報番号: L2008002721

開放特許情報登録日: 2008/6/6

最新更新日: 2015/9/18

基本情報

出願番号	特願2008-025703
出願日	2008/2/5
出願人	独立行政法人産業技術総合研究所
公開番号	特開2009-186687
公開日	2009/8/20
登録番号	特許第5046211号
特許権者	国立研究開発法人産業技術総合研究所
発明の名称	音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法
技術分野	情報・通信
機能	機械・部品の製造、制御・ソフトウェア
適用製品	音楽音響信号と歌詞の時間的対応付けを自動で行うシステム
目的	子音を正しくアラインメントできない、歌詞に書かれていない発声（例えば歌手のシャウトなど）に歌詞を割り当ててしまう、歌声の基本周波数が高い場合は歌声区間検出が必ずしも正確に検出できない、という問題をすべて解消できる音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法、並びにシステムに用いるプログラムを提供する。
効果	従来よりも歌声の基本周波数が高い場合における歌声区間の検出を正確に行うことができる。また、歌詞に書かれていない発声（例えば歌手のシャウトなど）をフィラーが吸収して、これらの発音に歌詞を割り当ててしまう問題が発生するのを防止することができる。さらに、アラインメント部は、少なくとも非歌声区間には音素が存在しないという条件の下で、アラインメント動作を実行するので、非歌声区間の影響を極力排除した状態で、音素ネットワーク中の複数の音素と各時刻における優先音音響信号とを時間的に対応付けることができる。
技術概要	図１は、音楽音響信号と歌詞の時間的対応付けを自動で行うシステム１をコンピュータを用いて実現する場合に、コンピュータ内に実現される機能実現部の構成を示すブロックである。また図２は、図１の形態をプログラムをコンピュータで実行することにより実施する場合のステップを示すフローチャートである。このシステム１は、音楽音響信号記憶部３と、非摩擦音区間抽出部４と、優勢音音響信号抽出部５と、歌声区間推定用特徴量抽出部７と、歌声区間推定部９と、時間的対応付け用特徴量抽出部１１と、音素ネットワーク記憶部１３と、歌声用音響モデル１５を備えたアラインメント部１７とを備える。歌声区間推定用特徴量抽出部７は、各時刻における優勢音音響信号から歌声が含まれている歌声区間と歌声が含まれていない非歌声区間とを推定するために利用可能な歌声区間推定用特徴量を抽出する。１２次元の正規化対数倍音パワーと、１次元の基本周波数Ｆ０と、１次元の基本周波数Ｆ０の微分係数（ΔＦ０）をここで利用可能な歌声区間推定用特徴量として用いる。図３は歌声区間推定部の具体的な構成を示すブロック図である。図４は歌声区間推定部をプログラムにより実現する場合のフローチャートである。
イメージ図
実施実績	【無】
許諾実績	【無】
特許権譲渡	【否】
特許権実施許諾	【可】

登録者情報

登録者名称	国立研究開発法人産業技術総合研究所

その他の情報

関連特許

国内	【無】
国外	【無】

Copyright © 2023 INPIT