出願番号 |
特願2021-135430 |
出願日 |
2021/8/23 |
出願人 |
国立研究開発法人情報通信研究機構 |
公開番号 |
特開2023-030349 |
公開日 |
2023/3/8 |
発明の名称 |
オーディオデータ生成装置、オーディオデータ生成装置の敵対的学習方法、オーディオデータ生成装置の学習方法、および、音声合成処理システム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造 |
適用製品 |
オーディオデータ合成技術 |
目的 |
高速処理が可能なGPUを用いることなく、高品質なオーディオ生成処理(例えば、音声合成処理)を高速に実現するオーディオデータ生成装置を実現する。 |
効果 |
高速処理が可能なGPUを用いることなく、高品質なオーディオ生成処理(例えば、音声合成処理)を高速に実現するオーディオデータ生成装置を実現することができる。 |
技術概要
 |
学習可能な機能部を含み、メルスペクトログラムデータから、複数のストリームデータを取得するマルチストリーム生成部と、
前記複数のストリームデータのそれぞれに対してアップサンプリング処理を行うことで、アップサンプリングマルチストリームデータを取得するアップサンプリング部と、
畳み込み処理を決定するためのパラメータについて学習可能な畳み込み処理部であって、前記アップサンプリングマルチストリームデータに対して畳み込み処理を実行することで、オーディオ波形データを取得する前記畳み込み処理部と、
を備えるオーディオデータ生成装置。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|