目的
高速処理が可能なGPUを用いることなく、高品質なオーディオ生成処理(例えば、音声合成処理)を高速に実現するオーディオデータ生成装置を実現する。
効果
高速処理が可能なGPUを用いることなく、高品質なオーディオ生成処理(例えば、音声合成処理)を高速に実現するオーディオデータ生成装置を実現することができる。
技術概要
学習可能な機能部を含み、メルスペクトログラムデータから、複数のストリームデータを取得するマルチストリーム生成部と、
前記複数のストリームデータのそれぞれに対してアップサンプリング処理を行うことで、アップサンプリングマルチストリームデータを取得するアップサンプリング部と、
畳み込み処理を決定するためのパラメータについて学習可能な畳み込み処理部であって、前記アップサンプリングマルチストリームデータに対して畳み込み処理を実行することで、オーディオ波形データを取得する前記畳み込み処理部と、
を備えるオーディオデータ生成装置。