オーディオデータ生成装置、オーディオデータ生成装置の敵対的学習方法、オーディオデータ生成装置の学習方法、および、音声合成処理システム

開放特許情報番号
L2023000319
開放特許情報登録日
2023/4/19
最新更新日
2023/4/19

基本情報

出願番号 特願2021-135430
出願日 2021/8/23
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2023-030349
公開日 2023/3/8
発明の名称 オーディオデータ生成装置、オーディオデータ生成装置の敵対的学習方法、オーディオデータ生成装置の学習方法、および、音声合成処理システム
技術分野 情報・通信
機能 機械・部品の製造
適用製品 オーディオデータ合成技術
目的 高速処理が可能なGPUを用いることなく、高品質なオーディオ生成処理(例えば、音声合成処理)を高速に実現するオーディオデータ生成装置を実現する。
効果 高速処理が可能なGPUを用いることなく、高品質なオーディオ生成処理(例えば、音声合成処理)を高速に実現するオーディオデータ生成装置を実現することができる。
技術概要
学習可能な機能部を含み、メルスペクトログラムデータから、複数のストリームデータを取得するマルチストリーム生成部と、
前記複数のストリームデータのそれぞれに対してアップサンプリング処理を行うことで、アップサンプリングマルチストリームデータを取得するアップサンプリング部と、
畳み込み処理を決定するためのパラメータについて学習可能な畳み込み処理部であって、前記アップサンプリングマルチストリームデータに対して畳み込み処理を実行することで、オーディオ波形データを取得する前記畳み込み処理部と、
を備えるオーディオデータ生成装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2022 INPIT