オーディオデータ生成装置、オーディオデータ生成装置の敵対的学習方法、オーディオデータ生成装置の学習方法、および、音声合成処理システム

公開公報を見る登録公報を見る経過情報を見る

開放特許情報番号：L2023000319 開放特許情報登録日：2023/4/19 最新更新日：2026/5/28

基本情報

出願番号

特願2021-135430

公開番号

特開2023-030349

登録番号

特許第7849833号

出願日

2021/8/23

公開日

2023/3/8

出願人

国立研究開発法人情報通信研究機構

特許権者

国立研究開発法人情報通信研究機構

権利化状況

権利化済

発明の名称

オーディオデータ生成装置、オーディオデータ生成装置の敵対的学習方法、オーディオデータ生成装置の学習方法、および、音声合成処理システム

開放特許情報

技術分野

情報・通信

機能

機械・部品の製造

適用製品

オーディオデータ合成技術

目的

高速処理が可能なＧＰＵを用いることなく、高品質なオーディオ生成処理（例えば、音声合成処理）を高速に実現するオーディオデータ生成装置を実現する。

効果

高速処理が可能なＧＰＵを用いることなく、高品質なオーディオ生成処理（例えば、音声合成処理）を高速に実現するオーディオデータ生成装置を実現することができる。

技術概要

学習可能な機能部を含み、メルスペクトログラムデータから、複数のストリームデータを取得するマルチストリーム生成部と、
前記複数のストリームデータのそれぞれに対してアップサンプリング処理を行うことで、アップサンプリングマルチストリームデータを取得するアップサンプリング部と、
畳み込み処理を決定するためのパラメータについて学習可能な畳み込み処理部であって、前記アップサンプリングマルチストリームデータに対して畳み込み処理を実行することで、オーディオ波形データを取得する前記畳み込み処理部と、
を備えるオーディオデータ生成装置。

イメージ図

実施実績　　　：

無

許諾実績　：

無

特許権譲渡　　：

否

特許権実施許諾：

可

登録者情報

登録者名称

国立研究開発法人情報通信研究機構

その他の情報