オーディオデータ生成装置、オーディオデータ生成装置の敵対的学習方法、オーディオデータ生成装置の学習方法、および、音声合成処理システム

開放特許情報番号:L2023000319 開放特許情報登録日:2023/4/19 最新更新日:2026/5/28

基本情報
出願番号
公開番号
登録番号
出願日
2021/8/23
公開日
2023/3/8
出願人
国立研究開発法人情報通信研究機構
特許権者
国立研究開発法人情報通信研究機構
権利化状況
権利化済
発明の名称
オーディオデータ生成装置、オーディオデータ生成装置の敵対的学習方法、オーディオデータ生成装置の学習方法、および、音声合成処理システム
開放特許情報
技術分野
情報・通信
機能
機械・部品の製造
適用製品
オーディオデータ合成技術
目的
高速処理が可能なGPUを用いることなく、高品質なオーディオ生成処理(例えば、音声合成処理)を高速に実現するオーディオデータ生成装置を実現する。
効果
高速処理が可能なGPUを用いることなく、高品質なオーディオ生成処理(例えば、音声合成処理)を高速に実現するオーディオデータ生成装置を実現することができる。
技術概要
学習可能な機能部を含み、メルスペクトログラムデータから、複数のストリームデータを取得するマルチストリーム生成部と、
前記複数のストリームデータのそれぞれに対してアップサンプリング処理を行うことで、アップサンプリングマルチストリームデータを取得するアップサンプリング部と、
畳み込み処理を決定するためのパラメータについて学習可能な畳み込み処理部であって、前記アップサンプリングマルチストリームデータに対して畳み込み処理を実行することで、オーディオ波形データを取得する前記畳み込み処理部と、
を備えるオーディオデータ生成装置。
イメージ図
実施実績   :
許諾実績 :
特許権譲渡  :
特許権実施許諾:
登録者情報
その他の情報
関連特許
(国内):
(国外):
固定URLをクリップボードにコピーしました。
Copyright © INPIT Rights Reserved