音声波形生成システム、音声波形生成方法、および、音声波形生成プログラム

開放特許情報番号
L2025001244
開放特許情報登録日
2025/10/30
最新更新日
2025/10/30

基本情報

出願番号 特願2024-002076
出願日 2024/1/10
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2025-108262
公開日 2025/7/23
発明の名称 音声波形生成システム、音声波形生成方法、および、音声波形生成プログラム
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 音声波形生成システム、音声波形生成方法、および、音声波形生成プログラム
目的 音声波形生成をより高速化するとともに、品質をより改善することができる系列変換型End−to−endモデルを提供する。
効果 音声波形生成をより高速化するとともに、品質をより改善することができる系列変換型End−to−endモデルが提供される。
技術概要
入力される第1の特徴量から第2の特徴量を予測する音響モデルと、
前記第2の特徴量から音声波形を予測する波形生成モデルとを備え、
前記音響モデルは、前記第1の特徴量を連続表現に変換するためのエンコーダと、前記連続表現から各音素の継続長を予測するバリアンスアダプタと、前記バリアンスアダプタの出力から前記第2の特徴量を予測するデコーダとを含み、
前記エンコーダおよび前記デコーダの各々は、深さ単位畳み込み層と、層正規化ブロックと、点単位畳み込み層と、ガウス誤差線形ユニットとを含む、音声波形生成システム。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2025 INPIT