音声波形生成システム、音声波形生成方法、および、音声波形生成プログラム

開放特許情報番号
L2026000762
開放特許情報登録日
2026/4/21
最新更新日
2026/4/21

基本情報

出願番号 特願2024-133228
出願日 2024/8/8
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2026-030320
公開日 2026/2/20
発明の名称 音声波形生成システム、音声波形生成方法、および、音声波形生成プログラム
技術分野 情報・通信
機能 その他
適用製品 音声波形生成システム、音声波形生成方法、音声波形生成プログラム
目的 単語やフレーズを高品質に音声引き伸ばしできるモデルを提供する。
効果 単語やフレーズを高品質に音声引き伸ばしできるモデルを提供する。
技術概要
音素シーケンスをベクトル空間に順次配置して音素埋め込みを生成する埋め込み層と、
前記音素埋め込みから音響特徴量を生成する音響モデルと、
前記音響特徴量から音声波形を生成する波形生成モデルとを備え、
前記音響モデルは、前記音素埋め込みを連続表現に変換するエンコーダと、前記連続表現から各音素の継続長を予測するバリアンスアダプタと、前記バリアンスアダプタの出力から前記音響特徴量を予測するデコーダとを含み、
前記音素埋め込みに基づく特徴量を前記エンコーダより後段に加算するためのスキップコネクションをさらに備える、音声波形生成システム。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2026 INPIT