音声波形生成システム、音声波形生成方法、および、音声波形生成プログラム
- 開放特許情報番号
- L2026000761
- 開放特許情報登録日
- 2026/4/21
- 最新更新日
- 2026/4/21
基本情報
| 出願番号 | 特願2024-133229 |
|---|---|
| 出願日 | 2024/8/8 |
| 出願人 | 国立研究開発法人情報通信研究機構 |
| 公開番号 | |
| 公開日 | 2026/2/20 |
| 発明の名称 | 音声波形生成システム、音声波形生成方法、および、音声波形生成プログラム |
| 技術分野 | 情報・通信 |
| 機能 | その他 |
| 適用製品 | 音声波形生成システム、音声波形生成方法、音声波形生成プログラム |
| 目的 | テキスト音声合成コーパスを用いて、テキスト音声合成および歌声合成が可能な構成を提供する。 |
| 効果 | テキスト音声合成コーパスを用いて、テキスト音声合成および歌声合成が可能な構成を実現できる。 |
技術概要![]() |
テキスト音声合成および歌声合成が可能な音声波形生成システムであって、
テキストを解析して音素系列を出力するテキスト解析部と、 前記音素系列から音響特徴量を推定する音響モデルと、 前記音響特徴量から音声波形を生成するニューラルボコーダとを備え、 前記音響モデルは、エンコーダと、バリアンスアダプタと、デコーダとを備え、 前記バリアンスアダプタは、音素継続長調節部と、エネルギー推定部と、基本周波数推定部と、音素継続長推定部とを備え、 前記歌声合成において、 入力楽譜に含まれる歌詞が前記テキスト解析部に入力され、 前記入力楽譜に含まれる音符情報に基づいて、各音素の音素継続長が決定され、 前記入力楽譜に含まれる音符情報に基づいて決定される各音素の基本周波数を所定のシフト周波数だけ減じた周波数が前記音響モデルでの処理に用いられ、 前記音響モデルが推定する音響特徴量に含まれる基本周波数に前記所定のシフト周波数を加えた周波数が前記ニューラルボコーダに出力される、音声波形生成システム。 |
| 実施実績 | 【無】 |
| 許諾実績 | 【無】 |
| 特許権譲渡 | 【否】 |
| 特許権実施許諾 | 【可】 |
登録者情報
| 登録者名称 | |
|---|---|
その他の情報
| 関連特許 |
|
|---|

