| 出願番号 |
特願2023-043422 |
| 出願日 |
2023/3/17 |
| 出願人 |
国立大学法人 東京大学 |
| 公開番号 |
特開2024-132588 |
| 公開日 |
2024/10/1 |
| 発明の名称 |
音声合成装置、予測装置、音声合成システム、音声合成方法及びプログラム |
| 技術分野 |
情報・通信 |
| 機能 |
機械・部品の製造、制御・ソフトウェア、その他 |
| 適用製品 |
音声合成装置、予測装置、音声合成システム、音声合成方法及びプログラム |
| 目的 |
非流暢性を含む合成音声の人間らしさを向上可能な音声合成装置、予測装置、音声合成システム、音声合成方法及びプログラムを提供する。 |
| 効果 |
非流暢性を含む合成音声の人間らしさを向上できる。 |
技術概要
 |
フィラー部分を含む第1のテキストに関する情報を取得する取得部と、
前記第1のテキストに含まれる第1の言語部分に対応する音声と前記フィラー部分を含まない第2のテキストに含まれる第2の言語部分に対応する音声との一貫性が保証されるように学習される音声合成モデルに基づいて、前記第1のテキストに対応する音声を合成する音声合成部と、
を備える音声合成装置。 |
| 実施実績 |
【無】 |
| 許諾実績 |
【無】 |
| 特許権譲渡 |
【否】
|
| 特許権実施許諾 |
【可】
|