音声合成装置、予測装置、音声合成システム、音声合成方法及びプログラム

基本情報

出願番号	特願2023-043422
出願日	2023/3/17
出願人	国立大学法人　東京大学
公開番号	特開2024-132588
公開日	2024/10/1
発明の名称	音声合成装置、予測装置、音声合成システム、音声合成方法及びプログラム
技術分野	情報・通信
機能	機械・部品の製造、制御・ソフトウェア、その他
適用製品	音声合成装置、予測装置、音声合成システム、音声合成方法及びプログラム
目的	非流暢性を含む合成音声の人間らしさを向上可能な音声合成装置、予測装置、音声合成システム、音声合成方法及びプログラムを提供する。
効果	非流暢性を含む合成音声の人間らしさを向上できる。
技術概要	フィラー部分を含む第１のテキストに関する情報を取得する取得部と、前記第１のテキストに含まれる第１の言語部分に対応する音声と前記フィラー部分を含まない第２のテキストに含まれる第２の言語部分に対応する音声との一貫性が保証されるように学習される音声合成モデルに基づいて、前記第１のテキストに対応する音声を合成する音声合成部と、を備える音声合成装置。
実施実績	【無】
許諾実績	【無】
特許権譲渡	【否】
特許権実施許諾	【可】

登録者名称	国立大学法人東京大学