音声合成装置及びプログラム

開放特許情報番号
L2022001900
開放特許情報登録日
2022/11/25
最新更新日
2022/11/25

基本情報

出願番号 特願2018-118332
出願日 2018/6/21
出願人 日本放送協会、一般財団法人NHKエンジニアリングシステム
公開番号 特開2019-219590
公開日 2019/12/26
登録番号 特許第7133998号
特許権者 日本放送協会、一般財団法人NHKエンジニアリングシステム
発明の名称 音声合成装置及びプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 統計モデルを用いてテキストから音声信号を合成する音声合成装置及びプログラム
目的 テキストの読み上げ方を調整した合成音声信号を、高品質に生成可能な音声合成装置及びプログラムを提供する。
効果 テキストの読み上げ方を調整した合成音声信号を、高品質に生成することが可能となる。
技術概要
学習済みの学習モデル、並びに所定数の次元のデータからなる音響特徴量の標準化のために用いた学習時の平均値及び標準偏差を含む統計モデルと、
話速または時間長、パワー、ピッチ及び抑揚のそれぞれを示す調整パラメータに基づいて、統計モデルを調整する調整部と、
音声合成対象のテキストを言語分析し、言語特徴量を求める言語分析部と、
統計モデルを用いて、音響特徴量を推定する音響特徴量推定部と、
音声信号を合成し、音声合成対象のテキストに対応する音声信号を出力する音声生成部と、を備え、
調整部は、
学習時の平均値を調整し、
学習時の標準偏差を調整し、
音響特徴量推定部は、
言語特徴量に基づき、学習モデルを用いて、音響特徴量の標準化された所定数の次元のデータを推定し、所定数の次元のデータのそれぞれについて、学習時の平均値または前記調整部により学習時の平均値が調整された場合には調整時の平均値、及び学習時の標準偏差または調整部により学習時の標準偏差が調整された場合には調整時の標準偏差を用いて、データを逆標準化し、音響特徴量を求める、ことを特徴とする音声合成装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2022 INPIT