音声合成に用いる統計モデルを学習する学習装置及びプログラム

開放特許情報番号
L2022001909
開放特許情報登録日
2022/11/25
最新更新日
2022/11/25

基本情報

出願番号 特願2018-175221
出願日 2018/9/19
出願人 日本放送協会、一般財団法人NHKエンジニアリングシステム
公開番号 特開2020-046551
公開日 2020/3/26
登録番号 特許第7088796号
特許権者 日本放送協会、一般財団法人NHKエンジニアリングシステム
発明の名称 音声合成に用いる統計モデルを学習する学習装置及びプログラム
技術分野 情報・通信
機能 機械・部品の製造
適用製品 テキストから音声信号を合成するために用いる統計モデルを学習する学習装置及びプログラム
目的 ポーズに関する情報を含む言語特徴量の学習データを用いて学習を行う際に、安定的な品質の合成音声信号を得るための統計モデルを生成可能な学習装置及びプログラムを提供する。
効果 ポーズに関する情報を含む言語特徴量の学習データを用いて学習を行う際に、安定的な品質の合成音声信号を得るための統計モデルを生成することができる。
技術概要
音声コーパスのテキスト及び音声信号に基づいて、音声合成に用いる統計モデルを学習する学習装置において、
前記テキストを言語分析し、言語特徴量を求める言語分析部と、
前記テキストに対応する前記音声信号を音声分析し、音響特徴量を求める音声分析部と、
前記言語分析部により求めた前記言語特徴量及び前記音声分析部により求めた前記音響特徴量を時間的に対応付ける対応付け部と、
前記対応付け部により対応付けられた前記言語特徴量に含まれるポーズ長に関する情報を変更し、前記言語特徴量に対して、変更後の前記ポーズ長に関する情報を反映したポーズ変更後言語特徴量を生成すると共に、前記対応付け部により対応付けられた前記音響特徴量に対し、変更後の前記ポーズ長に関する情報を反映したポーズ変更後音響特徴量を生成するポーズ変更部と、
前記対応付け部により対応付けられた前記言語特徴量及び前記音響特徴量、並びに、前記ポーズ変更部により生成された前記ポーズ変更後言語特徴量及び前記ポーズ変更後音響特徴量を用いて、前記統計モデルを学習する学習部と、を備えたことを特徴とする学習装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2022 INPIT