声質変換装置、声質変換方法およびプログラム
- 開放特許情報番号
- L2024000516
- 開放特許情報登録日
- 2024/3/15
- 最新更新日
- 2024/3/15
基本情報
出願番号 | 特願2019-503021 |
---|---|
出願日 | 2018/2/27 |
出願人 | 国立大学法人電気通信大学 |
公開番号 | |
公開日 | 2018/9/7 |
登録番号 | |
特許権者 | 国立大学法人電気通信大学 |
発明の名称 | 声質変換装置、声質変換方法およびプログラム |
技術分野 | 情報・通信 |
機能 | 機械・部品の製造、制御・ソフトウェア |
適用製品 | 声質変換装置、声質変換方法およびプログラム |
目的 | 各話者の発話について少ないデータ数で簡単に声質変換が可能な声質変換装置、声質変換方法およびプログラムを提供する。 |
効果 | 話者情報から話者クラスタを取得して、その話者クラスタを使って確率モデルを得るようにしたので、従来よりも非常に少ないデータ数で、入力話者音声を目標話者音声に声質変換できるようになる。 |
技術概要 |
入力話者の音声を目標話者の音声に声質変換する声質変換装置であって、
学習用の音声に基づく音声情報およびその音声情報に対応する話者情報から、声質変換のためのパラメータを決定するパラメータ学習ユニットと、 前記パラメータ学習ユニットが決定したパラメータを記憶するパラメータ記憶ユニットと、 前記パラメータ記憶ユニットが記憶したパラメータと前記目標話者の話者情報とに基づいて、前記入力話者の音声に基づく前記音声情報の声質変換処理を行う声質変換処理ユニットとを備え、 前記パラメータ学習ユニットは、音声に基づく音声情報、音声情報に対応する話者情報および音声中の音韻を表す音韻情報のそれぞれを変数とすることで、前記音声情報、前記話者情報および前記音韻情報のそれぞれの間の結合エネルギーの関係性を前記パラメータによって表す確率モデルを取得し、前記確率モデルとして、固有の適応行列を持つ複数個の話者クラスタを定義するようにし、 前記声質変換処理ユニットは、前記パラメータから前記目標話者の話者情報を得、得られた話者情報から前記目標話者の音声情報を得るようにした 声質変換装置。 |
実施実績 | 【無】 |
許諾実績 | 【無】 |
特許権譲渡 | 【否】 |
特許権実施許諾 | 【可】 |
登録者情報
登録者名称 | |
---|---|
その他の情報
関連特許 |
|
---|