声質変換装置、声質変換方法及びプログラム

開放特許情報番号
L2024000018
開放特許情報登録日
2024/1/12
最新更新日
2024/1/12

基本情報

出願番号 特願2021-026128
出願日 2021/2/22
出願人 国立大学法人電気通信大学
公開番号 特開2022-127898
公開日 2022/9/1
発明の名称 声質変換装置、声質変換方法及びプログラム
技術分野 情報・通信
機能 機械・部品の製造
適用製品 声質変換装置及び声質変換方法、プログラム
目的 ノンパラレルで高品質な声質変換をリアルタイムで行うことができる声質変換装置、声質変換方法及びプログラムを提供する。
効果 声質変換を行う際のデコーダとエンコーダを、入力話者に合わせて適切に学習することができるので、リアルタイムで高品質な声質変換を行うことが可能になる。
技術概要
入力話者の音声データをエンコーダで量子化データに変換し、変換された前記量子化データをデコーダで音声データに変換する際の話者ラベルを、変換先話者の話者ラベルに差し替えることで、前記入力話者の音声を前記変換先話者の音声に声質変換する声質変換装置であって、
前記エンコーダにセットされるパラメータ及び前記デコーダにセットされるパラメータは、事前の学習によって、入力話者の音声データを前記エンコーダで変換した後、前記入力話者の話者ラベルで変換したデータと、入力話者の音声データを前記エンコーダで変換した後、前記入力話者との音声データの話者ラベルとは異なる別の話者ラベルで変換したデータとのそれぞれが、自然音声に近いか否かの識別結果から算出した損失関数に基づいてセットされたものである、
声質変換装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2024 INPIT