声質変換処理システム、および、声質変換処理方法

開放特許情報番号
L2024001911
開放特許情報登録日
2024/10/24
最新更新日
2024/10/24

基本情報

出願番号 特願2023-025134
出願日 2023/2/21
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2024-118704
公開日 2024/9/2
発明の名称 声質変換処理システム、および、声質変換処理方法
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 声質変換技術
目的 入力音声と出力音声との間のアライメントを安定して推定でき、かつ、GPUを用いることなく、CPUのみで、高精度、高品質な声質変換処理を実行する声質変換処理システム、声質変換処理方法を実現する。
効果 入力音声と出力音声との間のアライメントを安定して推定でき、かつ、GPUを用いることなく、CPUのみで、高精度、高品質な声質変換処理を実行する声質変換処理システム、声質変換処理方法を実現することができる。
技術概要
入力話者の音声波形データを声質変換した音声波形データに変換する声質変換処理システムであって、
前記入力話者の音声波形データに対応するメルスペクトログラムまたは線形スペクトログラムである入力データに対してエンコード処理を行うことで、潜在変数取得用統計データを取得するエンコード処理部と、
前記入力データに対して、継続長予測処理を行うことで、継続長データを取得する継続長予測処理部と、
前記潜在変数取得用統計データと前記継続長データから、継続長を考慮した中間特徴量データである継続長考慮中間特徴量データを取得するアライメント処理部と、
前記継続長考慮中間特徴量データに対してデコード処理を行うことで、潜在変数データを取得するデコード処理部と、
前記潜在変数データに対して、音声波形データ取得処理を行うことで、声質変換された音声波形データを取得する音声波形データ取得処理部と、
を備える声質変換処理システム。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2024 INPIT