音声合成処理装置、音声合成処理方法、および、プログラム

開放特許情報番号
L2021000487
開放特許情報登録日
2021/4/16
最新更新日
2024/3/27

基本情報

出願番号 特願2019-200440
出願日 2019/11/5
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2021-012351
公開日 2021/2/4
登録番号 特許第7432199号
特許権者 国立研究開発法人情報通信研究機構
発明の名称 音声合成処理装置、音声合成処理方法、および、プログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 音声合成処理技術
目的 日本語等の英語以外の言語を処理対象言語とする場合においても、学習・最適化を行い、高品質な音声合成処理を実現する音声合成処理装置、音声合成処理方法、および、プログラムを実現する。
効果 日本語等の英語以外の言語を処理対象言語とする場合においても、学習・最適化を行い、高品質な音声合成処理を実現する音声合成処理装置、音声合成処理方法、および、プログラムを実現することができる。
技術概要
任意の言語を処理対象言語とし、エンコーダ・デコーダ方式のニューラルネットワークを用いて音声合成処理を実行する音声合成処理装置であって、
前記処理対象言語のテキストデータに対してテキスト解析処理を実行し、コンテキストラベルデータを取得するテキスト解析部と、
前記テキスト解析部により取得された前記コンテキストラベルデータから、コンテキストラベルデータを取得する処理において処理対象とされた音素である単独音素についてのコンテキストラベルを取得することで、前記ニューラルネットワークの学習処理に適した最適化フルコンテキストラベルデータを取得するフルコンテキストラベルベクトル処理部と、
前記最適化フルコンテキストラベルデータに基づいて、ニューラルネットワークのエンコード処理を実行することで、隠れ状態データを取得するエンコーダ部と、
前記隠れ状態データに基づいて、ニューラルネットワークのデコード処理を実行することで、前記最適化フルコンテキストラベルデータに対応する音響特徴量データを取得するデコーダ部と、
前記デコーダ部により取得された音響特徴量から音声波形データを取得するボコーダと、
を備える音声合成処理装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

アピール情報

アピール内容 国立研究開発法人情報通信研究機構(NICT)では、みなさまに
ご活用いただきたい成果(シーズ)を、以下に公開しています。
製品化や技術移転など、お気軽にご相談ください。

https://www2.nict.go.jp/oihq/seeds/

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2024 INPIT