音声合成用の隠れマルコフモデル学習装置及び音声合成装置

開放特許情報番号
L2013002166
開放特許情報登録日
2013/10/23
最新更新日
2015/12/4

基本情報

出願番号 特願2011-194907
出願日 2011/9/7
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2013-057735
公開日 2013/3/28
登録番号 特許第5717097号
特許権者 国立研究開発法人情報通信研究機構
発明の名称 音声合成用の隠れマルコフモデル学習装置及び音声合成装置
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 音声合成技術
目的 HMMを用いる音声合成装置であって,合成音声波形にひずみが生じることを抑えることが可能な音声合成装置,及びそのためのHMM学習装置を提供する。
効果 音声パラメータを時間及び周波数領域の双方で量子化するための基本的枠組が得られ,双方の領域で音声パラメータを処理することが可能になる。
音声パラメータを効率的に統計的分類及び平均化するための手段が得られる。
デュアルサンプリングの効用によって時間領域での群遅延を可能にするための簡便な手段が得られる。
技術概要
各々に音素ラベルが付された複数の音声単位を含む音声データベースを記憶するための音声データベース記憶手段と,
前記複数の音声単位の各々から基本周波数を抽出し,基本周波数情報を出力するための基本周波数抽出手段と,
前記複数の音声単位の各々について,所定の音響特徴量を算出するための音響特徴量算出手段と,
前記所定の音響特徴量の算出のための時間領域のサンプリングと双対をなす,周波数領域のサンプリングを行なうことにより,前記複数の音声単位の各々について,前記所定の音響特徴量を角度量に変換するための変換手段と,
前記音声データベースに含まれる前記複数の音声単位について,前記基本周波数抽出手段の出力する基本周波数情報,及び,前記変換手段の出力する前記角度量に,当該音声単位のラベルが付された学習用データを用い,別々の音素コンテキストに対する隠れマルコフモデルの学習と,音素ラベル列から前記隠れマルコフモデルのいずれかを選択するための決定木の学習とを行なうための学習手段と,
前記学習手段により学習が行なわれた前記隠れマルコフモデルと前記決定木とを記憶するための記憶手段とを含む,音声合成用の隠れマルコフモデルの学習装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2017 INPIT