出願番号 |
特願2013-245098 |
出願日 |
2013/11/27 |
出願人 |
国立研究開発法人情報通信研究機構 |
公開番号 |
特開2015-102806 |
公開日 |
2015/6/4 |
登録番号 |
特許第5777178号 |
特許権者 |
国立研究開発法人情報通信研究機構 |
発明の名称 |
統計的音響モデルの適応方法、統計的音響モデルの適応に適した音響モデルの学習方法、ディープ・ニューラル・ネットワークを構築するためのパラメータを記憶した記憶媒体、及び統計的音響モデルの適応を行なうためのコンピュータプログラム |
技術分野 |
情報・通信 |
機能 |
制御・ソフトウェア |
適用製品 |
音声認識等の認識技術に用いられるディープ・ニューラル・ネットワーク |
目的 |
特定の条件の学習データを用いてDNNを用いた音響モデルの適応化を効率的に行なえ、精度も高められる統計的音響モデルの適応方法を提供する。 |
効果 |
学習を行なったDNN30を従来のHMM中のGMMに代えて用いることにより、特定の話者に適応した音響モデルが得られる。
各話者の発話データをランダムに選択しながら、一時に一人の話者の発話データに偏ることのない順番でDNN80の学習が行なえる。その結果、発話データの選択の順番による影響を最小限に抑えながら、DNN80の準備的学習が行なえる。 |
技術概要
 |
DNNを用いた音響モデルの話者適応方法において、第1の記憶装置に、異なる話者の発話データ90〜98を別々に記憶するステップと、話者別の隠れ層モジュール112〜120を準備するステップと、発話データ90〜98を切替えて選択しながら、特定レイヤ110を、選択された発話データに対応する隠れ層モジュール112〜120で動的に置換しながらDNN80の全てのレイヤ42,44,110,48,50,52,54について準備的学習を行なうステップと、準備的学習が完了したDNNの特定レイヤ110を初期隠れ層で置換するステップと、初期隠れ層以外のレイヤのパラメータを固定して、特定話者の音声データでDNNの学習を行なうステップとを含む。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|