統計的音響モデルの適応方法、統計的音響モデルの適応に適した音響モデルの学習方法、ディープ・ニューラル・ネットワークを構築するためのパラメータを記憶した記憶媒体、及び統計的音響モデルの適応を行なうためのコンピュータプログラム

開放特許情報番号
L2016001011
開放特許情報登録日
2016/6/3
最新更新日
2016/6/3

基本情報

出願番号 特願2013-245098
出願日 2013/11/27
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2015-102806
公開日 2015/6/4
登録番号 特許第5777178号
特許権者 国立研究開発法人情報通信研究機構
発明の名称 統計的音響モデルの適応方法、統計的音響モデルの適応に適した音響モデルの学習方法、ディープ・ニューラル・ネットワークを構築するためのパラメータを記憶した記憶媒体、及び統計的音響モデルの適応を行なうためのコンピュータプログラム
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 音声認識等の認識技術に用いられるディープ・ニューラル・ネットワーク
目的 特定の条件の学習データを用いてDNNを用いた音響モデルの適応化を効率的に行なえ、精度も高められる統計的音響モデルの適応方法を提供する。
効果 学習を行なったDNN30を従来のHMM中のGMMに代えて用いることにより、特定の話者に適応した音響モデルが得られる。
各話者の発話データをランダムに選択しながら、一時に一人の話者の発話データに偏ることのない順番でDNN80の学習が行なえる。その結果、発話データの選択の順番による影響を最小限に抑えながら、DNN80の準備的学習が行なえる。
技術概要
DNNを用いた音響モデルの話者適応方法において、第1の記憶装置に、異なる話者の発話データ90〜98を別々に記憶するステップと、話者別の隠れ層モジュール112〜120を準備するステップと、発話データ90〜98を切替えて選択しながら、特定レイヤ110を、選択された発話データに対応する隠れ層モジュール112〜120で動的に置換しながらDNN80の全てのレイヤ42,44,110,48,50,52,54について準備的学習を行なうステップと、準備的学習が完了したDNNの特定レイヤ110を初期隠れ層で置換するステップと、初期隠れ層以外のレイヤのパラメータを固定して、特定話者の音声データでDNNの学習を行なうステップとを含む。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2017 INPIT