音響モデルの学習方法及びコンピュータプログラム

開放特許情報番号
L2019001786
開放特許情報登録日
2019/10/11
最新更新日
2019/10/11

基本情報

出願番号 特願2017-204873
出願日 2017/10/24
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2019-078857
公開日 2019/5/23
発明の名称 音響モデルの学習方法及びコンピュータプログラム
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 音声認識
目的 CTC等の手法による音響モデルの精度の、学習データ量に対する依存性を下げ、学習データ量が少量の場合における認識性能を向上させる。
効果 誤差逆伝播法に確率的勾配降下法等を利用してRNNの学習を行うことができる。
技術概要
コンピュータを用いた音響モデルの学習方法であって、
コンピュータが、音声認識に使用する音響特徴ベクトルの要素数と同数のノードを持つ入力層、識別対象となる音声単位の種類数と同数のノードを持つ出力層、並びに前記入力層及び前記出力層の間に配置された複数の隠れ層を含むRNNをコンピュータ上に構成するステップと、
コンピュータが、前記RNNのための学習データセットの記憶装置に接続するステップと、
前記RNNの動作を規定するパラメータを初期値に設定するステップと、
コンピュータが、前記記憶装置から読出した学習データセットを用い、前記パラメータに対する所定の損失関数LCTC+EPを最小化するように前記RNNの前記パラメータを最適化するステップとを含み、
前記損失関数LCTC+EPは、
前記学習データセット中の観測系列に対する正しいラベル系列の尤度が最大となるとき最小となるような第1の損失関数LCTCと、
前記学習データセット中の観測値に対するラベルの曖昧さに対する増加関数となるような第2の損失関数LEPと、
0<λ<1を満たす数値λとにより、
LCTC+EP=λLCTC+(1−λ)LEP
として定義される、学習方法。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2019 INPIT