出願番号 |
特願2016-197107 |
出願日 |
2016/10/5 |
出願人 |
国立研究開発法人情報通信研究機構 |
公開番号 |
特開2018-060047 |
公開日 |
2018/4/12 |
発明の名称 |
音響モデルの学習装置及びそのためのコンピュータプログラム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造、制御・ソフトウェア |
適用製品 |
音響モデルを高精度化するための学習装置 |
目的 |
NNの特性を活かした音響モデルにおいて、音声認識精度を高めることができる音響モデルの学習装置を提供すること。 |
効果 |
NNの特性を活かした音響モデルにおいて、音声認識精度を高めることができる。 |
技術概要
 |
音声の観測系列が与えられたときに、当該観測系列が任意のサブワード列である確率を算出するための、End-to-End型ニューラルネットワークに基づく音響モデルの学習を行う音響モデルの学習装置であって、
前記音響モデルの学習装置は、学習音声の観測系列と当該学習音声に対応する正解サブワード列との、アライメント済の組からなる学習データ、及び、単語列の出現頻度を記憶した単語モデルを記憶する、コンピュータ読取り可能な記憶手段に接続して用いられ、
前記学習音声の前記観測系列が与えられたときの、前記学習データの正解サブワード列の事後確率の前記学習データの全体に亘る和が最大となるように前記End-to-End型ニューラルネットワークを最適化する第1の最適化手段と、
学習音声の観測系列が与えられたときに、前記前記End-to-End型ニューラルネットワークと前記言語モデルとを用いて推定した単語列の仮説の精度の期待値が最大となるように、前記第1の最適化手段により最適化された前記End-to-End型ニューラルネットワークをさらに最適化する第2の最適化手段とを含む、音響モデルの学習装置。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|