出願番号 |
特願2015-104336 |
出願日 |
2015/5/22 |
出願人 |
国立研究開発法人情報通信研究機構 |
公開番号 |
特開2016-218309 |
公開日 |
2016/12/22 |
登録番号 |
特許第6614639号 |
特許権者 |
国立研究開発法人情報通信研究機構 |
発明の名称 |
音声認識装置及びコンピュータプログラム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造、制御・ソフトウェア |
適用製品 |
音声認識装置及びそのコンピュータプログラム |
目的 |
ニューラルネットワークの特性を活かして、認識精度を高めることができる音声認識装置を提供する。 |
効果 |
実施の形態は、DNN―HMMハイブリッド方式に代えて、RNNを用いた直接デコード方式の音声認識装置に関するものである。実験結果によれば、直接デコード方式の音声認識手法の方が、DNN―HMMハイブリッド方式よりも小さな構成で同等以上の性能を示すことがわかった。 |
技術概要
 |
音声認識装置は、音声信号から得られた所定の音声特徴量からなる観測系列が与えられたときの状態系列の事後確率を状態系列ごとに算出するRNN(リカレント型ニューラルネットワーク)による音響モデル308と、状態系列が与えられたときの単語列の事後確率を各単語列について算出するS−1HCLGによるWFST320と、入力観測系列について音響モデル308及びWFST320がそれぞれ算出する事後確率を用いて、音声信号に対応する単語列の仮説ごとに算出されたスコアに基づいて、音声信号に対する音声認識を行うための仮説選択部322とを含む。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|