音声認識装置及びコンピュータプログラム

開放特許情報番号
L2017000775
開放特許情報登録日
2017/5/18
最新更新日
2017/5/18

基本情報

出願番号 特願2015-104336
出願日 2015/5/22
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2016-218309
公開日 2016/12/22
発明の名称 音声認識装置及びコンピュータプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 音声認識装置及びそのコンピュータプログラム
目的 ニューラルネットワークの特性を活かして、認識精度を高めることができる音声認識装置を提供する。
効果 実施の形態は、DNN―HMMハイブリッド方式に代えて、RNNを用いた直接デコード方式の音声認識装置に関するものである。実験結果によれば、直接デコード方式の音声認識手法の方が、DNN―HMMハイブリッド方式よりも小さな構成で同等以上の性能を示すことがわかった。
技術概要
音声認識装置は、音声信号から得られた所定の音声特徴量からなる観測系列が与えられたときの状態系列の事後確率を状態系列ごとに算出するRNN(リカレント型ニューラルネットワーク)による音響モデル308と、状態系列が与えられたときの単語列の事後確率を各単語列について算出するS−1HCLGによるWFST320と、入力観測系列について音響モデル308及びWFST320がそれぞれ算出する事後確率を用いて、音声信号に対応する単語列の仮説ごとに算出されたスコアに基づいて、音声信号に対する音声認識を行うための仮説選択部322とを含む。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2017 INPIT