出願番号 |
特願2004-338234 |
出願日 |
2004/11/22 |
出願人 |
独立行政法人産業技術総合研究所 |
公開番号 |
特開2006-146008 |
公開日 |
2006/6/8 |
登録番号 |
特許第4604178号 |
特許権者 |
国立研究開発法人産業技術総合研究所 |
発明の名称 |
音声認識装置及び方法ならびにプログラム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造、制御・ソフトウェア |
適用製品 |
音声認識装置及びプログラム |
目的 |
音声認識による認識誤りを、ユーザがより効率的に且つ容易に訂正できる音声認識装置及び方法並びにプログラムを提供する。また、発話中あるいは発話終了後に正しい候補を選択するだけで訂正ができる音声認識装置及び方法並びにプログラムを提供する。さらに、ユーザが誤認識箇所を発見して指摘しなくても、常に単語の競合候補をリアルタイムに画面に表示して訂正の機会を確保することができる音声認識装置及び方法並びにプログラムを提供する。 |
効果 |
画面に表示された音声認識の結果として表示される単語列を見ながら、訂正の可否を決定する単語の近くに表示された1以上の競合単語から訂正単語を選ぶことにより、訂正を行うことができるので、短い時間で、訂正を行うことができる。したがって、音声認識処理と並行して、認識結果の訂正を行うことができる。 |
技術概要
 |
図1は、音声認識方法及びプログラムを実行する音声認識装置をコンピュータを用いて実現する場合にコンピュータ内に実現される機能実現手段を概略的に示したブロック図である。音声認識手段5は、音声認識実行手段11と連続音判定手段13とから構成されている。特に音声認識手段5の音声認識実行手段11は、予め定めた判定手法に従って、音声入力手段3から入力された音声に含まれる複数の単語を、データ記憶手段12内に設けた辞書手段に予め記憶されている複数の単語とそれぞれ比較し、競合候補の中から一番競合確率の高い単語を認識結果とする音声認識機能を有している(音声認識ステップ:プログラムの音声認識機能の実行)。ここで「予め定めた判定手法」としては、公知の各種の判定手法を用いることができる。コンフュージョン・ネットワークを用いて音声入力に基づく単語グラフを音響的なクラスタリングによりリニアな形式に圧縮した複数の単語の区間に分け、複数の単語の区間ごとに競合確率を求めて、一番競合確率の高い単語を決定する判定手法をこの予め定めた判定手法に採用している。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|