連続音声認識装置および記録媒体

開放特許情報番号
L2007000040
開放特許情報登録日
2007/1/12
最新更新日
2009/7/10

基本情報

出願番号 特願平11-269457
出願日 1999/9/22
出願人 日本放送協会
公開番号 特開2001-092496
公開日 2001/4/6
登録番号 特許第3834169号
特許権者 日本放送協会
発明の名称 連続音声認識装置および記録媒体
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 連続音声認識装置および記録媒体
目的 マルチパスの音声認識装置において、音声が入力されてから音声認識結果を出力するまでのタイムラグを短縮することが可能な連続音声認識装置および記録媒体を提供する。
効果 逐次的に2パス処理を実行して得られる最も高い確からしさを有する単語列の中の安定部分を検出して、部分的な音声認識結果とするので、連続音声を入力しながら、その音声認識結果を逐次的に確定することができる。また、これによりたとえば、テレビニュースの音声を音声認識して自動的に字幕を作成する場合でも音声の認識精度を保ちつつ、音声からの字幕の遅れ時間を最小に抑えることができる。
技術概要
入力した連続音声を第1パス処理部で確率的言語モデルの簡易モデルを使用して単語列に関する複数の音声認識候補を取得し、第2パス処理部で複数の音声認識候補について、確率的言語モデルの詳細モデルを使用して、音声認識結果を確定する連続音声認識装置において、第1パス処理部は一定時間間隔で、入力開始時点からの連続音声について複数の音声認識候補の単語列を取得し、第2パス処理部は、一定時間間隔ごとに取得される複数の音声認識候補の単語列について確率的言語モデルの詳細モデルを使用して、最も高い確からしさを有する単語列を選択する単語列選択手段と、一定間隔で検出された単語列の中の安定部分を検出し、検出した安定部分の単語列を音声認識結果として逐次的に確定する音声認識結果確定手段とを具えた連続音声認識装置である。図1は連続音声認識装置の機能構成を示す。図2は処理内容を示す説明図、図3はハードウェアの構成を示すブロック図、図4はCPUが実行する処理内容を示すフローチャートである。
イメージ図
実施実績 【無】   
許諾実績 【有】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2017 INPIT