出願番号 |
特願2007-310695 |
出願日 |
2007/11/30 |
出願人 |
独立行政法人産業技術総合研究所 |
公開番号 |
特開2008-158510 |
公開日 |
2008/7/10 |
登録番号 |
特許第5366169号 |
特許権者 |
国立研究開発法人産業技術総合研究所 |
発明の名称 |
音声認識システム及び音声認識システム用プログラム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造、制御・ソフトウェア |
適用製品 |
音声認識システム及び音声認識システム用プログラム |
目的 |
訂正結果を利用して、未知語を音声認識辞書に追加登録し、また既に音声認識辞書に登録されている単語の新たな発音を音声認識辞書に追加登録することを可能にして、音声認識の精度を高めることができる音声認識システム及び音声認識システム用プログラムを提供する。 |
効果 |
訂正の対象となった単語について、発音を定め、その単語が音声認識辞書に登録されていない未知語であれば、その単語と発音とを音声認識辞書に登録するため、訂正をすればするほど、音声認識辞書への未知語登録を増やすことができて、音声認識精度を上げることができる。 |
技術概要
 |
図1は音声認識システムの構成を示すブロック図である。図2は図1の形態をコンピュータを用いて実現する場合に用いるソフトウェアのアルゴリズムを示すフローチャートである。音声認識システムでは、音素列変換手段13で得た音素列に含まれる各音素に対応する音声データ中の各音素単位の開始時刻と終了時刻を音素列に付加する。音素列中から、単語訂正手段9により訂正された単語の単語区間の開始時刻から終了時刻までに対応する区間内に存在する音素からなる音素列部分を音素列部分抽出手段15で抽出して発音と定める。追加登録手段17は、訂正後の単語が、音声認識辞書5に登録されていないことを判定すると、訂正後の単語と発音決定手段16が決定した発音とを組み合わせて新たな発音単語データとして音声認識辞書5に追加登録する。また訂正後の単語が、既登録単語であることを判定すると、既登録単語の別の発音として、発音決定手段16が決定した発音を追加登録する。図3は単語訂正手段で用いるインタフェースを示す図である。図4は発音のバリエーションの追加登録を説明するために用いる図である。 |
イメージ図 |
|
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|