音声認識システム及び音声認識システム用プログラム

開放特許情報番号
L2008000943
開放特許情報登録日
2008/2/22
最新更新日
2015/9/18

基本情報

出願番号 特願2007-310695
出願日 2007/11/30
出願人 独立行政法人産業技術総合研究所
公開番号 特開2008-158510
公開日 2008/7/10
登録番号 特許第5366169号
特許権者 国立研究開発法人産業技術総合研究所
発明の名称 音声認識システム及び音声認識システム用プログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 音声認識システム及び音声認識システム用プログラム
目的 訂正結果を利用して、未知語を音声認識辞書に追加登録し、また既に音声認識辞書に登録されている単語の新たな発音を音声認識辞書に追加登録することを可能にして、音声認識の精度を高めることができる音声認識システム及び音声認識システム用プログラムを提供する。
効果 訂正の対象となった単語について、発音を定め、その単語が音声認識辞書に登録されていない未知語であれば、その単語と発音とを音声認識辞書に登録するため、訂正をすればするほど、音声認識辞書への未知語登録を増やすことができて、音声認識精度を上げることができる。
技術概要
図1は音声認識システムの構成を示すブロック図である。図2は図1の形態をコンピュータを用いて実現する場合に用いるソフトウェアのアルゴリズムを示すフローチャートである。音声認識システムでは、音素列変換手段13で得た音素列に含まれる各音素に対応する音声データ中の各音素単位の開始時刻と終了時刻を音素列に付加する。音素列中から、単語訂正手段9により訂正された単語の単語区間の開始時刻から終了時刻までに対応する区間内に存在する音素からなる音素列部分を音素列部分抽出手段15で抽出して発音と定める。追加登録手段17は、訂正後の単語が、音声認識辞書5に登録されていないことを判定すると、訂正後の単語と発音決定手段16が決定した発音とを組み合わせて新たな発音単語データとして音声認識辞書5に追加登録する。また訂正後の単語が、既登録単語であることを判定すると、既登録単語の別の発音として、発音決定手段16が決定した発音を追加登録する。図3は単語訂正手段で用いるインタフェースを示す図である。図4は発音のバリエーションの追加登録を説明するために用いる図である。
イメージ図
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

アピール情報

導入メリット 【改善】
改善効果1 訂正の対象となった単語が既登録の単語である場合には、その単語の新たな発音が音声認識辞書に登録されることになるため、訂正後の新たな音声認識では、再度同じ発音の音声が入力されたときには、正しく音声認識ができるようになり、訂正結果を音声認識辞書の高精度化に利用することができて、従来の音声認識技術と比べて、音声認識の精度を上げることができる。

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2023 INPIT