音素認識辞書生成装置および音素認識装置ならびにそれらのプログラム

開放特許情報番号
L2022000287
開放特許情報登録日
2022/2/15
最新更新日
2022/2/15

基本情報

出願番号 特願2017-126929
出願日 2017/6/29
出願人 日本放送協会
公開番号 特開2019-012095
公開日 2019/1/24
登録番号 特許第6876543号
特許権者 日本放送協会
発明の名称 音素認識辞書生成装置および音素認識装置ならびにそれらのプログラム
技術分野 情報・通信
機能 機械・部品の製造
適用製品 音素認識辞書生成装置およびそのプログラム、ならびに、音素認識装置およびそのプログラム
目的 音素認識の精度を高める音素認識辞書(音素発音辞書および音素言語モデル)を生成する音素認識辞書生成装置およびそのプログラム、ならびに、音素発音辞書および音素言語モデルを用いた音素認識装置およびそのプログラムを提供する。
効果 音素発音辞書および音素言語モデルを用いることで、音素認識する際の音素の連結確率を、単に音素の前後の依存性だけではなく、音素の単語内および単語間における依存性も加味して算出することが可能になり、音声から音素を認識する際の認識精度を高めることができる。
技術概要
音響モデルと発音辞書と学習コーパスとを用いて、音素認識に用いる音素発音辞書および音素言語モデルを生成する音素認識辞書生成装置であって、
前記学習コーパスの音声を、前記音響モデルと前記発音辞書とに基づいて音声認識し、前記発音辞書に登録されている見出し語に対応する単語ごとの音素列である単語別音素列を生成する単語別音素列生成手段と、
前記単語別音素列を1単語のテキストデータ形式に変換して音素列単語を生成する音素列単語生成手段と、
前記音素列単語を見出し語とし、当該音素列単語に対応する前記単語別音素列を発音表記とすることで、前記音素発音辞書を生成する音素発音辞書生成手段と、
前記音素列単語生成手段で生成される前記音素列単語のリストから前記音素列単語の連鎖としてN−gram言語モデルを学習することにより、前記音素言語モデルを生成する音素言語モデル生成手段と、
を備えることを特徴とする音素認識辞書生成装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2024 INPIT