言語モデル生成装置、およびそのプログラム、ならびに音声認識装置

開放特許情報番号
L2019001823
開放特許情報登録日
2019/10/16
最新更新日
2019/10/16

基本情報

出願番号 特願2014-148223
出願日 2014/7/18
出願人 日本放送協会
公開番号 特開2016-024325
公開日 2016/2/8
登録番号 特許第6485941号
特許権者 日本放送協会
発明の名称 言語モデル生成装置、およびそのプログラム、ならびに音声認識装置
技術分野 情報・通信
機能 制御・ソフトウェア、機械・部品の製造
適用製品 言語モデル生成装置、およびそのプログラム、ならびに音声認識装置
目的 話題に適合した言語資源を用いて、表現のバリエーションにも対応でき、且つ精度の高い話題適応言語モデルを生成するための言語モデル生成装置やそのプログラム、その言語モデル生成装置を応用した音声認識装置を提供する。
効果 テキストデータを元にして、特定の話題に合う言語モデルを作成できる。また、同義語置換部がn単語連鎖に含まれる単語を置換するため、表現のバリエーションが広がる。つまり、比較的小規模な言語資源(入力されるテキストデータ)から、表現の揺れに対して強い言語モデルを生成することができる。また、頻度推定部が、置換後のn単語連鎖の出現頻度を推定するため、その推定結果に基づく言語モデルを生成することができる。
技術概要
単語と前記単語と置換可能な同義語との関係を記憶する置換テーブル記憶部と、
テキストデータから抽出されたn単語連鎖(nは正整数)に含まれる単語の同義語を前記置換テーブル記憶部から読み出し、前記n単語連鎖における当該単語を当該同義語で置換することにより新たなn単語連鎖を生成する同義語置換部と、
置換前の前記n単語連鎖の出現頻度に基づいて、前記置換後のn単語連鎖の出現頻度を推定する頻度推定部と、
前記テキストデータから抽出されたn単語連鎖の出現頻度、および前記頻度推定部によって推定された前記置換後のn単語連鎖の出現頻度を含んだ置換言語モデルを生成する置換言語モデル生成部と、
を具備し、
前記頻度推定部は、置換前の前記n単語連鎖の出現頻度と、置換前の前記n単語連鎖のうちの置換元単語を含むm単語連鎖(mは正整数であり、1≦m≦n)の出現確率と、置換後の前記新たなn単語連鎖のうちの前記m単語連鎖に対応する前記同義語を含む置換後のm単語連鎖の出現確率との比率と、に基づいて、前記置換後のn単語連鎖の出現頻度を推定する、
ことを特徴とする言語モデル生成装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2020 INPIT