出願番号 |
特願2012-048231 |
出願日 |
2012/3/5 |
出願人 |
日本放送協会 |
公開番号 |
特開2013-182260 |
公開日 |
2013/9/12 |
登録番号 |
特許第5914054号 |
特許権者 |
日本放送協会 |
発明の名称 |
言語モデル作成装置、音声認識装置、およびそのプログラム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造、制御・ソフトウェア |
適用製品 |
言語モデル作成装置と、その言語モデルを用いた音声認識装置、プログラム |
目的 |
対象の話題に精度良く合致した言語モデルを自動的に作成することのできる言語モデル作成装置およびその言語モデルを利用した音声認識装置を提供する。 |
効果 |
各学習テキストに共通する言語要素(単語)や言語要素列(単語列)を、従来技術による方法よりも、一層効果的に表現した言語モデルを作成することができる。また、そのような言語モデルを用いて音声認識等の処理を行なうことができる。 |
技術概要
|
学習テキスト前処理部は、複数の学習テキストそれぞれについて、言語要素列ごとの出現頻度を表わす出現頻度情報を算出する。適応用テキスト前処理部は、目的の話題を表わす適応用テキストについて、言語要素列ごとの出現頻度を表わす適応用出現頻度情報を算出する。テキスト解析部は、学習テキストごとの出現頻度情報を因子分解して、複数の出現頻度情報基底を算出する。言語モデル構築部は、テキスト解析部が算出した複数の出現頻度情報基底のうちの少なくとも一を用いて、適応用テキスト前処理部が算出した適応用出現頻度情報との類似度に基づく適応後出現頻度情報を生成し、適応後出現頻度情報が表わす言語要素列ごとの出現頻度から言語モデルを構築する。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|