音声認識結果整形モデル学習装置およびそのプログラム
- 開放特許情報番号
- L2023000635
- 開放特許情報登録日
- 2023/6/8
- 最新更新日
- 2023/6/8
基本情報
出願番号 | 特願2018-156926 |
---|---|
出願日 | 2018/8/24 |
出願人 | 日本放送協会 |
公開番号 | |
公開日 | 2020/2/27 |
登録番号 | |
特許権者 | 日本放送協会 |
発明の名称 | 音声認識結果整形モデル学習装置およびそのプログラム |
技術分野 | 情報・通信 |
機能 | 機械・部品の製造、制御・ソフトウェア |
適用製品 | 音声認識結果を整形するためのモデルを学習する音声認識結果整形モデル学習装置およびそのプログラム |
目的 | 規則を設けることなく、一文全体の情報を考慮することで記号(句読点等)の挿入や言い換えを含む編集を行って、音声認識結果を整形することが可能なニューラルネットワークのモデルを学習する音声認識結果整形モデル学習装置およびそのプログラムを提供する。 |
効果 | 音声またはその認識結果と、対応する整形文とを準備するだけで、特別な規則を設けることなく、音声認識結果を読みやすく整形するための文整形モデルを学習することができる。
また、認識結果に対応する正解として整形文を準備するため、音声認識の誤り傾向も学習することができ、音声認識精度を高めた文整形モデルを学習することができる。 |
技術概要 |
音声と前記音声に対する予め整形した整形文とを学習素材として用い、音声の認識結果を整形するためのニューラルネットワークの文整形モデルを学習する音声認識結果整形モデル学習装置であって、
前記学習素材の音声を発話区間ごとに認識する音声認識手段と、 前記発話区間ごとに前記音声認識手段の認識結果と前記整形文との間でマッチングを行い、対応する認識結果および整形文のペアを、学習用認識結果および学習用整形文として生成する学習データ生成手段と、 前記学習用認識結果に対する整形文の正解を前記学習用整形文として前記文整形モデルを学習する文整形モデル学習手段と、を備え、 前記学習データ生成手段は、 前記発話区間ごとに前記認識結果と前記整形文との間でマッチングを行い、対応する認識結果および整形文のペアを生成するとともに、当該ペアの類似の度合いを算出するマッチング手段と、 前記類似の度合いと予め定めた閾値とを比較し、前記類似の度合いが大きい前記認識結果および前記整形文のペアを、前記学習用認識結果および前記学習用整形文として選定する選定手段と、 を備えることを特徴とする音声認識結果整形モデル学習装置。 |
実施実績 | 【無】 |
許諾実績 | 【無】 |
特許権譲渡 | 【否】 |
特許権実施許諾 | 【可】 |
登録者情報
登録者名称 | |
---|---|
その他の情報
関連特許 |
|
---|