ページの本文に

ウインドウを閉じる

音響モデルの話者適応装置及びそのためのコンピュータプログラム

開放特許情報番号: L2011002113

開放特許情報登録日: 2011/4/22

最新更新日: 2023/1/17

基本情報

出願番号	特願2009-196757
出願日	2009/8/27
出願人	独立行政法人情報通信研究機構
公開番号	特開2011-048163
公開日	2011/3/10
登録番号	特許第5288378号
特許権者	国立研究開発法人情報通信研究機構
発明の名称	音響モデルの話者適応装置及びそのためのコンピュータプログラム
技術分野	情報・通信、電気・電子
機能	機械・部品の製造、制御・ソフトウェア
適用製品	音響モデルの話者適応装置及びそのためのコンピュータプログラム
目的	高い汎化能力を持ち、少ない適応データで話者独立な音響モデルを適応化させることが可能な話者適応装置及びそのためのコンピュータプログラムを提供する。また、高い汎化能力を持ち、少ない適応データで話者独立な音響モデルを適応化させるための線形回帰行列を求めることが可能な話者適応装置及びそのためのコンピュータプログラムを提供する。
効果	ＳＭＥＬＲを用いて変換行列を推定することにより、比較的少ない適応データを用いて、話者独立な音響モデルから精度高く話者適応音響モデルを推定できる。さらに、話者独立な音響モデルとの間でインターポレーションを行なうことで、適応発話数が４０より小さい場合でも、最適な重みを使用することにより話者独立な音響モデル又はＳＭＬＥＲによる音響モデルのいずれかを単独で用いた場合よりも高い単語認識精度を得ることができる。
技術概要	図１は話者適応装置を実現するためのプログラムのメインルーチンの制御構造を示すフローチャート、図２は図１に制御構造を示すプログラムにおいて、フレームセレクション処理を実現するプログラムの制御構造を示すフローチャート、である。話者適応装置は、話者適応のための変換行列及び話者適応用データを記憶する記憶装置と、話者独立な音響モデルに変換行列を適用し、話者適応音響モデルを算出する音響モデル変換部１５０と、話者適応用データのうち正解データの事後確率が所定範囲に存在するフレームを選択するフレーム選択部１４２と、選択されたフレームを用い、ソフトマージン推定の目的関数の値を算出する目的関数算出部１４４、１４６と、最適化アルゴリズムを用い、目的関数の値を極小化するよう変換行列を更新する更新部１４８と、更新後の変換行列を用い、音響モデル変換部１５０、フレーム選択部１４２、目的関数算出部１４４、１４６、及び更新部１５０を終了条件が充足されるまで繰返し動作させる繰返し制御部１５４とを含む。図３はこの形態を実現する汎用のコンピュータシステムのハードウェア外観を示す図、図４はコンピュータシステムの内部構造のブロック図、である。
イメージ図
実施実績	【無】
許諾実績	【無】
特許権譲渡	【否】
特許権実施許諾	【可】

アピール情報

アピール内容	国立研究開発法人情報通信研究機構(NICT)では、みなさまにご活用いただきたい成果(シーズ)を、以下に公開しています。製品化や技術移転など、お気軽にご相談ください。 https://www2.nict.go.jp/oihq/seeds/

登録者情報

登録者名称	国立研究開発法人情報通信研究機構

その他の情報

関連特許

国内	【無】
国外	【無】

Copyright © 2022 INPIT