ページの本文に

ウインドウを閉じる

統計的音響モデルの適応方法、統計的音響モデルの適応に適した音響モデルの学習方法、ディープ・ニューラル・ネットワークを構築するためのパラメータを記憶した記憶媒体、及び統計的音響モデルの適応を行なうためのコンピュータプログラム

開放特許情報番号: L2016001011

開放特許情報登録日: 2016/6/3

最新更新日: 2023/1/13

基本情報

出願番号	特願2013-245098
出願日	2013/11/27
出願人	国立研究開発法人情報通信研究機構
公開番号	特開2015-102806
公開日	2015/6/4
登録番号	特許第5777178号
特許権者	国立研究開発法人情報通信研究機構
発明の名称	統計的音響モデルの適応方法、統計的音響モデルの適応に適した音響モデルの学習方法、ディープ・ニューラル・ネットワークを構築するためのパラメータを記憶した記憶媒体、及び統計的音響モデルの適応を行なうためのコンピュータプログラム
技術分野	情報・通信
機能	制御・ソフトウェア
適用製品	音声認識等の認識技術に用いられるディープ・ニューラル・ネットワーク
目的	特定の条件の学習データを用いてＤＮＮを用いた音響モデルの適応化を効率的に行なえ、精度も高められる統計的音響モデルの適応方法を提供する。
効果	学習を行なったＤＮＮ３０を従来のＨＭＭ中のＧＭＭに代えて用いることにより、特定の話者に適応した音響モデルが得られる。各話者の発話データをランダムに選択しながら、一時に一人の話者の発話データに偏ることのない順番でＤＮＮ８０の学習が行なえる。その結果、発話データの選択の順番による影響を最小限に抑えながら、ＤＮＮ８０の準備的学習が行なえる。
技術概要	ＤＮＮを用いた音響モデルの話者適応方法において、第１の記憶装置に、異なる話者の発話データ９０～９８を別々に記憶するステップと、話者別の隠れ層モジュール１１２～１２０を準備するステップと、発話データ９０～９８を切替えて選択しながら、特定レイヤ１１０を、選択された発話データに対応する隠れ層モジュール１１２～１２０で動的に置換しながらＤＮＮ８０の全てのレイヤ４２，４４，１１０，４８，５０，５２，５４について準備的学習を行なうステップと、準備的学習が完了したＤＮＮの特定レイヤ１１０を初期隠れ層で置換するステップと、初期隠れ層以外のレイヤのパラメータを固定して、特定話者の音声データでＤＮＮの学習を行なうステップとを含む。
実施実績	【無】
許諾実績	【無】
特許権譲渡	【否】
特許権実施許諾	【可】

アピール情報

アピール内容	国立研究開発法人情報通信研究機構(NICT)では、みなさまにご活用いただきたい成果(シーズ)を、以下に公開しています。製品化や技術移転など、お気軽にご相談ください。 https://www2.nict.go.jp/oihq/seeds/

登録者情報

登録者名称	国立研究開発法人情報通信研究機構

その他の情報

関連特許

国内	【無】
国外	【無】

Copyright © 2022 INPIT