音声認識装置及び方法、並びにコンピュータプログラム

開放特許情報番号
L2023000321
開放特許情報登録日
2023/4/19
最新更新日
2023/4/19

基本情報

出願番号 特願2021-134879
出願日 2021/8/20
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2023-028902
公開日 2023/3/3
発明の名称 音声認識装置及び方法、並びにコンピュータプログラム
技術分野 情報・通信
機能 機械・部品の製造
適用製品 多言語の発話の音声認識装置
目的 多言語でのリアルタイムの音声認識を、高精度でかつ低レイテンシで行える多言語ライブ音声認識システムを提供する。
多言語ライブ音声認識システムを適切に評価する指標を提供する。
効果 発話区間を検出し、発話区間ごとにその言語を識別して音声認識し、音声認識の結果を表示54として出力する機能を持つ。
音声サンプル列に含まれる音声区間を検出し、(開始時刻、終了時刻)のペアからなる発話区間検出信号を出力するためのものである。
技術概要
音声信号の発話区間の開始及び終了を検出する発話区間検出手段と、
前記発話区間検出手段により検出された発話区間の終了後、所定時間以上の無音区間があったことに応答して、発話区切りを示す発話区分信号を出力するための発話区切り検出手段と、
前記発話区分信号に応答して、直前の発話区間の発話の言語を識別し言語の識別子を出力するための言語識別手段と、
前記発話区間検出手段により発話区間の開始が検出されたことに応答して、当該発話区間の音声信号に対する音声認識をそれぞれ行うための、互いに異なる複数の言語のための複数の音声認識手段と、
前記識別子に応答して、前記複数の音声認識手段のうち、当該識別子の示す言語の音声認識手段の出力を選択して出力するための選択手段とを含む、音声認識装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2022 INPIT