トピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラム

開放特許情報番号
L2006004639
開放特許情報登録日
2006/8/18
最新更新日
2008/11/21

基本情報

出願番号 特願2006-145654
出願日 2006/5/25
出願人 独立行政法人産業技術総合研究所
公開番号 特開2007-316323
公開日 2007/12/6
発明の名称 トピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラム。
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 トピック分割処理装置及びトピック分割処理プログラム
目的 大語彙連続音声認識システムを用いて音声をテキストに変換することなく、音声を音節や音素や音素片等のサブワードユニットの符号列として認識した上で、この符号列を直接分析して音声の意味的な階層化を行うトピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラムを提供する。
効果 このトピック分割処理方法またはトピック分割処理装置によれば、大語彙連続音声認識システムを用いることなく、音声を、音節、音素あるいは音素片等のサブワードユニットの列として認識することで得られた符号列を直接分析して、音声の意味的な階層化を行うことが可能となり、タスクや適用分野に関する事前知識を必要とせず、しかも、より高性能のトピック分割処理を実現することができる。
技術概要
図1は、トピック分割処理装置の構成を説明する図である。コンテンツ読込手段101は、マルチメディアコンテンツを入力とし、コンテンツから音声を分離した上で、主記憶上に波形データとして展開する。次の音声区間抽出手段102は、波形データに基づいて、発話区間の切り出し、雑音除去等の前処理を行って、複数の音声区間を抽出すると同時に、音声区間の開始・終了時刻情報をテーブルに記録する。音声区間抽出手段102により抽出された各音声区間は、次の音声符号化手段103に入力されて、音節、音素、あるいは音素片の系列(符号列)に符号化される。類似性行列生成手段104は、音声符号化手段103によって得られた音声の符号列を参照して、任意の二つの音声区間の類似性を計算して、テーブルに記録する。そして、階層化手段105により、テーブルに記憶された音声区間の類似性(類似性行列)に基づいて、音声区間の階層化が行われる。トピック構造情報出力手段106は、音声区間の階層情報、開始・終了時刻の情報を参照して、トピック境界の時刻情報を含むトピック構造情報を出力する。図2はトピック分割処理方法の処理フローを示すフローチャートである。
イメージ図
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT