発話音声テキスト生成装置、発話音声テキスト生成プログラムおよび発話音声テキスト生成方法
- 開放特許情報番号
- L2024001877
- 開放特許情報登録日
- 2024/10/17
- 最新更新日
- 2024/10/17
基本情報
出願番号 | 特願2020-083244 |
---|---|
出願日 | 2020/5/11 |
出願人 | 日本放送協会 |
公開番号 | |
公開日 | 2021/11/18 |
登録番号 | |
特許権者 | 日本放送協会 |
発明の名称 | 発話音声テキスト生成装置、発話音声テキスト生成プログラムおよび発話音声テキスト生成方法 |
技術分野 | 情報・通信 |
機能 | 制御・ソフトウェア |
適用製品 | 発話音声テキスト生成装置、発話音声テキスト生成プログラムおよび発話音声テキスト生成方法 |
目的 | 複数の発話音声を含んだ音声データと対応するテキストデータとから、発話区間ごとの音声データとテキストデータとを生成することが可能な発話音声テキスト生成装置、発話音声テキスト生成プログラムおよび発話音声テキスト生成方法を提供する。 |
効果 | 複数の発話音声からなる音声データとその音声データに対応するテキストデータとに時間的にずれがある場合でも、発話ごとの音声データとテキストデータとを対応付けて抽出することができる。 |
技術概要 |
複数の発話音声からなる音声データから、発話ごとの区間音声データの区切り位置を検出する音声区切り検出手段と、
前記区間音声データごとに音声認識を行う音声認識手段と、 前記音声認識手段の認識結果と、前記音声データの発話内容であるテキストデータとをマッチングすることで、前記区間音声データの時間に対応する区間テキストデータを推定するマッチング手段と、 前記区間テキストデータから、音素の情報と、当該音素が含まれるアクセント句および当該アクセント句に隣接するアクセント句に関する特徴を示すアクセント句情報とを少なくとも含む音素ごとのコンテキスト情報を生成するコンテキスト情報生成手段と、 音素列の前記コンテキスト情報を、音素の出現順の読みを表す文字と韻律を表す予め定めた文字とを含む第2の区間テキストデータに変換する変換手段と、 を備えることを特徴とする発話音声テキスト生成装置。 |
実施実績 | 【無】 |
許諾実績 | 【無】 |
特許権譲渡 | 【否】 |
特許権実施許諾 | 【可】 |
登録者情報
登録者名称 | |
---|---|
その他の情報
関連特許 |
|
---|