書き起こしテキスト自動生成装置、音声認識装置および記録媒体

開放特許情報番号
L2007004084
開放特許情報登録日
2007/8/31
最新更新日
2007/8/31

基本情報

出願番号 特願平11-350336
出願日 1999/12/9
出願人 日本放送協会
公開番号 特開2001-166790
公開日 2001/6/22
登録番号 特許第3958908号
特許権者 日本放送協会
発明の名称 書き起こしテキスト自動生成装置、音声認識装置および記録媒体
技術分野 電気・電子、情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 書き起こしテキスト自動生成装置、音声認識装置および記録媒体
目的 音響モデル学習のための書き起こしテキストを自動生成することができる書き起こしテキスト自動生成装置、それを搭載した音声認識装置および記録媒体を提供する。
効果 区切れ位置で分割されたかな混じりテキストを読み辞書を使用して読み(音素表記の文字列)に変換する。また、これにより手動でなく自動での区切り記号挿入済み音素表記書き起こしテキストの自動生成が可能となる。さらに、区切れ記号が挿入されていない音素表記書き起こしテキストと、読みに変換され、同一の文字列について複数の読みが存在する分割済みテキストとの比較により、最適な読みを得ることができる。
技術概要
図1の機能構成を持つ書き起こしテキスト自動生成装置およびそれを有する音声認識装置を図2に示す。図1において、CPU1000、システムメモリ1010、入力装置1020、ディスプレイ1030、入出力インターフェース(I/O)104およびハードディスク1060がバスを介して接続されている。CPU1000は、ハードディスク1060に記憶された自動生成プログラムをシステムメモリ1010にロードした後、自動生成プログラムを実行して、区切り記号挿入済みテキストデータ108を生成する。このとき、CPU1000が書き起こしテキストデータ生成装置として機能する。また、ハードディスク1060に記憶された音声認識プログラムを使用して音声認識を行う場合には、CPU1000は音声認識装置として機能する。システムメモリ1010はCPU1000が実行するプログラム、このプログラムにしたがって実行する情報処理のための入力データ、情報処理結果を一時記憶する。入力装置1020はキーボードおよびマウスを有し、実行すべきプログラムを指定したり、文字や文字処理のための動作指示を行う。図3は自動生成プログラムの処理内容を示すフローチャートである。
イメージ図
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

アピール情報

導入メリット 【改善】
改善効果1 読みに変化された分割済みの音素表記テキストの示す位置にしたがって、かな漢字混じりテキストデータに対して最も忠実な読みを表し、区切れ記号が挿入されていない音素表記書き起こしテキストデータ(入力手段から入力される音素表記書き起こしテキストデータ)に区切れ記号を挿入するので、読みの精度がよい区切れ記号挿入済み音素表記テキストデータを自動生成することができる。
改善効果2 音響モデルの作成に使用する書き起こしテキストを自動生成することができるので、書き起こしテキストの生成時間を大幅に短縮することが可能となり、また、音響モデルの作成に関わるユーザの操作労力をも大幅に低減することができる。

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2017 INPIT