テキストデータ分割装置およびテキストデータ分割プログラム

開放特許情報番号
L2010006397
開放特許情報登録日
2010/12/17
最新更新日
2010/12/17

基本情報

出願番号 特願2003-296586
出願日 2003/8/20
出願人 日本放送協会
公開番号 特開2005-070165
公開日 2005/3/17
登録番号 特許第4460243号
特許権者 日本放送協会
発明の名称 テキストデータ分割装置およびテキストデータ分割プログラム
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 テキストデータ分割装置
目的 音素表記されているテキストデータに対応し、テキストデータに複数の子音と複数の母音とが接続した音素列が含まれる場合であっても、正確に区分することができるテキストデータ分割装置の提供を目的とする。
効果 音素表記されたテキストデータが音素列辞書に記録されている音素列に従って分割された複数の音素列分割仮説データとされ、音素列分割仮説データ毎の接続点数が計算され、接続点数が最小となる最小音素列分割仮説データが選択されて出力される。このため、任意の音素列を単位としてテキストデータを分割したい場合には、音素列辞書に登録しておくだけで分割することが可能になり、音素表記されているテキストデータに対応することができる。
技術概要
仮説生成手段は、音素表記されたテキストデータを音素列辞書記録手段に記録されている音素列に従って分割した音素列分割仮説データとして複数生成する。記録された有限長の音素列を、テキストデータを分割する分割候補とし、全ての分割候補についてテキストデータの文頭から逐次、分割を行う。この音素列のデータ数が多いほど、生成される音素列分割仮説データの数は増加する。 接続点数計算手段は、音素列分割仮説データ毎における接続点数を計算する。接続点数は音素列分割仮説データ毎に含まれる音素列と音素列との接続する箇所の数を指す。 仮説削除手段は、音素列分割仮説データの接続点数に基づき、音素列分割仮説データを削除する。 最小音素列分割仮説出力手段は、接続点数が最小となる最小音素列分割仮説データを選択して出力する。この装置は、テキストデータを分割する際に、分割される単位となる音素列が音素列辞書記録手段に含まれており、テキストデータの分割個数が最小となる音素列分割仮説データが最良のものとして出力する。この最小音素列分割仮説出力手段は、接続点数計算手段によって計算された接続点数が最小となる音素列分割仮説データを選択する選択手段を備えている。
イメージ図
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT