キーワード抽出装置およびプログラム

開放特許情報番号
L2019000590
開放特許情報登録日
2019/5/13
最新更新日
2019/5/13

基本情報

出願番号 特願2014-096836
出願日 2014/5/8
出願人 日本放送協会
公開番号 特開2015-215681
公開日 2015/12/3
登録番号 特許第6433045号
特許権者 日本放送協会
発明の名称 キーワード抽出装置およびプログラム
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 キーワード抽出装置およびそのプログラム
目的 形態素解析処理を前提とせずに、文を含むテキストから、キーワードを抽出することのできるキーワード抽出装置およびそのプログラムを提供する。
効果 ローカルコーパスデータを、所定の範囲内のみで局所的に用いた形で、精度の高いキーワード抽出を行うことができる。
形態素解析処理において正しく処理されにくい、長いキーワードの検出も、精度よく行うことができる。
テレビの字幕等のテキストデータから精度よくキーワードを抽出し、テレビ放送と連携したサービスにおいて、そのようなキーワードを利用することができるようになる。
技術概要
キーワードの集合を格納しておくコーパスデータ記憶部と、
テキストデータを取得するテキスト取得部と、
テキスト取得部が現在取得している所定範囲内のテキストデータのみに適用するために、キーワードの集合を格納しておくローカルコーパスデータ記憶部と、
テキスト取得部が取得した第1のテキストデータを元にキーワードを抽出し、抽出したキーワードを、ローカルコーパスデータ記憶部に登録するローカルコーパスデータ生成部と、
コーパスデータ記憶部およびローカルコーパスデータ記憶部のそれぞれから読み出したキーワードと、テキスト取得部が取得した第2のテキストデータとをマッチングさせることによって、第2のテキストデータに含まれるキーワードを抽出するキーワード抽出部と、
を具備し、
コーパスデータ記憶部およびローカルコーパスデータ記憶部のそれぞれは、各々のキーワードの語長と関連付けてキーワードを格納しており、
キーワード抽出部は、語長の長いものから優先させてコーパスデータ記憶部およびローカルコーパスデータ記憶部のそれぞれから読み出したキーワードと、テキスト取得部が取得した第2のテキストデータとをマッチングさせる。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2019 INPIT