基本語彙抽出装置、及びプログラム

開放特許情報番号
L2016001027
開放特許情報登録日
2016/6/6
最新更新日
2016/6/6

基本情報

出願番号 特願2012-038206
出願日 2012/2/24
出願人 日本放送協会
公開番号 特開2013-174995
公開日 2013/9/5
登録番号 特許第5846959号
特許権者 日本放送協会
発明の名称 基本語彙抽出装置、及びプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 基本語彙抽出装置、及びプログラム
目的 任意の文書集合から基本語彙とすべき語を抽出することができる基本語彙抽出装置、及びプログラムを提供する。
効果 任意の文書集合から基本語彙とすべき語を抽出することができる。
技術概要
基本語彙抽出装置1の複合語認定部22は、文書データが示す文章の形態素解析結果の入力を受け、複合語の候補に対応する形態素列の表現パターンと照合して、合致する形態素列を複合語候補データとして出力し、合致しない形態素をそのまま形態素データとして出力する。頻度データ作成部23は、複合語認定部22から出力される複合語候補データと形態素データそれぞれの頻度及び文書頻度を文書データ全体の集合を参照して算出し、頻度データ記憶部13に書き込む。基本語彙度算出部24は、頻度データ記憶部13から読み出した複合語候補データと形態素データそれぞれの頻度と文書頻度とを用い、基本語彙計算式により基本語彙度を算出する。基本語彙認定部25は、算出された基本語彙度が所定基準よりも高い複合語候補データと形態素データを基本語彙データとして出力する。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2023 INPIT