文書解析装置、及びプログラム

開放特許情報番号
L2017001023
開放特許情報登録日
2017/7/5
最新更新日
2017/7/5

基本情報

出願番号 特願2013-041779
出願日 2013/3/4
出願人 日本放送協会
公開番号 特開2014-170377
公開日 2014/9/18
登録番号 特許第6078380号
特許権者 日本放送協会
発明の名称 文書解析装置、及びプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 文書解析装置、及びプログラム
目的 文書に出現する単語の頻度を利用して文書の特徴を解析する際に、スタイルに相当する単語の出現頻度の影響を抑えることができる文書解析装置、及びプログラムを提供する。
効果 文書に出現する単語の頻度を利用して文書の特徴を解析する際に、スタイルに相当する単語の出現頻度の影響を抑えることができる。
技術概要
複数の文書データそれぞれにおける各単語の出現頻度を表す特徴量を並べた文書行列に因子分解を行い、機能語の出現頻度分布を表す基底が前記文書データそれぞれに寄与している度合いを取得する因子分解部と、
前記因子分解部が取得した前記基底の寄与の度合いに基づいて前記文書データをスタイル別にカテゴリ分けし、前記文書データの前記特徴量が表す前記機能語の出現頻度を、当該文書データが属する前記スタイルにおける前記機能語の出現頻度に応じて低減させる重み付け処理部と、
前記重み付け処理部により前記機能語の出現頻度が低減された前記特徴量を用いて前記文書データの特徴を解析する解析部と、
を備えることを特徴とする文書解析装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2022 INPIT