異表記取得装置、異表記取得方法、およびプログラム

開放特許情報番号
L2012002737
開放特許情報登録日
2012/9/21
最新更新日
2015/12/3

基本情報

出願番号 特願2009-299287
出願日 2009/12/30
出願人 独立行政法人情報通信研究機構
公開番号 特開2011-138440
公開日 2011/7/14
登録番号 特許第5470620号
特許権者 国立研究開発法人情報通信研究機構
発明の名称 異表記取得装置、異表記取得方法、およびプログラム
技術分野 情報・通信
機能 機械・部品の製造、検査・検出
適用製品 異表記取得装置
目的 従来、十分な異表記抽出の精度が得られなかった。
効果 用語対の分野を問わず、精度の高い異表記の用語対の抽出が可能となる。
技術概要
用語対の異なる文字である編集箇所の字種に関する素性である字種関連素性、用語辞書を用いて取得された素性である辞書関連素性、用語対を構成する2つの用語の類似度を示す素性である類似度素性のうちの一以上の素性を含む複数の素性と、用語対が異表記の用語対であるかを示す情報である正負情報とを対応付けた学習データを2以上格納し、編集距離が1以上の用語対ごとに、字種関連素性、辞書関連素性、類似度素性のうちの一以上を含む複数の素性を取得する素性取得部と、用語対に対して、2以上の学習データと取得された複数の素性とを用いて、教師あり機械学習法により、各用語対が異表記の用語対であるか否かを判断する機械学習部と、判断結果を出力する出力部とを具備する異表記取得装置により、精度の高い異表記の用語対抽出ができる。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2017 INPIT