サブワード取得処理装置、サブワード取得処理方法、および、プログラム

開放特許情報番号
L2024001920
開放特許情報登録日
2024/10/24
最新更新日
2024/10/24

基本情報

出願番号 特願2022-177030
出願日 2022/11/4
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2024-067172
公開日 2024/5/17
発明の名称 サブワード取得処理装置、サブワード取得処理方法、および、プログラム
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 単語をサブワードに分割することでサブワードを取得する処理(サブワードセグメンテーション)についての技術
目的 大量の対訳データを必要とせず、高品質なサブワード(例えば、直感的に正しいと判断されるサブワード)を取得するサブワード取得処理システム、サブワード取得処理装置、サブワード取得処理方法、および、プログラムを実現する。
効果 大量の対訳データを必要とせず、高品質なサブワード(例えば、直感的に正しいと判断されるサブワード)を取得するサブワード取得処理システム、サブワード取得処理装置、サブワード取得処理方法、および、プログラムを実現することができる。
技術概要
処理対象の単語から当該単語のサブワード列を取得するサブワード取得処理装置であって、
単言語のデータを記憶する単言語データ記憶部から、前記処理対象の単語を含む文のデータを取得し、取得した当該文のデータから、前記処理対象の単語のコンテキストを考慮したデータであるコンテキスト考慮隠れ状態データを取得するコンテキスト考慮隠れ状態データ取得部と、
前記処理対象の単語と、前記コンテキスト考慮隠れ状態データとに基づいて、前記処理対象の単語のサブワードの出現確率分布データであるサブワード確率分布データを出力する予測学習処理部と、
前記サブワード確率分布データに基づいて、前記処理対象の単語のサブワード列の出現確率を取得し、取得した前記処理対象の単語のサブワード列の出現確率のうち、当該出現確率が最も高いサブワード列、あるいは、当該出現確率が最も高いサブワード列から当該出現確率がN番目(N:2以上の自然数)に高いサブワード列のN個のサブワード列を出力する出力部と、
を備えるサブワード取得処理装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2024 INPIT