ページの本文に

ウインドウを閉じる

サブワード取得処理装置、サブワード取得処理方法、および、プログラム

開放特許情報番号: L2024001920

開放特許情報登録日: 2024/10/24

最新更新日: 2024/10/24

基本情報

出願番号	特願2022-177030
出願日	2022/11/4
出願人	国立研究開発法人情報通信研究機構
公開番号	特開2024-067172
公開日	2024/5/17
発明の名称	サブワード取得処理装置、サブワード取得処理方法、および、プログラム
技術分野	情報・通信
機能	制御・ソフトウェア
適用製品	単語をサブワードに分割することでサブワードを取得する処理（サブワードセグメンテーション）についての技術
目的	大量の対訳データを必要とせず、高品質なサブワード（例えば、直感的に正しいと判断されるサブワード）を取得するサブワード取得処理システム、サブワード取得処理装置、サブワード取得処理方法、および、プログラムを実現する。
効果	大量の対訳データを必要とせず、高品質なサブワード（例えば、直感的に正しいと判断されるサブワード）を取得するサブワード取得処理システム、サブワード取得処理装置、サブワード取得処理方法、および、プログラムを実現することができる。
技術概要	処理対象の単語から当該単語のサブワード列を取得するサブワード取得処理装置であって、単言語のデータを記憶する単言語データ記憶部から、前記処理対象の単語を含む文のデータを取得し、取得した当該文のデータから、前記処理対象の単語のコンテキストを考慮したデータであるコンテキスト考慮隠れ状態データを取得するコンテキスト考慮隠れ状態データ取得部と、前記処理対象の単語と、前記コンテキスト考慮隠れ状態データとに基づいて、前記処理対象の単語のサブワードの出現確率分布データであるサブワード確率分布データを出力する予測学習処理部と、前記サブワード確率分布データに基づいて、前記処理対象の単語のサブワード列の出現確率を取得し、取得した前記処理対象の単語のサブワード列の出現確率のうち、当該出現確率が最も高いサブワード列、あるいは、当該出現確率が最も高いサブワード列から当該出現確率がＮ番目（Ｎ：２以上の自然数）に高いサブワード列のＮ個のサブワード列を出力する出力部と、を備えるサブワード取得処理装置。
実施実績	【無】
許諾実績	【無】
特許権譲渡	【否】
特許権実施許諾	【可】

登録者情報

登録者名称	国立研究開発法人情報通信研究機構

その他の情報

関連特許

国内	【無】
国外	【無】

Copyright © 2024 INPIT