サブワード取得処理装置、サブワード取得処理方法、および、プログラム
- 開放特許情報番号
- L2024001920
- 開放特許情報登録日
- 2024/10/24
- 最新更新日
- 2024/10/24
基本情報
出願番号 | 特願2022-177030 |
---|---|
出願日 | 2022/11/4 |
出願人 | 国立研究開発法人情報通信研究機構 |
公開番号 | |
公開日 | 2024/5/17 |
発明の名称 | サブワード取得処理装置、サブワード取得処理方法、および、プログラム |
技術分野 | 情報・通信 |
機能 | 制御・ソフトウェア |
適用製品 | 単語をサブワードに分割することでサブワードを取得する処理(サブワードセグメンテーション)についての技術 |
目的 | 大量の対訳データを必要とせず、高品質なサブワード(例えば、直感的に正しいと判断されるサブワード)を取得するサブワード取得処理システム、サブワード取得処理装置、サブワード取得処理方法、および、プログラムを実現する。 |
効果 | 大量の対訳データを必要とせず、高品質なサブワード(例えば、直感的に正しいと判断されるサブワード)を取得するサブワード取得処理システム、サブワード取得処理装置、サブワード取得処理方法、および、プログラムを実現することができる。 |
技術概要 |
処理対象の単語から当該単語のサブワード列を取得するサブワード取得処理装置であって、
単言語のデータを記憶する単言語データ記憶部から、前記処理対象の単語を含む文のデータを取得し、取得した当該文のデータから、前記処理対象の単語のコンテキストを考慮したデータであるコンテキスト考慮隠れ状態データを取得するコンテキスト考慮隠れ状態データ取得部と、 前記処理対象の単語と、前記コンテキスト考慮隠れ状態データとに基づいて、前記処理対象の単語のサブワードの出現確率分布データであるサブワード確率分布データを出力する予測学習処理部と、 前記サブワード確率分布データに基づいて、前記処理対象の単語のサブワード列の出現確率を取得し、取得した前記処理対象の単語のサブワード列の出現確率のうち、当該出現確率が最も高いサブワード列、あるいは、当該出現確率が最も高いサブワード列から当該出現確率がN番目(N:2以上の自然数)に高いサブワード列のN個のサブワード列を出力する出力部と、 を備えるサブワード取得処理装置。 |
実施実績 | 【無】 |
許諾実績 | 【無】 |
特許権譲渡 | 【否】 |
特許権実施許諾 | 【可】 |
登録者情報
登録者名称 | |
---|---|
その他の情報
関連特許 |
|
---|