疑似対データ生成方法、系列データ変換モデル取得方法、系列データ変換処理装置、および、プログラム

開放特許情報番号
L2022001638
開放特許情報登録日
2022/10/17
最新更新日
2023/1/12

基本情報

出願番号 特願2021-011573
出願日 2021/1/28
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2022-115116
公開日 2022/8/9
発明の名称 疑似対データ生成方法、系列データ変換モデル取得方法、系列データ変換処理装置、および、プログラム
技術分野 情報・通信
機能 機械・部品の製造
適用製品 系列データ変換処理の技術
目的 適応先分野(機械翻訳の対象とする分野)の小規模な単言語データから当該適応先分野の疑似対訳データを自動的に生成し、適応先分野の機械翻訳を適切に実行する技術を実現する。さらに、当該技術を汎用化し、所定の適応要件を満たす小規模なデータ集合(対データではないデータ集合)から、当該適用条件を満たす大規模な疑似対データ集合を取得し、上記適用条件を満たす系列データ変換処理を実現する技術を実現する。
効果 適応先分野(機械翻訳の対象とする分野)の小規模な単言語データから当該適応先分野の疑似対訳データを自動的に生成し、適応先分野の機械翻訳を適切に実行する技術を実現することができる。さらに、当該技術を汎用化し、所定の適応要件を満たす小規模なデータ集合から、当該適用条件を満たす大規模な疑似対データ集合を取得し、上記適用条件を満たす系列データ変換処理を実現する技術を実現することができる。
技術概要
第1データ系列を第2データ系列に、または、第2データ系列を第1データ系列に変換するための系列データ変換処理であって、所定の適用条件を満たす系列データ変換処理を実行するためのモデルである系列データ変換モデルを取得するために用いられる疑似対データを生成する方法であって、
単独データ生成処理用の学習済み言語モデルを取得し、取得した学習済み言語モデルを用いて、単独データ生成処理を行うことで、単独データを生成する疑似単独データ生成ステップと、
ベース変換モデルの学習済み変換モデルを取得するベース変換モデル取得ステップと、
ベース変換モデルの学習済み変換モデルを用いて、疑似単独データ生成ステップで生成された単独データに対して系列データ変換処理を実行することで、単独データの疑似変換データを取得し、単独データと、単独データの疑似変換データとを対にしたデータを疑似対データとして取得する疑似対データ取得ステップと、
を備える疑似対データ生成方法。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

アピール情報

アピール内容 国立研究開発法人情報通信研究機構(NICT)では、みなさまに
ご活用いただきたい成果(シーズ)を、以下に公開しています。
製品化や技術移転など、お気軽にご相談ください。

https://www2.nict.go.jp/oihq/seeds/

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2022 INPIT