機械翻訳用訓練データ生成方法、機械翻訳処理用の学習可能モデルの作成方法、機械翻訳処理方法、および、機械翻訳用訓練データ生成装置

開放特許情報番号
L2024000940
開放特許情報登録日
2024/4/24
最新更新日
2024/4/24

基本情報

出願番号 特願2022-097221
出願日 2022/6/16
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2023-183618
公開日 2023/12/28
発明の名称 機械翻訳用訓練データ生成方法、機械翻訳処理用の学習可能モデルの作成方法、機械翻訳処理方法、および、機械翻訳用訓練データ生成装置
技術分野 情報・通信
機能 機械・部品の製造
適用製品 機械翻訳処理技術
目的 タグ付きの対訳文を大量に準備することなく、翻訳対象の原文にマークアップ言語用タグを含んだ原文を、マークアップ言語用タグの情報を保持しつつ、高精度に機械翻訳することを可能にする機械翻訳処理方法、機械翻訳用訓練データ生成方法、機械翻訳処理用の学習可能モデルの作成方法、機械翻訳処理方法、機械翻訳用訓練データ生成装置、および、機械翻訳処理システムを実現する。
効果 タグ付きの対訳文を大量に準備することなく、翻訳対象の原文にマークアップ言語用タグを含んだ原文を、マークアップ言語用タグの情報を保持しつつ、高精度に機械翻訳することを可能にする機械翻訳処理方法、機械翻訳用訓練データ生成方法、機械翻訳処理用の学習可能モデルの作成方法、機械翻訳処理方法、機械翻訳用訓練データ生成装置、および、機械翻訳処理システムを実現することができる。
技術概要
マークアップ言語用タグを含む言語データを機械翻訳処理するための機械翻訳処理システムにおいて、機械翻訳処理用の学習可能モデルを訓練するための訓練データを生成する方法であって、
第1言語データと、前記第1言語データの第2言語へ翻訳したデータである第2言語データとを組みにした対訳データであって、前記マークアップ言語用タグを含まない前記対訳データにおいて、開始と終了とが対応している符号である開始終了対応符号を検出する開始終了対応符号検出ステップと、
前記対訳データに対して、前記開始終了対応符号を、代替符号に置換する置換処理を実行することで、前記置換処理後の対訳データを取得する置換処理ステップと、
を備える機械翻訳用訓練データ生成方法。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2024 INPIT