学習データ拡張装置、学習装置、翻訳装置、およびプログラム

公開公報を見る登録公報を見る経過情報を見る

開放特許情報番号：L2023001292 開放特許情報登録日：2023/10/27 最新更新日：2023/10/27

基本情報

出願番号

特願2019-017388

公開番号

特開2020-126360

登録番号

特許第7329929号

出願日

2019/2/1

公開日

2020/8/20

出願人

日本放送協会

特許権者

日本放送協会

権利化状況

権利化済

発明の名称

学習データ拡張装置、学習装置、翻訳装置、およびプログラム

開放特許情報

技術分野

情報・通信

機能

機械・部品の製造制御・ソフトウェア

適用製品

学習データ拡張装置、学習装置、翻訳装置、およびプログラム

目的

機械翻訳の精度を上げるために、既存の対訳文データを拡張して大量の対訳文データを生成することのできる学習データ拡張装置、その学習データ拡張装置で生成された学習データを用いて機械学習処理を行う学習装置、およびその学習データ拡張装置によって得られた学習データを利用した機械学習処理によるモデルに基づく翻訳装置と、そのプログラムとを提供する。

効果

機械翻訳のための学習データの量を自動的に増やすことができる。これにより、比較的低コストで、機械翻訳の精度を向上させることができる。

技術概要

学習データ拡張装置は、拡張処理部を備える。拡張処理部は、ソース言語によって記述された文と、ターゲット言語によって記述された文と、で成る入力文対を基に、前記ソース言語または前記ターゲット言語の少なくともいずれかのシソーラス情報を用いて、前記文対に含まれる表現の置換候補を選び、置換対象である前記表現を前記置換候補で置換することによって、ソース言語によって記述された文とターゲット言語によって記述された文とで成る新たな文対を生成する。

イメージ図

実施実績　　　：

無

許諾実績　：

無

特許権譲渡　　：

否

特許権実施許諾：

可

登録者情報

登録者名称

一般財団法人　ＮＨＫ財団

その他の情報