フレーズテーブル生成装置およびプログラム

開放特許情報番号
L2018002078
開放特許情報登録日
2018/10/3
最新更新日
2018/10/3

基本情報

出願番号 特願2017-004791
出願日 2017/1/16
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2018-116324
公開日 2018/7/26
発明の名称 フレーズテーブル生成装置およびプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 フレーズテーブルを生成するための技術
目的 翻訳の原言語および目的言語の各々に関する大規模な単言語コーパスと小規模な対訳辞書とから全自動でフレーズテーブルを生成するフレーズテーブル生成装置およびプログラムを提供すること。
効果 本発明によれば、翻訳の原言語および目的言語の各々に関する大規模な単言語コーパスと小規模な対訳辞書とから全自動でフレーズテーブルを生成するフレーズテーブル生成装置およびプログラムを実現することができる。このため本発明は、自然言語処理関連産業分野において有用であり、当該分野において実施することができる。
技術概要
原言語を目的言語に機械翻訳するときに用いられるフレーズテーブルを生成するフレーズテーブル生成装置であって、原言語の単言語コーパスから原言語のフレーズのデータを抽出する原言語フレーズ抽出部と、目的言語の単言語コーパスから目的言語のフレーズのデータを抽出する目的言語フレーズ抽出部と、原言語のフレーズのデータと、目的言語のフレーズのデータとから、フレーズ対の候補集合のデータを生成するフレーズ対候補生成部と、フレーズ対の候補集合のデータから、原言語のフレーズのデータと目的言語のフレーズのデータを組とする対訳負例データを生成する対訳負例サンプル生成部と、原言語のフレーズのデータと、原言語のフレーズに対応する目的言語のフレーズのデータを組とする対訳正例データを保持する対訳正例データ保持部と、対訳負例データと対訳正例データとを用いて機械学習することで、選別モデルの最適パラメータを取得する選別モデルパラメータ取得部と、設定された選別モデルを用いて、フレーズ対候補生成部が生成したフレーズ対の候補集合のデータから、フレーズ対のデータ集合であるフレーズテーブルを生成するフレーズ対選別部と、を備えるフレーズテーブル生成装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT