| 出願番号 |
特願2022-042647 |
| 出願日 |
2022/3/17 |
| 出願人 |
日本放送協会 |
| 公開番号 |
特開2023-136771 |
| 公開日 |
2023/9/29 |
| 登録番号 |
特許第7808988号 |
| 特許権者 |
日本放送協会 |
| 発明の名称 |
文書分類用学習装置、文書分類装置及びプログラム |
| 技術分野 |
情報・通信 |
| 機能 |
機械・部品の製造 |
| 適用製品 |
文書分類用学習装置、文書分類装置、プログラム |
| 目的 |
低頻度ラベルの教師データが不足せず、かつ入力データのトークン数の制限の影響を受けないように言語モデルを学習することで、文書の分類精度を向上させることが可能な文書分類用学習装置、文書分類装置及びプログラムを提供する。 |
| 効果 |
低頻度ラベルの教師データが不足せず、かつ入力データのトークン数の制限の影響を受けないように言語モデルを学習することができる。また、このような言語モデルを用いることで、文書の分類精度を向上させることができる。 |
技術概要
 |
文書に含まれる文章及び前記文書に付与されたラベルに基づいて、前記文書を分類するための事前学習された言語モデルをファインチューニングする文書分類用学習装置において、
前記文章及び前記ラベルを入力し、前記文章を文単位に分割し、所定数の文からなる複数の分割後文章を生成する第1分割部と、
前記第1分割部により生成された前記分割後文章及び前記第1分割部により入力された前記ラベルからなるラベル付き教師データを用いて、前記言語モデルをファインチューニングする学習部と、
を備えたことを特徴とする文書分類用学習装置。 |
| 実施実績 |
【無】 |
| 許諾実績 |
【無】 |
| 特許権譲渡 |
【否】
|
| 特許権実施許諾 |
【可】
|