文字検出装置、学習装置、およびプログラム

開放特許情報番号
L2025000470
開放特許情報登録日
2025/5/1
最新更新日
2025/5/1

基本情報

出願番号 特願2021-009893
出願日 2021/1/25
出願人 日本放送協会
公開番号 特開2022-113570
公開日 2022/8/4
登録番号 特許第7584312号
特許権者 日本放送協会
発明の名称 文字検出装置、学習装置、およびプログラム
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 文字検出装置、学習装置、およびプログラム
目的 微分不可能な処理(入出力関係)を含む場合であっても、学習データに基づくモデルの最適化を直接的に行うことのできる文字検出装置、学習装置、およびプログラムを提供する。
効果 微分不可能な処理を含む画像内の文字検出処理に関して、効果勾配法等によってモデルの学習を行うことが可能となる。
技術概要
画像を入力し前記画像に含まれる文字領域に関する特徴量を出力する文字検出部と、
前記文字検出部が検出した重複しあう文字領域候補を統合することによって文字領域を決定するとともに、正解データに基づいて、決定した前記文字領域のすべてについての最終スコアを算出する統合処理部と、
前記文字検出部が出力した前記特徴量に基づいて前記最終スコアの推定値である推定最終スコアを算出する最終スコア推定部と、
前記最終スコアと前記推定最終スコアとの誤差である最終スコア誤差を算出する最終スコア誤差計算部と、
を備え、
前記最終スコア推定部は、学習のために、前記最終スコア誤差を基に、前記最終スコア推定部が持つ最終スコア推定用モデルの内部パラメーターを調整し、
前記文字検出部は、学習のために、前記特徴量と正解データとの誤差である文字検出誤差と、前記推定最終スコアと、に基づいて、前記文字検出部が持つ文字検出用モデルの内部パラメーターを調整する、
文字検出装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2025 INPIT