適用製品
画像内の文字領域を検出するための文字領域検出モデルを学習する文字領域検出モデル学習装置およびそのプログラム、ならびに、文字領域検出モデルを用いて画像内の文字領域を検出する文字領域検出装置およびそのプログラム
目的
画像内の文字領域を精度よく検出することが可能なモデルを学習する文字領域検出モデル学習装置およびそのプログラム、ならびに、文字領域検出装置およびそのプログラムを提供する。
効果
ニューラルネットワークの学習によって、単独文字同士が同じ文字列に属するか否かを判定するため、従来のような単純なルールベースのアルゴリズムで文字列の判定を行う手法に比べて、柔軟に文字列の判定を行うことができる。
これによって、従来の手法に比べて、画像から精度よく文字領域を検出することができる。
技術概要
文字領域検出モデル学習装置1は、単独文字検出モデルN1を用いて、学習用画像から単独文字の文字マップおよび特徴マップを生成する単独文字検出手段10と、正解データから単独文字の正解マップを生成する正解マップ生成手段11と、文字マップと正解マップとの誤差を算出する単独文字誤差算出手段12と、単独文字検出モデルN1のパラメータを更新するパラメータ更新手段13と、ペア属性推定モデルN2を用いて、文字マップおよび特徴マップから単独文字のペアのペア属性を算出するペア属性算出手段14と、正解データからペア属性の誤差を算出するペア属性誤差算出手段15と、ペア属性推定モデルN2のパラメータを更新するパラメータ更新手段16と、を備える。