言語処理装置およびプログラム

開放特許情報番号
L2013002476
開放特許情報登録日
2013/12/9
最新更新日
2013/12/9

基本情報

出願番号 特願2008-148047
出願日 2008/6/5
出願人 日本放送協会
公開番号 特開2009-294913
公開日 2009/12/17
登録番号 特許第5377889号
特許権者 日本放送協会
発明の名称 言語処理装置およびプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 自然言語処理
目的 単に確率の積によるスコアを用いて正解候補を選択するのではなく、誤りがなるべく少なくなるような単語分割および読み仮名付与を行なえる言語処理装置およびそのコンピュータプログラムを提供する。
効果 高い精度で単語の分割と読み仮名の付与とを行なうことができるようになる。
また、与えられた日本語漢字仮名まじり文を、単語を単位として高い精度で分割し、かつ適切な読み仮名を付与することができるようになる。このように高い精度で分割された単語と該当する読み仮名を用いて音声認識装置に必要な統計的な言語モデルを構築することができる。その結果、そのような統計的言語モデルを用いて音声認識処理を行なうことにより、認識率の向上をはかることができる。
技術概要
本発明による言語処理装置は、テキストデータを読み込み、読み込んだ前記テキストデータを基に単語分割の正解候補を展開し、各々の前記正解候補に対して単語分割の正解単語数の期待値のスコアを算出し、算出した前記スコアが最良の前記正解候補を選択し、選択された前記正解候補の単語分割を出力する単語分割処理部を具備する構成とする。単語分割処理部は、単語分割の正解候補の、単語列と品詞列と読み仮名と係り受け構造の少なくともいずれかに基づく値を返す関数であるルールと、前記ルールに関する重み値を記憶する単語分割モデルを利用してスコアを算出する。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2017 INPIT