出願番号 |
特願2014-142404 |
出願日 |
2014/7/10 |
出願人 |
日本電信電話株式会社、国立大学法人京都大学 |
公開番号 |
特開2016-018489 |
公開日 |
2016/2/1 |
登録番号 |
特許第6269953号 |
特許権者 |
日本電信電話株式会社、国立大学法人京都大学 |
発明の名称 |
単語分割装置、方法、及びプログラム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造 |
適用製品 |
単語分割装置、方法、及びプログラム |
目的 |
対象分野の文字列について精度良く単語分割をすること。 |
効果 |
対象分野とは異なる元分野の単語分割コーパスと、生コーパスとに対して、単語分割する位置を示すラベルが付与された文字間の各々についての素性、及び単語分割しない位置を示すラベルが付与された文字間の各々についての素性を抽出し、対象分野の文字列について単語分割する位置を判定するための単語分割モデルを学習し、学習された対象分野の文字列について単語分割する位置を判定するための単語分割モデルに基づいて、対象分野の文字列の単語分割する位置を判定することにより、対象分野の文字列について精度良く単語分割をすることができる。 |
技術概要
 |
分割位置推定部34により、生コーパスに含まれる文字列の各々に対して、文字間の各々に単語分割する位置を示すラベルを付与し、学習素性抽出部52により、単語分割コーパスに含まれる文字列の各々に対して、ラベルが付与された文字間の各々についての素性を抽出し、生コーパスに含まれる文字列の各々に対して、単語分割する位置を示すラベルが付与された文字間の各々についての素性を抽出し、モデル学習部54により、ラベルが付与された文字間の各々についての素性に基づいて、単語分割モデルを学習し、素性抽出部242により、入力された文字間の各々についての素性を抽出し、二値分類部244により、文字間の各々についての素性と、単語分割モデルとに基づいて、入力された文字列の単語分割する位置を判定する。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|