強化学習装置および強化学習方法
- 開放特許情報番号
- L2020000387
- 開放特許情報登録日
- 2020/2/24
- 最新更新日
- 2020/2/24
基本情報
出願番号 | 特願2005-254763 |
---|---|
出願日 | 2005/9/2 |
出願人 | 国立大学法人横浜国立大学 |
公開番号 | |
公開日 | 2007/3/15 |
登録番号 | |
特許権者 | 国立大学法人横浜国立大学 |
発明の名称 | 強化学習装置および強化学習方法 |
技術分野 | 情報・通信 |
機能 | 機械・部品の製造 |
適用製品 | 自律移動ロボット等に応用する強化学習方法およびこれを用いた装置 |
目的 | 強化学習法は自律移動ロボット等に応用される知的動作の一つであり、未知の環境での動作が可能であるなど優れた面を持つシステムであるが、不完全知覚問題という基礎的な課題を持っている。いろいろな解決策が提案されているが、決め手はなく、システムも複雑なものになり兼ねない。簡単で効果的な解決方法が望まれている。 |
効果 | 不完全知覚問題を複雑なアルゴリズムを用いることなく簡便な実装で解決するものであるから、不完全知覚問題のもたらす本質的な欠陥が解消し、自律移動学習が可能なロボットが容易に作れるようになる。 |
技術概要 |
状態と行動の対に対して価値関数値を決定し保持する価値関数値保持部と、
前記価値関数保持部から渡される価値関数値集合の中から1つの値を選択し、選択した値を基に行動を選択する行動選択部と、 状態が遷移した時に価値関数値を更新する価値関数値更新部と、 を有し、 前記価値関数値は複素数であり、 前記価値関数値更新部は、前記価値関数値の更新式において、直前の行動の複素価値関数値との位相差を考慮して複素価値関数値を更新する 強化学習装置。 |
実施実績 | 【無】 |
許諾実績 | 【無】 |
特許権譲渡 | 【否】 |
特許権実施許諾 | 【可】 |
登録者情報
登録者名称 | |
---|---|
その他の情報
関連特許 |
|
---|