最適化装置、最適化方法、及び最適化プログラム

開放特許情報番号
L2025000145
開放特許情報登録日
2025/2/27
最新更新日
2025/2/27

基本情報

出願番号 特願2021-021962
出願日 2021/2/15
出願人 学校法人 工学院大学、学校法人沖縄科学技術大学院大学学園
公開番号 特開2022-124284
公開日 2022/8/25
登録番号 特許第7634222号
特許権者 学校法人 工学院大学、学校法人沖縄科学技術大学院大学学園
発明の名称 最適化装置、最適化方法、及び最適化プログラム
技術分野 情報・通信
機能 機械・部品の製造
適用製品 最適化装置、最適化方法、及び最適化プログラム
目的 演算に係る効率を向上させることを可能とする最適化装置、最適化方法、及び最適化プログラムを提供する。
効果 演算に係る効率を向上させることを可能とする。
技術概要
状態の推移法則、観測状態の法則、及び報酬の法則による各法則が定義されている系を用い、エージェントの行動を繰り返して前記各法則を学習し報酬を獲得するモデルにおいて、
隠れ状態を所定の態様に変更した独自隠れ状態、及び前記独自隠れ状態における現在の状態の推定を保持し、
前記観測状態の法則は、条件付き確率の条件として時刻tの観測を用い、前記独自隠れ状態を得るように、
前記状態の推移法則は、条件付き確率の条件として時刻tの前記独自隠れ状態及び時刻t+1の前記独自隠れ状態を用い、前記エージェントの行動を得るように、
前記状態の推移法則、及び前記観測状態の法則を定義する設定部と、
前記各法則をもとにサンプリングした確率を表す各パラメータの分布と、前記現在の状態の推定とを仮定して、ベルマン方程式に基づいて前記エージェントの最適行動を決定し、
前記各法則、所定の事前分布、及び前記最適行動を含む観測情報に対してベイズの定理を適用して得られた事後分布により、前記現在の状態の推定、及び前記各法則を用いた前記分布を更新することを繰り返す更新部と、
を含む最適化装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

アピール情報

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2025 INPIT