3F4-03　POMDPsへの行動優先度学習型強化学習アルゴリズムの適用

6月27日(金) 15:20～15:40　F 小会議室1+2

演題番号	3F4-03
題目	POMDPsへの行動優先度学習型強化学習アルゴリズムの適用
著者	松井　藤五郎 (名古屋工業大学) 犬塚　信博 (名古屋工業大学電気情報工学科) 世木　博久 (名古屋工業大学)
時間	6月27日(金) 15:20～15:40
セッション	強化学習（14:40～17:20　F 小会議室1+2）
概要	本論文では，不完全知覚環境（POMDPs）にprofit sharingの類であるOnPS，FVPS，LVPSを適用する．これまでに良い結果が報告されているSarsa(0．9)とも比較し，OnPSが最も優れていることを確認した．
論文	PDFファイル, PDFファイル(会場ローカル)

システム管理者 (jsai2003-admin@nii.ac.jp)