/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /
演題番号 | 3F4-03 |
---|---|
題目 | POMDPsへの行動優先度学習型強化学習アルゴリズムの適用 |
著者 | 松井 藤五郎 (名古屋工業大学) 犬塚 信博 (名古屋工業大学電気情報工学科) 世木 博久 (名古屋工業大学) |
時間 | 6月27日(金) 15:20〜15:40 |
セッション | 強化学習 (14:40〜17:20 F 小会議室1+2) |
概要 | 本論文では,不完全知覚環境(POMDPs)にprofit sharingの類であるOnPS,FVPS,LVPSを適用する.これまでに良い結果が報告されているSarsa(0.9)とも比較し,OnPSが最も優れていることを確認した. |
論文 | PDFファイル, PDFファイル(会場ローカル) |
/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /