3F4-04　コスト付きマルコフ決定過程における強化学習アルゴリズム

6月27日(金) 15:40～16:00　F 小会議室1+2

演題番号	3F4-04
題目	コスト付きマルコフ決定過程における強化学習アルゴリズム
著者	石黒　誉久 (名古屋工業大学電気情報工学科) 松井　藤五郎 (名古屋工業大学) 犬塚　信博 (名古屋工業大学電気情報工学科) 和田　幸一 (名古屋工業大学電気情報工学科)
時間	6月27日(金) 15:40～16:00
セッション	強化学習（14:40～17:20　F 小会議室1+2）
概要	行動にコストが発生する環境で、総報酬から総コストを引いた利益を最大化する問題について、強化学習アルゴリズムを検討する。このための問題変換と信用割当関数を与えて、実験によって考察する。
論文	PDFファイル, PDFファイル(会場ローカル)

システム管理者 (jsai2003-admin@nii.ac.jp)