/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /

3F4-04 コスト付きマルコフ決定過程における強化学習アルゴリズム

6月27日(金) 15:40〜16:00 F 小会議室1+2

演題番号3F4-04
題目コスト付きマルコフ決定過程における強化学習アルゴリズム
著者石黒 誉久 (名古屋工業大学電気情報工学科)
松井 藤五郎 (名古屋工業大学)
犬塚 信博 (名古屋工業大学電気情報工学科)
和田 幸一 (名古屋工業大学電気情報工学科)
時間6月27日(金) 15:40〜16:00
セッション強化学習 (14:40〜17:20 F 小会議室1+2)
概要行動にコストが発生する環境で、総報酬から総コストを引いた利益を最大化する問題について、強化学習アルゴリズムを検討する。このための問題変換と信用割当関数を与えて、実験によって考察する。
論文PDFファイル, PDFファイル(会場ローカル)




/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /

システム管理者 (jsai2003-admin@nii.ac.jp)