/ プログラム / 発表一覧 / 著者一覧 / JSAI2005 ホーム

1D3-03 ルーレット選択を用いたProfit Sharing強化学習における合理性についての一考察

6月15日(水) 15:10〜16:50 D会場
強化学習・基礎

演題番号1D3-03
題目ルーレット選択を用いたProfit Sharing強化学習における合理性についての一考察
著者河合 宏和 (大阪市立大学,大阪市立大学)
辰巳 昭治 (大阪市立大学,大阪市立大学)
上野 敦志 (大阪市立大学,大阪市立大学)
時間6月15日(水) 15:50〜16:10
概要強化学習法の一種であるProfit Sharing法においてルーレット選択の特性を考慮した上での新たな迂回系列の抑制条件を提案し,従来の抑制条件を満たした手法より学習効率が上昇し得る事を実験により確認する.
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / JSAI2005 ホーム