演題番号 | 1D3-03 |
---|---|
題目 | ルーレット選択を用いたProfit Sharing強化学習における合理性についての一考察 |
著者 | 河合 宏和 (大阪市立大学,大阪市立大学) 辰巳 昭治 (大阪市立大学,大阪市立大学) 上野 敦志 (大阪市立大学,大阪市立大学) |
時間 | 6月15日(水) 15:50〜16:10 |
概要 | 強化学習法の一種であるProfit Sharing法においてルーレット選択の特性を考慮した上での新たな迂回系列の抑制条件を提案し,従来の抑制条件を満たした手法より学習効率が上昇し得る事を実験により確認する. |
論文 | PDFファイル |