1D3-03　ルーレット選択を用いたProfit Sharing強化学習における合理性についての一考察

6月15日(水) 15:10～16:50　D会場
強化学習・基礎

演題番号	1D3-03
題目	ルーレット選択を用いたProfit Sharing強化学習における合理性についての一考察
著者	河合宏和 (大阪市立大学，大阪市立大学) 辰巳昭治 (大阪市立大学，大阪市立大学) 上野敦志 (大阪市立大学，大阪市立大学)
時間	6月15日(水) 15:50～16:10
概要	強化学習法の一種であるProfit Sharing法においてルーレット選択の特性を考慮した上での新たな迂回系列の抑制条件を提案し，従来の抑制条件を満たした手法より学習効率が上昇し得る事を実験により確認する．
論文	PDFファイル