1D3　強化学習・基礎

6月15日(水) 15:10～16:50　D会場
野田　五十樹

題目	1D3-01　未定義フラグを用いた価値関数の動的初期化による強化学習の学習速度の改善
著者	福永哲也 (岐阜工業高等専門学校)
論文	PDFファイル

題目	1D3-02　連続値入力に対応したProfit Sharingに基づく強化学習システム
著者	宮崎和光 (独立行政法人大学評価・学位授与機構) 小林重信 (東京工業大学総合理工学研究科知能システム科学専攻)
論文	PDFファイル

題目	1D3-03　ルーレット選択を用いたProfit Sharing強化学習における合理性についての一考察
著者	河合宏和 (大阪市立大学，大阪市立大学) 辰巳昭治 (大阪市立大学，大阪市立大学) 上野敦志 (大阪市立大学，大阪市立大学)
論文	PDFファイル

題目	1D3-04　基底関数間相互作用に基づく状態空間自己組織化
著者	関野正志 (東京工業大学知能システム科学専攻) 片上大輔 (東京工業大学知能システム科学専攻) 新田克己 (東京工業大学知能システム科学専攻)
論文	PDFファイル

題目	1D3-05　強化学習における自己組織化マップを用いた状態空間の自律的構成法
著者	岩崎秀樹 (大分大学工学部) 末田直道 (大分大学工学部)
論文	PDFファイル