題目 | 1D3-01 未定義フラグを用いた価値関数の動的初期化による強化学習の学習速度の改善 |
---|---|
著者 | 福永 哲也 (岐阜工業高等専門学校) |
論文 | PDFファイル |
題目 | 1D3-02 連続値入力に対応したProfit Sharingに基づく強化学習システム |
---|---|
著者 | 宮崎 和光 (独立行政法人大学評価・学位授与機構) 小林 重信 (東京工業大学総合理工学研究科知能システム科学専攻) |
論文 | PDFファイル |
題目 | 1D3-03 ルーレット選択を用いたProfit Sharing強化学習における合理性についての一考察 |
---|---|
著者 | 河合 宏和 (大阪市立大学,大阪市立大学) 辰巳 昭治 (大阪市立大学,大阪市立大学) 上野 敦志 (大阪市立大学,大阪市立大学) |
論文 | PDFファイル |
題目 | 1D3-04 基底関数間相互作用に基づく状態空間自己組織化 |
---|---|
著者 | 関野 正志 (東京工業大学知能システム科学専攻) 片上 大輔 (東京工業大学知能システム科学専攻) 新田 克己 (東京工業大学知能システム科学専攻) |
論文 | PDFファイル |
題目 | 1D3-05 強化学習における自己組織化マップを用いた状態空間の自律的構成法 |
---|---|
著者 | 岩崎 秀樹 (大分大学工学部) 末田 直道 (大分大学工学部) |
論文 | PDFファイル |