/ プログラム / 発表一覧 / 著者一覧 / JSAI2005 ホーム

1D3 強化学習・基礎

6月15日(水) 15:10〜16:50 D会場
野田 五十樹

発表一覧

題目 1D3-01 未定義フラグを用いた価値関数の動的初期化による強化学習の学習速度の改善
著者 福永 哲也 (岐阜工業高等専門学校)
論文 PDFファイル

題目 1D3-02 連続値入力に対応したProfit Sharingに基づく強化学習システム
著者 宮崎 和光 (独立行政法人大学評価・学位授与機構)
小林 重信 (東京工業大学総合理工学研究科知能システム科学専攻)
論文 PDFファイル

題目 1D3-03 ルーレット選択を用いたProfit Sharing強化学習における合理性についての一考察
著者 河合 宏和 (大阪市立大学,大阪市立大学)
辰巳 昭治 (大阪市立大学,大阪市立大学)
上野 敦志 (大阪市立大学,大阪市立大学)
論文 PDFファイル

題目 1D3-04 基底関数間相互作用に基づく状態空間自己組織化
著者 関野 正志 (東京工業大学知能システム科学専攻)
片上 大輔 (東京工業大学知能システム科学専攻)
新田 克己 (東京工業大学知能システム科学専攻)
論文 PDFファイル

題目 1D3-05 強化学習における自己組織化マップを用いた状態空間の自律的構成法
著者 岩崎 秀樹 (大分大学工学部)
末田 直道 (大分大学工学部)
論文 PDFファイル




/ プログラム / 発表一覧 / 著者一覧 / JSAI2005 ホーム