/ プログラム / 発表一覧 / 著者一覧 / JSAI2005 ホーム

1D3-02 連続値入力に対応したProfit Sharingに基づく強化学習システム

6月15日(水) 15:10〜16:50 D会場
強化学習・基礎

演題番号1D3-02
題目連続値入力に対応したProfit Sharingに基づく強化学習システム
著者宮崎 和光 (独立行政法人大学評価・学位授与機構)
小林 重信 (東京工業大学総合理工学研究科知能システム科学専攻)
時間6月15日(水) 15:30〜15:50
概要著者らはこれまでいくつかのProfit Sharingに基づく強化学習システムを提案してきた。そこでは、つねに離散の入出力を前提としている。しかし実世界には状態間に位相が仮定できる問題が多く存在する。本稿では、そのような問題に対し、Profit Sharingに基づく強化学習システムを拡張するための方法を提案する。
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / JSAI2005 ホーム