Yuta Sakashita

  • Citations Per Year
Learn More
In this paper, a novel concept is proposed where exploration, which is essential in reinforcement learning, is considered to be one aspect of the motions generated by the learner's internal dynamics and is expected to develop through learning towards more purposeful higher dynamic functions such as “thinking”. To realize such a concept, a(More)
[訂正内容] ・図3,図4,図5,図6は図の差し替えを行いました。 ・4ページ右コラム最後の段落の5行目 (訂正前) 8試行中2試行でゴールに到達した。その他の6試行も,100ステップで試行を終了しな ければ,1,000ステップ以内でゴールに到達した。 (訂正後) 8試行中3試行でゴールに到達した。その他の5試行も,100ステップで試行を終了しな ければ,2,000ステップ以内でゴールに到達した。 ・4ページ右コラム最後の段落の9行目 (訂正前) 最適ステップ数は9であるが,10-13ステップでゴールした。 (訂正前) 少し回り道をすることもあるが,より少ないステップ数でゴールした。 ・4ページ右コラム下から2行目 (訂正前) (訂正後) 10または 11ステップでゴール 10から 12ステップでゴール(More)
  • 1