探索和竭盡難題
含有「探索和竭盡難題」共 1 篇內容
全部內容
發佈日期由新至舊
Rene Wang的沙龍
2018/06/30
[探索] 門外漢的強化學習指南:A2CS 學習模型中的探索和竭盡難題
本文接續上篇直覺式強化學習教學,著重於解釋強化學習中常見的探索和竭盡難題,以及如何利用不同的方法來進行策略函式的學習,並與策略梯度做比較。同時,介紹 A2CS 所使用的損失函式,以及應用這個損失函示於深度學習時會遇到的訓練難題。最後,總結強化學習和深度學習的未來方向,以及本系列文章所企圖達到的目標。
#
人工智慧
#
強化學習
#
直覺式教學
2
留言