QLearning
含有「QLearning」共 2 篇內容
全部內容
發佈日期由新至舊
newman的沙龍
2025/04/01
技術筆記-RL01-開始來爬「強化學習」這座山
Reinforcement Learning (強化學習) 的理論非常有趣,可能是因為其中許多方法,與人類的學習歷程極為相似,如試錯,獎懲,改進策略,持續優化等等。現在準備來爬這座山了,我把學習階段大致分成三個小山峰,依序為 Q-Learning --> DQN --> Actor-Critic,
#
QLearning
#
DQN
#
學習
4
2
柚子
2025/04/05
2
請問RL到最後是讓他自己透過自己的方式優化,在程式面除了定義一些更好的獎勵機制,還會去修改什麼部份的程式嗎🤔
2
newman
發文者
2025/04/06
1
柚子 對不起我不是專家,正在學習中,只知獎勵機制,狀態向量表示方式,還有學習率,探索率等等參數,都會劇烈影響績效,應該是會持續修改才對。當找到一個績效不錯的版本,應該也可以持續一段時間不改程式,只是我還沒到那程度。
1
Rene Wang的沙龍
2018/06/30
[探索] 門外漢的強化學習指南:A2CS 學習模型中的探索和竭盡難題
本文接續上篇直覺式強化學習教學,著重於解釋強化學習中常見的探索和竭盡難題,以及如何利用不同的方法來進行策略函式的學習,並與策略梯度做比較。同時,介紹 A2CS 所使用的損失函式,以及應用這個損失函示於深度學習時會遇到的訓練難題。最後,總結強化學習和深度學習的未來方向,以及本系列文章所企圖達到的目標。
#
人工智慧
#
強化學習
#
直覺式教學
2
留言