DQN
含有「DQN」共 1 篇內容
全部內容
發佈日期由新至舊
newman的沙龍
2025/04/01
技術筆記-RL01-開始來爬「強化學習」這座山
Reinforcement Learning (強化學習) 的理論非常有趣,可能是因為其中許多方法,與人類的學習歷程極為相似,如試錯,獎懲,改進策略,持續優化等等。現在準備來爬這座山了,我把學習階段大致分成三個小山峰,依序為 Q-Learning --> DQN --> Actor-Critic,
#
QLearning
#
DQN
#
學習
4
2
柚子
2025/04/05
2
請問RL到最後是讓他自己透過自己的方式優化,在程式面除了定義一些更好的獎勵機制,還會去修改什麼部份的程式嗎🤔
2
newman
發文者
2025/04/06
1
柚子 對不起我不是專家,正在學習中,只知獎勵機制,狀態向量表示方式,還有學習率,探索率等等參數,都會劇烈影響績效,應該是會持續修改才對。當找到一個績效不錯的版本,應該也可以持續一段時間不改程式,只是我還沒到那程度。
1