RL
含有「RL」共 2 篇內容
全部內容
發佈日期由新至舊
不是雞湯,但是又如何
2025/08/21
Day4:類神經網路&深度學習
「人工智慧 +1」自學 Day4: 類神經網路(Artificial Neural Networks, ANN)與深度學習(Deep Learning, DL) ▹類神經網路(Artificial Neural Networks, ANN) 1.發展 ▪︎ 概念:模仿生物神經元,對人類大腦
含 AI 應用內容
#
ChatGPT
#
AI
#
Gemini
喜歡
留言
柴郡貓姍蒂的沙龍
2024/10/09
筆記-強化式學習演算法簡介:"Policy Gradient"
前言 跟上一篇文章一樣,都是看到陌生的演算法後,去搜尋資料記錄成文章。 正文 在強化式學習中,策略(Policy)指的是代理人根據目前的狀態決定下一個動作的方針,具體來說就是在某個狀態下採取某個動作的機率。Policy Gradient的目的是找到一個最優策略,使得整個任務的回報值最大化。
#
PolicyGradient
#
AI
#
人工智慧
22
留言