強化式學習

#強化式學習含有「強化式學習」共 1 篇內容
全部內容
發佈日期由新至舊
筆記-強化式學習名詞解釋:"回饋值"、"回報值"、"價值"前言 最近開始讀《強化式學習:打造最強 AlphaZero 通用演算法》這本書,AlphaZero是AlphaGo的改良升級版,而AlphaGo打敗了世界頂尖圍棋棋士,這本書是在介紹AlphaZero使用的技術和演算法。這篇文章是筆記我在閱讀此書介紹"強化式學習"的篇幅時,遇到不懂的名詞解釋,上網
2024-06-08
8