馬可夫決策
含有「馬可夫決策」共 1 篇內容
全部內容
發佈日期由新至舊
柴郡貓姍蒂的沙龍
2024/06/08
筆記-強化式學習名詞解釋:"回饋值"、"回報值"、"價值"
前言 最近開始讀《強化式學習:打造最強 AlphaZero 通用演算法》這本書,AlphaZero是AlphaGo的改良升級版,而AlphaGo打敗了世界頂尖圍棋棋士,這本書是在介紹AlphaZero使用的技術和演算法。這篇文章是筆記我在閱讀此書介紹"強化式學習"的篇幅時,遇到不懂的名詞解釋,上網
#
強化式學習
#
名詞解釋
#
閱讀筆記
10
留言