柴郡貓姍蒂的沙龍

48會員數
24內容數
目前沒有沙龍簡介

精選內容

前言 最近在研究GAT,在網路上看到使用torch和DGL實作的GAT模型的程式碼,就想說下載下來自己跑跑看,這篇文章:Understand Graph Attention Network。途中遇到問題,把找到的解法記錄下來,給也有一樣問題的朋友參考。 正文 在Colab直接使用: !p
前言 跟上一篇文章一樣,都是看到陌生的演算法後,去搜尋資料記錄成文章。 正文 在強化式學習中,策略(Policy)指的是代理人根據目前的狀態決定下一個動作的方針,具體來說就是在某個狀態下採取某個動作的機率。Policy Gradient的目的是找到一個最優策略,使得整個任務的回報值最大化。
前言 其實摸機器學習、深度學習也有一陣子了,雖然大致上都理解,不過有些細節若不是那麼清楚,我也沒仔細去弄懂。今天剛好在《強化式學習:打造最強 AlphaZero 通用演算法》這本書看到之前略過的幾個名詞,書中有解釋其背後代表的東西的功能,在此記錄下來,以後又忘掉時可回來查看。 正文 "激活

擁有者

一個工程師;喜歡畫畫、閱讀和書寫,同時也是一個自以為的插畫家。常將自己化為畫中的貓,比擬愛麗絲夢遊仙境裡的柴郡貓,想些、做些奇怪的事。歡迎聯繫:[email protected]
追蹤最新動態, 和 48 位同樣興趣愛好的人一起交流