「人工智慧 +1」自學 Day4：
類神經網路(Artificial Neural Networks, ANN)與深度學習(Deep Learning, DL) 



▹類神經網路(Artificial Neural Networks, ANN)

1.發展
▪︎ 概念：模仿生物神經元，對人類大腦

學習

親子與教育

職場

以行動支持創作者！付費即可解鎖

人工智慧 +1 自學

不是雞湯，但  是又如何

不是雞湯，但是  又如何

不是雞湯，但是又如何

神經

神經元

輸入

數據

人工智慧

結構

科學家

生物

大腦

Day4：類神經網路&深度學習

前言

跟上一篇文章一樣，都是看到陌生的演算法後，去搜尋資料記錄成文章。



正文

在強化式學習中，策略(Policy)指的是代理人根據目前的狀態決定下一個動作的方針，具體來說就是在某個狀態下採取某個動作的機率。Policy Gradient的目的是找到一個最優策略，使得整個任務的回報值最大化。

軟體開發

柴郡貓姍蒂的沙龍

筆記-強化式學習演算法簡介："Policy Gradient"

RL