強化學習

含有「強化學習」共 24 篇內容

全部內容

發佈日期由新至舊

2025/08/21

「人工智慧 +1」自學 Day4：類神經網路(Artificial Neural Networks, ANN)與深度學習(Deep Learning, DL) ▹類神經網路(Artificial Neural Networks, ANN) 1.發展 ▪︎ 概念：模仿生物神經元，對人類大腦

含 AI 應用內容

「人工智慧 +1」自學 Day3：強化學習 (Reinforcement Learning) 1. 強化學習的核心概念：訓練「強化學習」是機器學習中的第三種。前兩者是監督式學習、非監督式學習。強化學習與這兩者都不同，與其說是學習，更合適的概念是「訓練」：訓練模型建立特定的決策及採取行動模式。

含 AI 應用內容

#AI #ChatGPT #Gemini

Share-N-Do-U

2025/08/07

[帶著問題 | 找答案] 如何強化學習馴服迷惘和焦慮? 探索其他選擇

迷惘和焦慮，對我而言是可以透過學習被馴服的分享

#ShareNDoU #強化學習 #分享

Sylvia

2025/09/07

不論是用語言或是文字再次表達出來，我感覺都有助於再次梳理及記憶呢～而且多面向的去看見，也能讓人生更豐富多彩！

Joker

發文者

2025/09/09

Sylvia 非常認同!!!! 我自己是需要再用手寫或是其他方式記憶的人~ ( 還不見得記得住 ) 但我覺得我老大很厲害~ 他用說的就可以順便梳理然後記憶~ 對她甘拜下風~

付費限定

A.H.科普(pScience)

2025/06/28

躺平的睡眠學習

當你閱讀這篇文章時，你大腦中的神經元正在興奮。這一頁上的概念: 突觸、睡眠週期、學習規則等。。。正在你的大腦皮質中轉化為複雜的電化學波。此刻正在形成和修改的突觸連接，正在你的腦海中留下這篇科普的痕跡。但是，今晚當你入睡時，這些痕跡會發生什麼事？你的大腦會像一個流行的理論所認為的那樣。。。

5/5睡眠學習

#突觸 #脈衝時序依賴可塑性 #突觸穩態假說

❦ 莊小昕

2025/06/28

睡眠真的非常重要！！

A.H.

發文者

2025/06/29

❦ 莊小昕絕對!絕對! #好好睡~

付費限定

A.H.科普(pScience)

2025/06/12

海馬迴的科學之夢II: 時空地圖與獎勵地圖

上回在海馬迴的科學之夢I:嬰兒的記憶中聊到統計學習記憶和情景記憶，這次我們來細看史丹佛大學針對海馬迴中編碼時空和獎勵的最新發現。史丹佛的新聞稿(2025/06/11)使用了一個非常吸引人的標題「零食的位置存儲在專門的神經圖譜中」。。。

#海馬迴 #獎勵地圖 #時空地圖

李英華

2025/06/12

希望有一天失智能獲得醫治。

A.H.

發文者

2025/06/12

李英華一定一定會的！🤞！

付費限定

A.H.科普(pScience)

2025/05/02

AI向神經科學拜師學藝的故事

故事是從這裡開始的。科學這裡有兩組人，一群神經科學家，他們對我們腦袋裡的果凍內蘊藏的秘密很著迷。他們戳它，掃描它，觀察小火花飛來飛去，試圖弄清楚我們是如何思考，如何記住咖啡味道，如何決定躲避飛來的棒球。這群科學家描繪了經過數百萬年進化而來神經元間的私語、記憶的火花和學習的深層根源。。。

#科學家AI抱抱 #神經科學 #科學史

❦ 莊小昕

2025/05/02

謝謝小a分享，所以是青出於藍勝於藍？！😆😆

A.H.

發文者

2025/05/03

❦ 莊小昕對呀，對呀，是有這顏色～江山代有AI出，但能領風騷多少年？讓我們一起再觀察觀察喔 👀～

付費限定

TN科技筆記(TechNotes)的沙龍

2025/03/09

iPAS-初級AI應用規劃師-機器學習基本原理

機器學習（Machine Learning）是一種讓電腦從資料中學習並改進表現的技術，而無需人類逐一編寫具體指令。想像一下，你教一個小孩認識「貓」和「狗」，不是直接告訴他每張圖片的答案，而是給他看許多例子，讓他自己找出規律。這個想法最早由Arthur Sam

#人工智慧 #AI #AI應用規劃師

嘉冠談 AI

2025/02/17

跟著前 OpenAI 創始成員學習 ChatGPT 與 LLM 的運作原理

重點整理前 OpenAI 創始成員 Andrej Karpathy 的教學影片：Deep Dive into LLMs like ChatGPT，了解 LLM（大型語言模型）的運作原理，包含 LLM 基本架構與運作機制、訓練的三大階段、未來趨勢等。

#AI #LLM #OpenAI

林伯燊

2025/02/18

剛看完第一個小時，正評估要自己做筆記時，這篇文章拯救了我 😆 感謝作者這麼詳細整理! 立刻按讚收藏

蘇嘉冠 JiaKuan Su

發文者

2025/02/18

林伯燊有幫助到你就太好啦 😁

九日的文字廚房

2024/09/20

人工智慧與機器學習

這學期修了門機器學習原理，想知道AI最近在夯什麼。老師在講學習的型態時，介紹了一個有趣的型態：reinforcement learning，又稱為強化學習。這個學習模式應用在有名的電腦圍棋，Aphago訓練，以及Chat gpt 早期的訓練。reinforcement learning很有趣的地

#人類 #葬送的芙莉蓮 #AlphaGo

宇牛

2024/09/20

AI是累積⋯

九日

發文者

2024/09/20

宇牛他的累積可以像直接聯通共享，不過換個角度想，只要把母資料庫破壞，沒有備份的資料就會全部一起不見，共享有共享的風險，分開有分開的好處。

王啟樺的沙龍

2024/07/22

Bandit 004｜如何使用鞅集中不等式分析強盜演算法？

今天繼續聊聊由Yasin Abbasi-Yadkori [1] 於2011年發表的文章，《Improved Algorithms for Linear Stochastic Bandits》[2]。今天主要想討論在第11頁的Lemma 8， Yasin 展示了如何構造「超鞅 S

#強盜演算法 #鞅論 #數學

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌