強化學習
含有「強化學習」共 30 篇內容
全部內容
發佈日期由新至舊
WHITE LAB|白話實驗室的沙龍
2026/03/27
【茶水間 AI 實戰】第八卷 AI 為什麼越用越聰明?LoRA × RAG 外掛讓它不再亂講話
AI 為什麼會「越用越聰明」?其實關鍵不在模型本身,而在你是否幫它裝上正確的外掛。本篇從職場實戰出發,帶你看懂 LoRA 如何快速微調風格與知識,RAG 又如何讓 AI 即時讀取企業資料、避免胡說八道,並延伸到 ControlNet 與強化學習等核心技術。
含 AI 應用內容
#
生成式AI
#
RAG
#
LoRA
1
1
WHITE LAB|白話實驗室的沙龍
2026/03/19
【神機營 AI 實戰】第五篇:機關異術的內功修煉室——深度學習、強化學習與自監督修煉心法
神機營的新機關木人剛出爐時,其實只是毫無靈氣的頑木。要讓它們學會辨識與決策,關鍵在於「修煉心法」。本篇帶你走進神機營的內功修煉室,用武俠比喻拆解 AI 的學習方式:從深度學習的海量灌頂,到半監督與自監督的省力傳功,再到強化學習與對比學習的特訓之道,最後揭開元學習與 Prompt 引導的速成心法。
含 AI 應用內容
#
AI學習方式
#
深度學習
#
強化學習
1
1
WHITE LAB|白話實驗室的沙龍
2026/03/12
【茶水間 AI 實戰】第五卷:內功心法 AI 是怎麼學會思考的? 深度學習 × 強化學習 × 自監督學習解析
AI 剛出生只是一張白紙,它是怎麼變聰明的?本集帶你潛入 Brainstorm 的 AI 培訓中心,透過生動的職場情境劇,白話解碼 8 種 AI 必修「學習範式」!從深度學習、強化學習到自監督與提示學習,輕鬆搞懂模型背後的訓練邏輯與老闆的省錢妙招。文末還有實戰測驗,快來挑戰!
含 AI 應用內容
#
白話實驗室
#
AI學習範式
#
深度學習
喜歡
1
A.H.科普(pScience)
2026/03/12
多變多巴胺——第十一部:RPE和APE協同學習
多巴胺姑娘₯又來向各位請安了~ 這次她化身為大腦的「習慣教練」,每天盯著你說:再來一次!我們以為自己在做選擇,其實腦袋早就偷偷安排好劇本。多巴胺姑娘₯不只管獎勵,她還會在你重複動作時跳出來說:『嘿,這才是正確姿勢!』科學家叫它「動作預測誤差」,也可理解為「大腦的懶人捷徑」...
5/5
多巴胺學習
#
多巴胺姑娘₯
#
多巴胺
#
動作預測誤差
10
留言
付費限定
A.H.科普(pScience)
2025/11/19
化學無意識:雌激素如何和多巴胺合作,為學習譜寫秘密劇本?
我們常常為自身智力的自主性而感到自豪。我們學習、奮鬥、適應,似乎都基於對付出與回報的理性計算。然而,在有意識的決策表象之下,我們動機和記憶的本質結構卻在與一種強效卻常被誤解的化學信使,雌激素進行著持續而無聲的協商。 過去雌激素的研究主要集中在其在生殖系統中的作用,而多巴胺研究。。。
5/5
多巴胺獎勵學習
#
多巴胺獎勵學習
#
雌激素
#
獎勵預測誤差
23
留言
于正龍(Ricky)的沙龍
2025/11/11
獎勵信號讓 RL 策略快 100 倍
想像一下:一個精心設計的獎勵信號,能讓自主智能體在強化學習中學會複雜任務 快 100 倍。原本需要數百萬次試錯的過程,現在可能只需要數千次。 獎勵信號是 RL 的導航燈,指引智能體避開無效探索。沒有它,策略停滯不前,計算資源白白浪費。 數據說話 最新基準顯示: 精心設計的獎勵能讓策略收斂
#
強化學習
#
成功
#
設計
2
留言
不是雞湯,但是又如何
2025/08/21
Day4:類神經網路&深度學習
「人工智慧 +1」自學 Day4: 類神經網路(Artificial Neural Networks, ANN)與深度學習(Deep Learning, DL) ▹類神經網路(Artificial Neural Networks, ANN) 1.發展 ▪︎ 概念:模仿生物神經元,對人類大腦
含 AI 應用內容
#
ChatGPT
#
AI
#
Gemini
喜歡
留言
不是雞湯,但是又如何
2025/08/20
Day3:強化學習
「人工智慧 +1」自學 Day3:強化學習 (Reinforcement Learning) 1. 強化學習的核心概念:訓練 「強化學習」是機器學習中的第三種。前兩者是監督式學習、非監督式學習。強化學習與這兩者都不同,與其說是學習,更合適的概念是「訓練」:訓練模型建立特定的決策及採取行動模式。
含 AI 應用內容
#
AI
#
ChatGPT
#
Gemini
喜歡
留言
Share-N-Do-U
2025/08/07
[帶著問題 | 找答案] 如何強化學習馴服迷惘和焦慮? 探索其他選擇
迷惘和焦慮,對我而言是可以透過學習被馴服的分享
#
ShareNDoU
#
強化學習
#
分享
12
12
Sylvia
2025/09/07
1
1
Joker
發文者
2025/09/09
1
1
付費限定
A.H.科普(pScience)
2025/06/28
躺平的睡眠學習
當你閱讀這篇文章時,你大腦中的神經元正在興奮。這一頁上的概念: 突觸、睡眠週期、學習規則等。。。正在你的大腦皮質中轉化為複雜的電化學波。此刻正在形成和修改的突觸連接,正在你的腦海中留下這篇科普的痕跡。但是,今晚當你入睡時,這些痕跡會發生什麼事?你的大腦會像一個流行的理論所認為的那樣。。。
5/5
睡眠學習
#
突觸
#
脈衝時序依賴可塑性
#
突觸穩態假說
22
4
❦ 莊小昕
2025/06/28
2
2
A.H.
發文者
2025/06/29
2
2