AlphaGo
含有「AlphaGo」共 67 篇內容
全部內容
發佈日期由新至舊
Hansen W的沙龍
2025/10/16
第三部《強化學習》69/100 模型型與無模型型強化學習比較 🏗 預測未來 vs 忠於當下!
模型型RL透過學習環境模型預測未來、樣本效率高但建模困難;無模型型RL僅依互動經驗學習、穩定實用但需大量資料。實務上常結合兩者,如Dyna-Q、MuZero。模型型適合可模擬任務,無模型型適合真實複雜環境,是強化學習發展的互補方向。
#
學習
#
模型
#
神經
喜歡
留言
EC3
2025/10/03
感知與決策迴圈
[感知]→[提供環境資訊]→[世界模型]→[預測結果]→[評估狀態與行動]→[價值函數]→[依據價值函數]→[做出策略]→[回歸感知] 這是一個非常精緻的認知與決策迴圈架構,看起來像是人工智慧或機器學習系統的運作流程。讓我幫你逐步解析這個迴圈的意涵,並補充一些可能的應用與象徵: 🧠 認知與決
含 AI 應用內容
#
3D
#
角色
#
加密貨幣
25
3
普普文創
2025/10/03
4
感覺上這跟商業邏輯很類似。
4
Hansen W的沙龍
2025/09/24
第三部《強化學習》35/100 Q-Learning 演算法 💪 強化學習的經典 off-policy 方法!
Q-Learning 是典型 Off-policy TD 控制演算法,核心在最大化未來回報。更新 Q 值時取下一狀態的最大估計值,即使當下行動非最優,仍能收斂至最優策略。適合自駕、金融、博弈等需高效率探索的任務。
#
學習
#
模型
#
神經
喜歡
留言
Hansen W的沙龍
2025/09/24
第三部《強化學習》23/100 從遊戲中學策略 🎮 AlphaGo 的基礎就是這個!
蒙地卡羅控制(MC Control)透過自我對弈與 ε-Greedy 探索,不斷更新 Q 值並改進策略,最終逼近最優策略。AlphaGo 早期即結合此方法與監督學習,從人類棋譜起步,再靠自我強化進化,展現 AI 從經驗中學習策略的威力。
#
學習
#
模型
#
神經
喜歡
留言
Hansen W的沙龍
2025/09/23
AI時代系列(3):第三部《強化學習 —— AI 的決策與進化》 🔍 導讀:走向智慧決策的巔峰之路
《強化學習 —— AI 的決策與進化》系統性介紹RL理論、演算法與應用,從MDP、Q-Learning到DQN、PPO與多智能體學習,並涵蓋自駕車、金融、工業等實戰案例,培養AI自主決策與未來應用能力。
#
學習
#
模型
#
神經
喜歡
留言
Hansen W的沙龍
2025/09/22
第二部:《深度學習》90/100 📌第九周小結與測驗:AI 經典 CartPole 🎮 訓練會「平衡木」的智慧體!
本單元總結深度強化學習核心概念,涵蓋 Q-Learning、DQN、探索與利用、Actor-Critic、AlphaGo、MARL 與 Gym 實作,並以 CartPole 平衡木示範 DQN 訓練流程,強調從理論到實踐的完整學習路徑。
#
學習
#
模型
#
環境
喜歡
留言
Hansen W的沙龍
2025/09/22
第二部:《深度學習》87/100 📌AlphaGo 的成功秘密 ♟ 蒙地卡羅樹搜尋 + 策略網路完美配合!
AlphaGo 結合策略網路、價值網路與蒙地卡羅樹搜尋(MCTS),實現精準決策與長期規劃。透過人類棋譜、自我對弈與強化學習多階段訓練,超越人類水準,並啟發 AlphaGo Zero、AlphaZero、MuZero 等通用強化學習架構,推動 AI 向自學與跨領域應用發展。
#
學習
#
模型
#
神經
1
留言
天地學堂
2025/09/17
讓你一口氣看完-人工智慧發展史
人工智慧源於20世紀初圖靈等人對計算與神經網絡的理論探索。1956年達特茅斯會議正式命名「人工智慧」,符號推理與專家系統興起,卻在1980年代因過度期待與技術瓶頸陷入「AI 冬天」。1990年代資料驅動與統計學習崛起,1997年深藍擊敗世界棋王成為象徵。
含 AI 應用內容
#
人工智慧
#
OpenAI
#
學習
喜歡
留言
不是雞湯,但是又如何
2025/08/20
Day3:強化學習
「人工智慧 +1」自學 Day3:強化學習 (Reinforcement Learning) 1. 強化學習的核心概念:訓練 「強化學習」是機器學習中的第三種。前兩者是監督式學習、非監督式學習。強化學習與這兩者都不同,與其說是學習,更合適的概念是「訓練」:訓練模型建立特定的決策及採取行動模式。
含 AI 應用內容
#
AI
#
ChatGPT
#
Gemini
喜歡
留言
想想 | Thoughtstream
2025/08/12
AI 基礎 2/ 6 | AI 如何從資料變聰明
AI 如數位偵探,透過演算法與資料集辨識模式,精準預測你的需求。
#
AI
#
科技
#
學習
喜歡
留言