【AI 人工智慧】強化學習(Reinforcement learning)

閱讀時間約 1 分鐘
強化學習
強化學習(Reinforcement learning)是機器學習的一個分支,它被廣泛應用於博奕、控制學、金融等多個領域,其概念主要是藉由讓智能體與環境做互動,並在過程中給予正負向的回饋來讓電腦不斷修正行為,進而學會做動態之決策。
舉個稍微生活化一點的例子吧!假設有一個學生(智能體)上課非常的吵鬧,這時候老師(環境)可能就會懲罰他並要求他下次改進行為(負向回饋),而學生也因為受到老師的責罰而未來會避免類似的事情再發生,反過來說,如果學生考試考高分,老師則給予他極大的獎勵(正向回饋),那學生也因此知道原來在學校裡就是要乖乖唸書考高分阿!藉由這樣一連串的正/負向的回饋,最終學生的行為就會漸漸的朝著老師所設定的方向去進行!
強化學習最著名的經典案例莫過於Google DeepMind公司於2014年所開發的下圍棋軟體AlphaGo了,AlphaGo結合了深度學習以及強化學習兩個機器學習的方法,使得電腦可以在下圍棋方面戰勝人類的棋王,這件事情到底有多難呢?根據計算,相比於其他棋類比賽,圍棋是被公認為難度最高棋類比賽,可見要開發出如AlphaGo這樣的圍棋軟體真的是不容易阿!
此外,由於AlphaGo在學習的過程中是沒有老師指導的,所以在下圍棋的過程中,也下出了人類未曾發現的下棋方法,這震憾了整個下圍棋的領域,或許未來我們可能還需要反過來像電腦學習討教吧!
總之,強化學習真的是一個備受關注的領域,或許哪天我們能賦予身旁的所有東西足夠的智慧,來讓人類的生活愈來愈便利阿!
*本文由知名AI講師-Isaac Lee 李厚均所撰寫 文章轉載自我們共同經營的粉絲頁-小李談數智https://www.facebook.com/isaac60103
更多圖解內容可以到 耀西圖像視覺化教室看看https://www.facebook.com/YoshiGraphics
為什麼會看到廣告
11會員
33內容數
留言0
查看全部
發表第一個留言支持創作者!
你可能也想看
AI人工智慧最新消息:從野生動物保護到醫療和農業的創新突破AI人工智慧不斷改變我們的世界,文章講述包含透過AI科技監控系統,追蹤鐵軌附近的大象活動,防止因火車撞擊而死亡。運用AI人工智慧工具臨床試驗,為憂鬱症患者提供更精準藥物治療,以及透過AI人工智慧產出的無人駕駛拖拉機,使農民提供農業效率並永續土地,讓我們一同探索AI人工智慧正快速改變的產業。
Thumbnail
avatar
未來巢 | 數位轉型 x 數位科技 xAI應用
2024-05-28
【0528盤前新聞】輝達執行長黃仁勳傳見總統打造 AI 島;景氣趨熱!4月亮出黃紅燈 人工智慧商機推升出口提供每日臺股市場動態和焦點事件,包括國際市場動態、總體經濟與產業新聞、以及前一交易日盤勢與焦點。歡迎訂閱「米勒投資沙龍」以瞭解更多臺股投資資訊。
Thumbnail
avatar
Miller
2024-05-27
AI人工智慧:開發、優勢與應用創新在當今數位時代,AI人工智慧正成為引領未來的關鍵技術之一。AI的發展不僅改變了我們與科技互動的方式,還深刻地塑造了社會、經濟和文化的格局。以下將探討AI的定義、開發階段和其帶來的優勢。
Thumbnail
avatar
一灘爛泥
2024-02-15
ai人工智慧概念股精選-原相 》2024新光證券開戶優質平台沒想到路上就有櫻花大景!南投信義鄉的「觀山休息區」,現場種有40多棵桃紅色山櫻花樹,沿著台21線都可賞絕美櫻花景,夜晚雲海繚繞時,還有機會拍到夜櫻琉璃光! 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(圖/molly888666) 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(
avatar
金色迷霧
2024-02-11
最強第二大腦Perplexity AI!導入AI人工智慧的搜尋引擎🤩想要使用AI來快速了解一支股票! 卻受限於在2021年9月就停止更新資料庫的免費版ChatGPT? 本集Gary分析師要介紹ChatGPT和Google的合體! 最強第二大腦Perplexity AI! 一起來看看吧🧙
Thumbnail
avatar
ACY證券
2023-10-04
AI人工智慧浪潮下的選股(類股分析)墜落雲端的彈起 去(2022)年1月5日台股迎來了18,619點的高點,隨著不再出現塞港、重複下單、清庫存等議題,接著通膨過高引來的3月升息潮,股市一路震盪走跌。 去年10月25日台股的近期最低點12,629點,跌破1990年的12,682點。 隨著升息逐漸進入尾聲,清庫存的腳步也可以預期,加上股市
Thumbnail
avatar
Jackie Chien
2023-02-14
ARK研究報告-Big ideas2022-AI人工智慧篇#14大家的乾媽(2020限定版)-凱瑟琳伍德的ARK基金公司每年都會提出對於未來5-10年的科技大趨勢研究報告,雖然目前ARK們的績效從2021年開始就積弱不振許久,但是ARK的研究仍是具有前瞻性、值得一讀的。ARK認為現在的投資,在未來五年後才是收割的時候。
Thumbnail
avatar
Steve觀察筆記
2022-03-19
「AI人工智慧是人類之友還是敵人?」科幻神劇西方極樂園教我們的事(2)AI人工智慧是人類之友還是敵人? 其實《西》片主要環繞在在未來人工智能已經和人類真假不分的時代,AI人究竟是人類「玩樂的工具」,還是同樣享有生命權、思想自由及天賦人權的種族?抑或是處於人類對立面的天敵?我認為這也是編劇試著透過此劇跟現代人探討的。 在科技日新月異的今天,我們不知道有哪天會再出現賈伯斯
Thumbnail
avatar
莊凱仲 Ivan
2021-11-20
人類智慧真正優於AI電腦圍棋之處為何?─學習的本質(15)作者:陳華夫 AI人工智慧不如人類智慧的地方有三點:(1)它的「演算法」(algorithm)只能建構規則,而人類卻可建構解釋規則的理論。(2)它無法處理兩三個地方的「聯立」利益,這需要長遠的「大局觀」。(3)它無法吸取失敗的教訓,反敗為勝。(4)電腦圍棋有打劫的盲點。
Thumbnail
avatar
陳華夫hwafuchen
2021-11-13