【AI 人工智慧】強化學習(Reinforcement learning)

閱讀時間約 1 分鐘
強化學習
強化學習(Reinforcement learning)是機器學習的一個分支,它被廣泛應用於博奕、控制學、金融等多個領域,其概念主要是藉由讓智能體與環境做互動,並在過程中給予正負向的回饋來讓電腦不斷修正行為,進而學會做動態之決策。
舉個稍微生活化一點的例子吧!假設有一個學生(智能體)上課非常的吵鬧,這時候老師(環境)可能就會懲罰他並要求他下次改進行為(負向回饋),而學生也因為受到老師的責罰而未來會避免類似的事情再發生,反過來說,如果學生考試考高分,老師則給予他極大的獎勵(正向回饋),那學生也因此知道原來在學校裡就是要乖乖唸書考高分阿!藉由這樣一連串的正/負向的回饋,最終學生的行為就會漸漸的朝著老師所設定的方向去進行!
強化學習最著名的經典案例莫過於Google DeepMind公司於2014年所開發的下圍棋軟體AlphaGo了,AlphaGo結合了深度學習以及強化學習兩個機器學習的方法,使得電腦可以在下圍棋方面戰勝人類的棋王,這件事情到底有多難呢?根據計算,相比於其他棋類比賽,圍棋是被公認為難度最高棋類比賽,可見要開發出如AlphaGo這樣的圍棋軟體真的是不容易阿!
此外,由於AlphaGo在學習的過程中是沒有老師指導的,所以在下圍棋的過程中,也下出了人類未曾發現的下棋方法,這震憾了整個下圍棋的領域,或許未來我們可能還需要反過來像電腦學習討教吧!
總之,強化學習真的是一個備受關注的領域,或許哪天我們能賦予身旁的所有東西足夠的智慧,來讓人類的生活愈來愈便利阿!
*本文由知名AI講師-Isaac Lee 李厚均所撰寫 文章轉載自我們共同經營的粉絲頁-小李談數智https://www.facebook.com/isaac60103
更多圖解內容可以到 耀西圖像視覺化教室看看https://www.facebook.com/YoshiGraphics
為什麼會看到廣告
11會員
33Content count
留言0
查看全部
發表第一個留言支持創作者!
Liao Yoshi的沙龍 的其他內容
在機器學習裡面,為了要追求更好的表現,我們除了要選出最適當的演算法來應對不同場景外,同時,在將原始資料蒐集好後,我們該如何從中萃取出重要且有用的資訊,是非常重要的一件事情,這就是所謂的”特徵工程”,今天我們就來針對這個主題談談吧...
隨著FinTech熱潮興起,人工智慧如何應用在金融領域往往是許多人關注的焦點之一。由於金融業的資料量非常的大,使得能導入的應用也非常多元,今天我們來介紹一個AI在金融領域之應用:機器人理財。
儘管大家對於人工智慧各種面向有著非常多不同的看法,但若說到人工智慧實力的劃分,一般我們常把它分成三個等級,狹義人工智慧、廣義人工智、以及超級人工智慧...
儘管深度學習這陣子非常的成功,效果也非常的好, 但每次提到它美中不足的地方時,可解釋性總是被拿來評論一番。今天,我們來針對模型的”可解釋性”這樣一個議題做深入的討論。所謂的「可解釋性」,就是當人工智慧演算法做決策的時候,我們是否能夠清楚了解為什麼電腦會做這樣一個決策以及判斷...
在雙11節慶,大家是否已經準備要好好血拼一番了呢?在這特別的日子裡,不知道有沒有人注意到,為了讓消費者有更好的體驗,不少廠商、送貨人員、工程師等可說是忙得不可開交呢!有鑑於此,電商龍頭阿里巴巴便想要去找尋增加每個環節效率的方法,而當中最著名的例子之一,莫過於他們將AI的技術...
今天我們來談談什麼叫作「邊緣運算」(Edge computing)? 在傳統情況下,我們常將各式各樣的感應器佈在不同應用中並隨時把所有的資料上傳至雲端伺服器做處理。然而,網路的傳輸需要時間,所以在許多被要求低延遲的應用當中,這樣的架構不一定適合...
在機器學習裡面,為了要追求更好的表現,我們除了要選出最適當的演算法來應對不同場景外,同時,在將原始資料蒐集好後,我們該如何從中萃取出重要且有用的資訊,是非常重要的一件事情,這就是所謂的”特徵工程”,今天我們就來針對這個主題談談吧...
隨著FinTech熱潮興起,人工智慧如何應用在金融領域往往是許多人關注的焦點之一。由於金融業的資料量非常的大,使得能導入的應用也非常多元,今天我們來介紹一個AI在金融領域之應用:機器人理財。
儘管大家對於人工智慧各種面向有著非常多不同的看法,但若說到人工智慧實力的劃分,一般我們常把它分成三個等級,狹義人工智慧、廣義人工智、以及超級人工智慧...
儘管深度學習這陣子非常的成功,效果也非常的好, 但每次提到它美中不足的地方時,可解釋性總是被拿來評論一番。今天,我們來針對模型的”可解釋性”這樣一個議題做深入的討論。所謂的「可解釋性」,就是當人工智慧演算法做決策的時候,我們是否能夠清楚了解為什麼電腦會做這樣一個決策以及判斷...
在雙11節慶,大家是否已經準備要好好血拼一番了呢?在這特別的日子裡,不知道有沒有人注意到,為了讓消費者有更好的體驗,不少廠商、送貨人員、工程師等可說是忙得不可開交呢!有鑑於此,電商龍頭阿里巴巴便想要去找尋增加每個環節效率的方法,而當中最著名的例子之一,莫過於他們將AI的技術...
今天我們來談談什麼叫作「邊緣運算」(Edge computing)? 在傳統情況下,我們常將各式各樣的感應器佈在不同應用中並隨時把所有的資料上傳至雲端伺服器做處理。然而,網路的傳輸需要時間,所以在許多被要求低延遲的應用當中,這樣的架構不一定適合...
你可能也想看
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
AI人工智慧不斷改變我們的世界,文章講述包含透過AI科技監控系統,追蹤鐵軌附近的大象活動,防止因火車撞擊而死亡。運用AI人工智慧工具臨床試驗,為憂鬱症患者提供更精準藥物治療,以及透過AI人工智慧產出的無人駕駛拖拉機,使農民提供農業效率並永續土地,讓我們一同探索AI人工智慧正快速改變的產業。
Thumbnail
提供每日臺股市場動態和焦點事件,包括國際市場動態、總體經濟與產業新聞、以及前一交易日盤勢與焦點。歡迎訂閱「米勒投資沙龍」以瞭解更多臺股投資資訊。
Thumbnail
在當今數位時代,AI人工智慧正成為引領未來的關鍵技術之一。AI的發展不僅改變了我們與科技互動的方式,還深刻地塑造了社會、經濟和文化的格局。以下將探討AI的定義、開發階段和其帶來的優勢。
沒想到路上就有櫻花大景!南投信義鄉的「觀山休息區」,現場種有40多棵桃紅色山櫻花樹,沿著台21線都可賞絕美櫻花景,夜晚雲海繚繞時,還有機會拍到夜櫻琉璃光! 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(圖/molly888666) 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(
Thumbnail
想要使用AI來快速了解一支股票! 卻受限於在2021年9月就停止更新資料庫的免費版ChatGPT? 本集Gary分析師要介紹ChatGPT和Google的合體! 最強第二大腦Perplexity AI! 一起來看看吧🧙
Thumbnail
墜落雲端的彈起 去(2022)年1月5日台股迎來了18,619點的高點,隨著不再出現塞港、重複下單、清庫存等議題,接著通膨過高引來的3月升息潮,股市一路震盪走跌。 去年10月25日台股的近期最低點12,629點,跌破1990年的12,682點。 隨著升息逐漸進入尾聲,清庫存的腳步也可以預期,加上股市
Thumbnail
大家的乾媽(2020限定版)-凱瑟琳伍德的ARK基金公司每年都會提出對於未來5-10年的科技大趨勢研究報告,雖然目前ARK們的績效從2021年開始就積弱不振許久,但是ARK的研究仍是具有前瞻性、值得一讀的。ARK認為現在的投資,在未來五年後才是收割的時候。
Thumbnail
AI人工智慧是人類之友還是敵人? 其實《西》片主要環繞在在未來人工智能已經和人類真假不分的時代,AI人究竟是人類「玩樂的工具」,還是同樣享有生命權、思想自由及天賦人權的種族?抑或是處於人類對立面的天敵?我認為這也是編劇試著透過此劇跟現代人探討的。 在科技日新月異的今天,我們不知道有哪天會再出現賈伯斯
Thumbnail
作者:陳華夫 AI人工智慧不如人類智慧的地方有三點:(1)它的「演算法」(algorithm)只能建構規則,而人類卻可建構解釋規則的理論。(2)它無法處理兩三個地方的「聯立」利益,這需要長遠的「大局觀」。(3)它無法吸取失敗的教訓,反敗為勝。(4)電腦圍棋有打劫的盲點。
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
AI人工智慧不斷改變我們的世界,文章講述包含透過AI科技監控系統,追蹤鐵軌附近的大象活動,防止因火車撞擊而死亡。運用AI人工智慧工具臨床試驗,為憂鬱症患者提供更精準藥物治療,以及透過AI人工智慧產出的無人駕駛拖拉機,使農民提供農業效率並永續土地,讓我們一同探索AI人工智慧正快速改變的產業。
Thumbnail
提供每日臺股市場動態和焦點事件,包括國際市場動態、總體經濟與產業新聞、以及前一交易日盤勢與焦點。歡迎訂閱「米勒投資沙龍」以瞭解更多臺股投資資訊。
Thumbnail
在當今數位時代,AI人工智慧正成為引領未來的關鍵技術之一。AI的發展不僅改變了我們與科技互動的方式,還深刻地塑造了社會、經濟和文化的格局。以下將探討AI的定義、開發階段和其帶來的優勢。
沒想到路上就有櫻花大景!南投信義鄉的「觀山休息區」,現場種有40多棵桃紅色山櫻花樹,沿著台21線都可賞絕美櫻花景,夜晚雲海繚繞時,還有機會拍到夜櫻琉璃光! 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(圖/molly888666) 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(
Thumbnail
想要使用AI來快速了解一支股票! 卻受限於在2021年9月就停止更新資料庫的免費版ChatGPT? 本集Gary分析師要介紹ChatGPT和Google的合體! 最強第二大腦Perplexity AI! 一起來看看吧🧙
Thumbnail
墜落雲端的彈起 去(2022)年1月5日台股迎來了18,619點的高點,隨著不再出現塞港、重複下單、清庫存等議題,接著通膨過高引來的3月升息潮,股市一路震盪走跌。 去年10月25日台股的近期最低點12,629點,跌破1990年的12,682點。 隨著升息逐漸進入尾聲,清庫存的腳步也可以預期,加上股市
Thumbnail
大家的乾媽(2020限定版)-凱瑟琳伍德的ARK基金公司每年都會提出對於未來5-10年的科技大趨勢研究報告,雖然目前ARK們的績效從2021年開始就積弱不振許久,但是ARK的研究仍是具有前瞻性、值得一讀的。ARK認為現在的投資,在未來五年後才是收割的時候。
Thumbnail
AI人工智慧是人類之友還是敵人? 其實《西》片主要環繞在在未來人工智能已經和人類真假不分的時代,AI人究竟是人類「玩樂的工具」,還是同樣享有生命權、思想自由及天賦人權的種族?抑或是處於人類對立面的天敵?我認為這也是編劇試著透過此劇跟現代人探討的。 在科技日新月異的今天,我們不知道有哪天會再出現賈伯斯
Thumbnail
作者:陳華夫 AI人工智慧不如人類智慧的地方有三點:(1)它的「演算法」(algorithm)只能建構規則,而人類卻可建構解釋規則的理論。(2)它無法處理兩三個地方的「聯立」利益,這需要長遠的「大局觀」。(3)它無法吸取失敗的教訓,反敗為勝。(4)電腦圍棋有打劫的盲點。