【AI 人工智慧】強化學習(Reinforcement learning)

更新於 發佈於 閱讀時間約 2 分鐘
raw-image

強化學習(Reinforcement learning)是機器學習的一個分支,它被廣泛應用於博奕、控制學、金融等多個領域,其概念主要是藉由讓智能體與環境做互動,並在過程中給予正負向的回饋來讓電腦不斷修正行為,進而學會做動態之決策。

舉個稍微生活化一點的例子吧!假設有一個學生(智能體)上課非常的吵鬧,這時候老師(環境)可能就會懲罰他並要求他下次改進行為(負向回饋),而學生也因為受到老師的責罰而未來會避免類似的事情再發生,反過來說,如果學生考試考高分,老師則給予他極大的獎勵(正向回饋),那學生也因此知道原來在學校裡就是要乖乖唸書考高分阿!藉由這樣一連串的正/負向的回饋,最終學生的行為就會漸漸的朝著老師所設定的方向去進行!

強化學習最著名的經典案例莫過於Google DeepMind公司於2014年所開發的下圍棋軟體AlphaGo了,AlphaGo結合了深度學習以及強化學習兩個機器學習的方法,使得電腦可以在下圍棋方面戰勝人類的棋王,這件事情到底有多難呢?根據計算,相比於其他棋類比賽,圍棋是被公認為難度最高棋類比賽,可見要開發出如AlphaGo這樣的圍棋軟體真的是不容易阿!

此外,由於AlphaGo在學習的過程中是沒有老師指導的,所以在下圍棋的過程中,也下出了人類未曾發現的下棋方法,這震憾了整個下圍棋的領域,或許未來我們可能還需要反過來像電腦學習討教吧!

總之,強化學習真的是一個備受關注的領域,或許哪天我們能賦予身旁的所有東西足夠的智慧,來讓人類的生活愈來愈便利阿!

*本文由知名AI講師-Isaac Lee 李厚均所撰寫 文章轉載自我們共同經營的粉絲頁-小李談數智https://www.facebook.com/isaac60103

更多圖解內容可以到 耀西圖像視覺化教室看看https://www.facebook.com/YoshiGraphics

留言
avatar-img
留言分享你的想法!
avatar-img
Liao Yoshi的沙龍
12會員
33內容數
Liao Yoshi的沙龍的其他內容
2020/11/17
說到人工智慧對於汽車產業的變革,那就不得不提我們時常聽到的自駕車的應用,但大家知道許多知名自駕車廠商裡的防撞系統,都源自於一家非常有名的以色列公司嗎?今天我們就來好好介紹一下這家公司吧!
Thumbnail
2020/11/17
說到人工智慧對於汽車產業的變革,那就不得不提我們時常聽到的自駕車的應用,但大家知道許多知名自駕車廠商裡的防撞系統,都源自於一家非常有名的以色列公司嗎?今天我們就來好好介紹一下這家公司吧!
Thumbnail
2020/11/17
提到這幾年AI人工智慧會那麼火紅的原因,就不得不提”深度學習”*這個領域的重大突破及創新,使得原本被冷落好一陣子的人工智慧又再次興起,都要歸功於 Geoffrey Hinton 這個被稱作「Deep Learning”之父的人...
Thumbnail
2020/11/17
提到這幾年AI人工智慧會那麼火紅的原因,就不得不提”深度學習”*這個領域的重大突破及創新,使得原本被冷落好一陣子的人工智慧又再次興起,都要歸功於 Geoffrey Hinton 這個被稱作「Deep Learning”之父的人...
Thumbnail
2020/11/17
「有時候,被世人遺棄的人,才能成就讓人想像不到的大事。」(*),相信看過電影”模仿遊戲”的人應該對這句話不陌生吧!這是由20世纪最偉大的科學家之一艾倫.圖靈(Alan Turing)曾說過的名言。那麼這個被稱為是計算機科學之父以及人工智慧之父的天才到底是怎麼樣一個人呢?
Thumbnail
2020/11/17
「有時候,被世人遺棄的人,才能成就讓人想像不到的大事。」(*),相信看過電影”模仿遊戲”的人應該對這句話不陌生吧!這是由20世纪最偉大的科學家之一艾倫.圖靈(Alan Turing)曾說過的名言。那麼這個被稱為是計算機科學之父以及人工智慧之父的天才到底是怎麼樣一個人呢?
Thumbnail
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
AlphaGo 的開發,讓人工智慧在圍棋的研究讓更多人被看到,也看到它成熟的結果。現代的圍棋教學和棋手訓練,也或多或少會借鏡各類的AI系統做學習。然而,教學的歷程,過度追求AI的棋步和棋法,有時會讓小朋友難以理解。一步登天的方式,有時反而會讓同學走得更坎坷。
Thumbnail
AlphaGo 的開發,讓人工智慧在圍棋的研究讓更多人被看到,也看到它成熟的結果。現代的圍棋教學和棋手訓練,也或多或少會借鏡各類的AI系統做學習。然而,教學的歷程,過度追求AI的棋步和棋法,有時會讓小朋友難以理解。一步登天的方式,有時反而會讓同學走得更坎坷。
Thumbnail
不難發現大語言模型能對生產力與學習帶來許多幫助,未來教育型 AI 機器人很大機率將會成為主流,使用 AI 輔助學習、即時從 AI 獲得解答、利用 AI 學習新技能都會是新的學習場景。根據教育市調機構 HolonIQ 過去的報告顯示全球教育人工智能的投入預計 2025 年將達 60 億。
Thumbnail
不難發現大語言模型能對生產力與學習帶來許多幫助,未來教育型 AI 機器人很大機率將會成為主流,使用 AI 輔助學習、即時從 AI 獲得解答、利用 AI 學習新技能都會是新的學習場景。根據教育市調機構 HolonIQ 過去的報告顯示全球教育人工智能的投入預計 2025 年將達 60 億。
Thumbnail
一個人雖然較有彈性,但獨立從 0 ->1 製作全線上課程非常耗費時間。我如果不會影分身之術,大概要等很久很久啊~也就是說,根本就很難做到。但最近有了 ChatGPT 這個好朋友和我組成超能團隊,做了一些有趣的嘗試,玩的過程讓我有了一些信心,這邊分享測試用的 prompts 與過程。
Thumbnail
一個人雖然較有彈性,但獨立從 0 ->1 製作全線上課程非常耗費時間。我如果不會影分身之術,大概要等很久很久啊~也就是說,根本就很難做到。但最近有了 ChatGPT 這個好朋友和我組成超能團隊,做了一些有趣的嘗試,玩的過程讓我有了一些信心,這邊分享測試用的 prompts 與過程。
Thumbnail
如果你是教職人員或是與教育領域密切相關的從業人員,應該現在都會面臨108課綱的實施加上今年生成式AI爆炸性的發展,要如何實際運用去達到在必修課程之外,能夠培養學生的獨立思考、發現及解決問題的能力?
Thumbnail
如果你是教職人員或是與教育領域密切相關的從業人員,應該現在都會面臨108課綱的實施加上今年生成式AI爆炸性的發展,要如何實際運用去達到在必修課程之外,能夠培養學生的獨立思考、發現及解決問題的能力?
Thumbnail
學校老師如何因應 ChatGPT 等生成式AI帶來的衝擊 隨著科技的快速發展,生成式AI已經成為了教育領域的一個熱門話題。這種新興技術對國中國小教育有著潛在的重大影響,老師們需要積極面對並適應這一變革。本文將探討老師如何因應生成式AI帶來的衝擊,以及學校如何在實際應用中踏出第一步。
Thumbnail
學校老師如何因應 ChatGPT 等生成式AI帶來的衝擊 隨著科技的快速發展,生成式AI已經成為了教育領域的一個熱門話題。這種新興技術對國中國小教育有著潛在的重大影響,老師們需要積極面對並適應這一變革。本文將探討老師如何因應生成式AI帶來的衝擊,以及學校如何在實際應用中踏出第一步。
Thumbnail
本文將從心理學的角度探討AI對人類學習的啟發,希望能為大家提供一些新的思考方向。
Thumbnail
本文將從心理學的角度探討AI對人類學習的啟發,希望能為大家提供一些新的思考方向。
Thumbnail
「AI應用,似乎離我的工作情境,越來越接近了呢」 幾乎是無所遁形在我們的日常&工作中。 靈感觸發、寫作編修、帳務管理、伴侶養成、占卜解惑、自主學習、教學設計、旅遊安排、時間管理、音樂創作、角色扮演、故事撰寫、渣男生成、議題思考、簡報速成、閱讀摘要⋯⋯ 讓我開始思索,人,究竟還要做些什麼⋯⋯
Thumbnail
「AI應用,似乎離我的工作情境,越來越接近了呢」 幾乎是無所遁形在我們的日常&工作中。 靈感觸發、寫作編修、帳務管理、伴侶養成、占卜解惑、自主學習、教學設計、旅遊安排、時間管理、音樂創作、角色扮演、故事撰寫、渣男生成、議題思考、簡報速成、閱讀摘要⋯⋯ 讓我開始思索,人,究竟還要做些什麼⋯⋯
Thumbnail
作者:陳華夫 AI深度學習的圖像識別、人臉辨識、機器翻譯、及自動駕駛都有比人類優勢創新之處。深度學習無法學得抽象的概念知識,因此無法遷移學習(TL),但人類的學習卻可以學習遷移(ToL),因此人類擁有通用智慧。
Thumbnail
作者:陳華夫 AI深度學習的圖像識別、人臉辨識、機器翻譯、及自動駕駛都有比人類優勢創新之處。深度學習無法學得抽象的概念知識,因此無法遷移學習(TL),但人類的學習卻可以學習遷移(ToL),因此人類擁有通用智慧。
Thumbnail
作者:陳華夫 強化學習裡最後學習的成果─價值函數 Vπ(s)─就被記憶在40模塊或20模塊組成的殘差網絡中的千千萬萬個數學參數裡,人類的大腦把輸入的資訊編碼成故事基模(Schema),再整合編織故事基模而成為的「腦神經網絡」。如此的記憶及知識之構造有利於人類的記憶、解釋、理解、思考、及學習新知。
Thumbnail
作者:陳華夫 強化學習裡最後學習的成果─價值函數 Vπ(s)─就被記憶在40模塊或20模塊組成的殘差網絡中的千千萬萬個數學參數裡,人類的大腦把輸入的資訊編碼成故事基模(Schema),再整合編織故事基模而成為的「腦神經網絡」。如此的記憶及知識之構造有利於人類的記憶、解釋、理解、思考、及學習新知。
Thumbnail
強化學習(Reinforcement learning)是機器學習的一個分支,它被廣泛應用於博奕、控制學、金融等多個領域,其概念主要是藉由讓智能體與環境做互動,並在過程中給予正負向的回饋來讓電腦不斷修正行為,進而學會做動態之決策...
Thumbnail
強化學習(Reinforcement learning)是機器學習的一個分支,它被廣泛應用於博奕、控制學、金融等多個領域,其概念主要是藉由讓智能體與環境做互動,並在過程中給予正負向的回饋來讓電腦不斷修正行為,進而學會做動態之決策...
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News