元學習 - Meta-Learning

更新於 發佈於 閱讀時間約 3 分鐘

前言

一個好的機器學習模型通常需要大量樣本進行訓練。相比之下,人類學習新概念和技能要快得多,也更有效率。例如:小孩子只需見過幾次貓和鳥就能很快分辨它們。會騎自行車的人很可能在很少甚至沒有示範的情況下就能發現騎摩托車的方法。這樣的生活經驗讓大家想到是否有可能設計一個具有類似特性的機器學習模型——只要通過少量訓練例子快速學習新概念和技能?
以上的想法本質上就是元學習(meta-learning)試圖解決的問題。我們期待一個好的元學習模型能夠很好地適應或延伸到訓練期間從未遇到過的新任務和新環境。適應過程,本質上是一個小型學習會話,發生在測試期間,但對新任務內容的接觸有限。最終,適應後的模型可以完成新任務。這些任務可以是任何明確定義的機器學習問題家族:監督學習、強化學習等。例如,以下是幾個具體的元學習任務:

  1. 在非貓圖像上訓練的分類器在看到少量貓圖片後可以判斷給定圖像是否包含貓。
  2. 一個遊戲機器人能夠快速掌握一個新遊戲。
  3. 一個迷你機器人在測試時能夠在上坡表面完成所需任務,即使它只在平坦表面環境中接受過訓練。


深度學習模型通過梯度反向傳播來學習。然而,基於梯度的最佳化既不是為了應對少量訓練樣本而設計的,也不是為了在少量最佳化步驟內收斂而設計的。是否有一種方法可以調整最佳化演算法,使模型能夠透過少量例子學習?這個概念正是基於最佳化的元學習演算法所追求的。


以下我們使用LSTM元學習為例,LSTM元學習最佳化算法可以被明確建立。Ravi & Larochelle(2017)[1] 發表論文,並將其命名為「元學習器」,而其處理任務的原始模型被稱為「學習器」。元學習器的目標是使用小型支持集有效地更新學習器的參數,使學習器能夠快速適應新任務。讓我們將學習器模型表示為 $M_\theta$ 參數化為 $\theta$,元學習器表示為 $R_\phi$ 參數為 $\phi$,損失函數為 $\mathcal{L}$。


元學習器被建模為LSTM,因為:

  1. 反向傳播中的基於梯度的更新與LSTM中的單元狀態更新之間存在相似性。
  2. 了解梯度的歷史有利於梯度更新。


Reference

  1. https://openreview.net/pdf?id=rJY0-Kcll


留言
avatar-img
留言分享你的想法!
avatar-img
Kiki的沙龍
3會員
45內容數
心繫正體中文的科學家,立志使用正體中文撰寫文章。 此沙龍預計涵蓋各項資訊科技知識分享與學習心得
Kiki的沙龍的其他內容
2025/04/27
Meta 推出了開源大型語言模型 Llama。這一代特別引人注目,因為 80 億參數的模型小到可以在家用電腦上運行,效能卻不輸比它大十倍的模型。在許多應用場景下,它給出的回應品質已經能媲美 GPT-4。在這篇文章裡,我會說明自架 Llama 3 的優缺點,並提供設定方式與資源,讓讀者也能輕鬆動手。
2025/04/27
Meta 推出了開源大型語言模型 Llama。這一代特別引人注目,因為 80 億參數的模型小到可以在家用電腦上運行,效能卻不輸比它大十倍的模型。在許多應用場景下,它給出的回應品質已經能媲美 GPT-4。在這篇文章裡,我會說明自架 Llama 3 的優缺點,並提供設定方式與資源,讓讀者也能輕鬆動手。
2025/04/20
這份實務指引旨在協助產品和工程團隊入門 大型語言模型(LLM)驅動的人工智慧代理人建構,它定義了代理的核心概念,例如獨立執行任務和利用 LLM 管理工作流程決策。本文闡述了何時應考慮建立代理,特別是在傳統自動化方法受限的複雜情境,並深入探討了代理設計的基礎要素,包括模型選擇、工具整合及指令設置。
2025/04/20
這份實務指引旨在協助產品和工程團隊入門 大型語言模型(LLM)驅動的人工智慧代理人建構,它定義了代理的核心概念,例如獨立執行任務和利用 LLM 管理工作流程決策。本文闡述了何時應考慮建立代理,特別是在傳統自動化方法受限的複雜情境,並深入探討了代理設計的基礎要素,包括模型選擇、工具整合及指令設置。
2025/04/06
這篇文章將搭配簡單的範例,介紹最近推出的 Docker Model Runner。內容比較隨意粗略,希望能成為讓讀者了解這項工具的契機!
2025/04/06
這篇文章將搭配簡單的範例,介紹最近推出的 Docker Model Runner。內容比較隨意粗略,希望能成為讓讀者了解這項工具的契機!
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
單一技能,人類終究比不過AI ! 在AI時代,美術人員就兩條路,學會駕馭AI,或學會行銷自己
Thumbnail
單一技能,人類終究比不過AI ! 在AI時代,美術人員就兩條路,學會駕馭AI,或學會行銷自己
Thumbnail
機器學習(Machine Learning)是一種讓電腦從資料中學習並改進表現的技術,而無需人類逐一編寫具體指令。想像一下,你教一個小孩認識「貓」和「狗」,不是直接告訴他每張圖片的答案,而是給他看許多例子,讓他自己找出規律。 這個想法最早由Arthur Sam
Thumbnail
機器學習(Machine Learning)是一種讓電腦從資料中學習並改進表現的技術,而無需人類逐一編寫具體指令。想像一下,你教一個小孩認識「貓」和「狗」,不是直接告訴他每張圖片的答案,而是給他看許多例子,讓他自己找出規律。 這個想法最早由Arthur Sam
Thumbnail
記得小時候曾經上過功文數學,說是上課其實也不太像,通常都是被帶到像是民宅的小空間裡,不斷地練習一本本的數學題目,只要寫完後就拿個兩個老師幫忙對答案。如果該本完成了,就再拿下一本繼續寫。據說功文數學當初的目的就是要讓小朋友習慣數學,並透過熟能生巧的練習,克服對於數學的恐懼感。
Thumbnail
記得小時候曾經上過功文數學,說是上課其實也不太像,通常都是被帶到像是民宅的小空間裡,不斷地練習一本本的數學題目,只要寫完後就拿個兩個老師幫忙對答案。如果該本完成了,就再拿下一本繼續寫。據說功文數學當初的目的就是要讓小朋友習慣數學,並透過熟能生巧的練習,克服對於數學的恐懼感。
Thumbnail
語言和邏輯,包含了一切知識和智慧!?我在格友的文章中回應到: 語言和邏輯已經包含了一切的知識和智慧。 語言是思想的載體,所以學習的基礎至少要有一種語言,通常是母語,要非常的熟,熟到爛,如此才有辦法發展精準和覆雜的邏輯。 在我還沒接觸AI之前,我從沒想過機器可以承載智慧,我也曾經以為,人類之所以
Thumbnail
語言和邏輯,包含了一切知識和智慧!?我在格友的文章中回應到: 語言和邏輯已經包含了一切的知識和智慧。 語言是思想的載體,所以學習的基礎至少要有一種語言,通常是母語,要非常的熟,熟到爛,如此才有辦法發展精準和覆雜的邏輯。 在我還沒接觸AI之前,我從沒想過機器可以承載智慧,我也曾經以為,人類之所以
Thumbnail
從小到大的正規或義務教育,讓我們大多數人至少出社會前,從幼稚園到大學畢業都經歷了至少近20年的學習歷程。然而,在出社會後,往往才是學習為什麼學見真章的開始。當AI已經可以學得比我們還快、更有架構,更能旁徵博引時,我們又該如何學呢?
Thumbnail
從小到大的正規或義務教育,讓我們大多數人至少出社會前,從幼稚園到大學畢業都經歷了至少近20年的學習歷程。然而,在出社會後,往往才是學習為什麼學見真章的開始。當AI已經可以學得比我們還快、更有架構,更能旁徵博引時,我們又該如何學呢?
Thumbnail
我們一萬小時的努力,贏不了AI一個小時的算力。 本書主要在討論,相對於單一領域的專才,多方探索通才更是成功的關鍵。 1.專才劣勢 贏在起跑點的執著,可能會導致輸在終點! 經過多年磨練的本事,最容易被機器取代!熟能生巧用熟悉模式學習,在未來將無法因應環境驟變! 立竿見影的學習,反而欲
Thumbnail
我們一萬小時的努力,贏不了AI一個小時的算力。 本書主要在討論,相對於單一領域的專才,多方探索通才更是成功的關鍵。 1.專才劣勢 贏在起跑點的執著,可能會導致輸在終點! 經過多年磨練的本事,最容易被機器取代!熟能生巧用熟悉模式學習,在未來將無法因應環境驟變! 立竿見影的學習,反而欲
Thumbnail
這本書於2016年9月發行,距今已經過了6.5年。夯到快不行的ChatGPT鋪天蓋地,像這樣的類神經網路會偷走我們的工作嗎 ?
Thumbnail
這本書於2016年9月發行,距今已經過了6.5年。夯到快不行的ChatGPT鋪天蓋地,像這樣的類神經網路會偷走我們的工作嗎 ?
Thumbnail
人們透過機器學習(machine learning),試著讓電腦能夠從大量資料中學習成長,不僅可以運用在生活各方面的功能提升,甚至還能透過這些既有的資料,起到鑑往知來的效果,處在當今資訊爆炸的時代,正是你開始學機器學習的最好時機!
Thumbnail
人們透過機器學習(machine learning),試著讓電腦能夠從大量資料中學習成長,不僅可以運用在生活各方面的功能提升,甚至還能透過這些既有的資料,起到鑑往知來的效果,處在當今資訊爆炸的時代,正是你開始學機器學習的最好時機!
Thumbnail
本文為「Robotics 2.0系列」第二篇。在前一篇文章〈AI重新定義機器人〉中,我們談到AI機器人和傳統機器人最大的不同在於自主學習能力,而這樣的改變將使得AI機器人有潛力顛覆各大產業。但究竟AI機器人會發展出什麼樣的應用?對各個產業又會有什麼影響?
Thumbnail
本文為「Robotics 2.0系列」第二篇。在前一篇文章〈AI重新定義機器人〉中,我們談到AI機器人和傳統機器人最大的不同在於自主學習能力,而這樣的改變將使得AI機器人有潛力顛覆各大產業。但究竟AI機器人會發展出什麼樣的應用?對各個產業又會有什麼影響?
Thumbnail
如果要找一個詞來說明程式的價值,那就是「自動化」;機器雖然愚笨,但不會疲憊,能讓人類的生產力得到解放。我期待的程式教育不只是教導技能,而是教導學生在該不滿的時候就不滿,也教導學生懂得叛逆、而且知道還有「自己動手」這條途徑。
Thumbnail
如果要找一個詞來說明程式的價值,那就是「自動化」;機器雖然愚笨,但不會疲憊,能讓人類的生產力得到解放。我期待的程式教育不只是教導技能,而是教導學生在該不滿的時候就不滿,也教導學生懂得叛逆、而且知道還有「自己動手」這條途徑。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News