元學習 - Meta-Learning

更新於 2024/12/07發佈於 2024/12/07閱讀時間約 3 分鐘

前言

一個好的機器學習模型通常需要大量樣本進行訓練。相比之下，人類學習新概念和技能要快得多，也更有效率。例如:小孩子只需見過幾次貓和鳥就能很快分辨它們。會騎自行車的人很可能在很少甚至沒有示範的情況下就能發現騎摩托車的方法。這樣的生活經驗讓大家想到是否有可能設計一個具有類似特性的機器學習模型——只要通過少量訓練例子快速學習新概念和技能？
以上的想法本質上就是元學習（meta-learning）試圖解決的問題。我們期待一個好的元學習模型能夠很好地適應或延伸到訓練期間從未遇到過的新任務和新環境。適應過程，本質上是一個小型學習會話，發生在測試期間，但對新任務內容的接觸有限。最終，適應後的模型可以完成新任務。這些任務可以是任何明確定義的機器學習問題家族：監督學習、強化學習等。例如，以下是幾個具體的元學習任務：

在非貓圖像上訓練的分類器在看到少量貓圖片後可以判斷給定圖像是否包含貓。
一個遊戲機器人能夠快速掌握一個新遊戲。
一個迷你機器人在測試時能夠在上坡表面完成所需任務，即使它只在平坦表面環境中接受過訓練。

深度學習模型通過梯度反向傳播來學習。然而，基於梯度的最佳化既不是為了應對少量訓練樣本而設計的，也不是為了在少量最佳化步驟內收斂而設計的。是否有一種方法可以調整最佳化演算法，使模型能夠透過少量例子學習？這個概念正是基於最佳化的元學習演算法所追求的。

以下我們使用LSTM元學習為例，LSTM元學習最佳化算法可以被明確建立。Ravi & Larochelle（2017）[1] 發表論文，並將其命名為「元學習器」，而其處理任務的原始模型被稱為「學習器」。元學習器的目標是使用小型支持集有效地更新學習器的參數，使學習器能夠快速適應新任務。讓我們將學習器模型表示為 $M_\theta$ 參數化為 $\theta$，元學習器表示為 $R_\phi$ 參數為 $\phi$，損失函數為 $\mathcal{L}$。

元學習器被建模為LSTM，因為：

反向傳播中的基於梯度的更新與LSTM中的單元狀態更新之間存在相似性。
了解梯度的歷史有利於梯度更新。

Reference

https://openreview.net/pdf?id=rJY0-Kcll

1會員

35內容數

心繫正體中文的科學家，立志使用正體中文撰寫文章。此沙龍預計涵蓋各項資訊科技知識分享與學習心得

留言0

查看全部

發表第一個留言支持創作者！

Kiki的沙龍的其他內容

大模型推論最佳化

大型transformer模型已成為最近的主流，在處理各種不同的任務上都獲得了很好的結果。大型transformer功能強大，但在計算效能和記憶體方面都有極高的要求，這也造成使用transformer大規模解決真實世界任務時的一個大瓶頸。本文嘗試介紹一些最佳化方法來突破這些瓶頸。

#深度學習 #人工智慧 #AI人工智慧

大型視覺模型

前言許多年前已經有許多研究使用影像處理方法來生成文字，如圖像描述和視覺問答。傳統上，這類系統依賴於物體檢測網絡作為視覺編碼器來捕捉視覺特徵，然後通過文字解碼器生成文字。鑑於大量現有文獻。這篇文章會專注於解決視覺任務的一種方法，即擴展預訓練的通用語言模型，使其能夠處理視覺信號。本文大致將這些視覺語

#深度學習 #人工智慧 #AI人工智慧

如何有效地使用大語言模型

隨著大語言模型的發展熱潮，如何有效地使用大語言模型成為大眾關心的話題。要學會使用大語言模型不能不了解提示工程 (Prompt Engineering)，提示工程也稱為上下文內提示，指的是如何與大型語言模型（Large Language Model, LLM）溝通以引導其行為達到預期結果的方法，而無需

#模型 #語言 #輸入

大語言模型淺析

時光回溯至2018年，自然語言處理（Natural Language Processing, NLP）領域開始有了驚人的進展。像OpenAI GPT和BERT這樣的大規模預訓練語言模型在解決各種不同的任務上取得了優異的表現。

#AI深度學習 #深度學習 #AI人工智慧

大型語言模型中的幻覺問題

大型語言模型(Large Language Model, LLM)中的幻覺通常指模型產生不真實、錯誤、不一致或無意義的內容。

#人工智慧 #AI人工智慧 #AI深度學習

以流為基礎的深度生成模型

以流為基礎的深度生成模型藉助正規化流這一強大的統計工具來解決密度估計這個困難問題。對 p(x) 的良好估計使得有效完成許多下游任務成為可能：取樣未觀察到但真實的新數據點（數據生成）、預測未來事件的稀有程度（密度估計）、推斷潛在變量、填補不完整的數據樣本等。

#模型 #語言 #輸入

#AI深度學習 #深度學習 #AI人工智慧

大型語言模型中的幻覺問題

大型語言模型(Large Language Model, LLM)中的幻覺通常指模型產生不真實、錯誤、不一致或無意義的內容。

#人工智慧 #AI人工智慧 #AI深度學習

本篇參與的主題活動

有緣人15-本文獲「關鍵評論網」轉載-從孫生事件，看我們該為孩子守住的底線—「我是父親，我有兒女，我不能沉默。」

當流量至上成為標準，性騷擾被輕描淡寫、受害者被噤聲，我們是否還能給孩子一個安全的未來？作為父親，我無法接受這種價值觀繼續影響下一代。我們該做的，不是遺忘，而是改變環境——拒絕縱容、用行動發聲，讓孩子知道「尊重是底線，說不是權利」。這不只是關於孫生，而是關於我們願意為未來的孩子守住什麼樣的世界。

#支持 #方格新手 #文章

西卡RE。LIFE人生筆記

2025/02/14

閱讀｜《小狗錢錢》：從記帳到成功日記，打造我的財務自由之路

學習《小狗錢錢》的理財方法，並透過實際操作，達成財務目標與自我提升。從記帳、設定目標、寫夢想清單、成功日記，到發展副業，分享如何將書中方法應用於生活中，並體會到理財不僅僅是管理金錢，更是規劃生活，實現夢想的重要過程。

#成功 #夢想 #日記

歐巴桑Gap year

2025/02/12

2017 vs 2024 日本東北雪景大不同！藏王樹冰、銀山溫泉、山寺的冬日奇景，好美！

比較2017年與2024年日本東北旅遊照片，對比藏王樹冰、銀山溫泉、山寺等景點在不同時間的景觀差異，即使地點相同，不同時間的體驗與感受截然不同，珍惜每個當下的珍貴回憶。2024年因暖冬導致雪景不如預期，反觀2017年的雪景壯觀美麗。新聞報導2025年日本東北暴雪，衷心祈願一切平安。

#東北 #日本 #日本旅行

簡單生活文案

2025/02/12

整理｜成為極簡主義者後，我的十個清潔小習慣

經過年末年初的大掃除，大家是否也好好整頓了自己的居家環境呢？身為家有幼童的媽媽，我也是歷經多次的練習，才調整到適合自己的清潔節奏，在此與大家分享我的清潔小撇步，每個習慣幾乎不超過5分鐘，就能換得一室乾淨，一起來看吧！

#整理 #斷捨離 #極簡主義

Jemi

2025/02/09

屏東｜德文山健行-沒想到竟成為拖鞋勇士的一天？

記錄一場前往屏東縣三地門鄉德文山（觀望山）的登山之旅，分享路線規劃、登山心得、沿途風景與美食體驗，並提醒登山客注意入山證申請及避免錯過三角點。

#蛇年大吉 #登高 #登山

方格裡的‹思›語室

2025/02/09

《錢，和你想的不一樣》03-《年薪百萬的人，和普通上班族的最大思維差距》

薪水的高低，從來不是努力的問題，而是思維的選擇。年薪百萬的人，不是單靠埋頭苦幹，而是透過「創造價值」決定自己的價格。他們懂得提升不可取代性、創造多重收入、主動尋找機會、投資自己，讓財富加速成長。與其等加薪，不如掌握「決定薪資的能力」。這篇文章，讓你看清真正的收入差距，從現在開始，為自己創造更高價值！

#人生的路 #日常 #作者

方格裡的‹思›語室

2025/02/17

有緣人15-本文獲「關鍵評論網」轉載-從孫生事件，看我們該為孩子守住的底線—「我是父親，我有兒女，我不能沉默。」

#支持 #方格新手 #文章

西卡RE。LIFE人生筆記

2025/02/14

閱讀｜《小狗錢錢》：從記帳到成功日記，打造我的財務自由之路

#成功 #夢想 #日記

歐巴桑Gap year

2025/02/12

2017 vs 2024 日本東北雪景大不同！藏王樹冰、銀山溫泉、山寺的冬日奇景，好美！