付費限定方格精選

[探索] 使用 Mixture of Experts 建立多任務學習框架

閱讀時間約 16 分鐘


多任務學習(Multi-task Learnig)

多任務學習指的是使用多個相關的任務目標(Multiple objectives)來學習共享的表示方法。比起單一任務的學習方式,多任務學習會讓模型能夠使用在未曾見過的新任務中,也更易於泛化(generalize)。在這裡,相關性指的是能夠使用同樣的特徵來做多任務學習,或擁有相同的分佈。多任務學習有兩類學習方法:一是如前所提,使用多個相關任務目標,另一是使用一個主要任務,但搭配多個輔助任務(Auxiliary tasks)來幫助學習主要任務。
如何透過多任務學習來提升模型的泛化能力,可以由下列五點來說明:
  1. 非明顯資料擴增(Implicit data augmentation)使用多個相關任務的標註,多任務學習可以平均掉與任務獨立,和資料相依的噪點,而使模型更易最佳泛化。
  2. 專注學習焦點(Attention focusing:多任務學習可以使模型專注在任務共享的特徵上,並可藉由其他任務提供判定習得的特徵是否與任務無關的證據。
  3. 透過其他任務來學習重要特徵(Eavesdropping):因為每個任務學習共享特徵的難易度不同,多任務學習可以透過較易學習共享特徵的任務來直接學習與任務相關的重要特徵。
  4. 偏好學習特定特徵(Representation bias):多任務學習會偏好學習被相關任務共享的特徵。
  5. 調節模型(Regularization):透過學習共享特徵,多任務學習可以有效地降低過度擬合。
在 《Youtube 如何推薦你下一個影片?》[1] 一文介紹了 Google 如何利用一個多任務學習的學習演算法,建造一個影片的推薦系統。所使用的架構是 wide (shallow tower) and deep (Multi-gate Mixture of Experts, MMoE) 。在訓練目標上則採用多個目標(objectives),分別是使用者的點閱率(engagement objective) 和滿意度(satisfaction objective)。點擊率和欣賞影片的時間都屬於使用者的點閱率。而按讚或移除則屬於滿意度。
以行動支持創作者!付費即可解鎖
本篇內容共 6571 字、0 則留言,僅發佈於翻滾吧!駭客女孩!你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
71會員
35內容數
<p>專為年輕的女孩設計的科學/資訊科技寫作計畫,希望讓每位女孩在體脂肪、青春痘與暗戀對象之外,還能找到新的生活樂趣。</p>
留言0
查看全部
發表第一個留言支持創作者!
Rene Wang的沙龍 的其他內容
連同上兩篇文章,我們介紹了機械學習裡的基石,並踩著這些基石了解了改變資料餵送方式,以及動態改變學習率或在更新項中加入動量的方法。我們可以看到這些梯度下降的變化,主要是解決兩個問題:梯度震盪和非最佳的局部最小值造成學習停滯不前的問題。在這篇文章中,我們著重動量和 Adam 的方法來達成克服以上的問題。
這篇文章從類神經網路的起源,也就是單神經元的感知器。簡單的感知器迭代演算法使單神經元可以學習,但卻無法學習超過非線性,如 XOR 的資料分布。另外,本文還介紹了 Logistic regression,藉由透過非線性轉換來使線性輸出近似於機率分佈。最後則以一場大師賭局結束(SVM vs NN)。
在 2018 年,筆者介紹了普華永道(PwC)關於人工智慧的十項預測。我們將要藉由這篇文章,先來回顧在過去的一年中,電腦視覺和自然語言領域有什麼新的發展。在本文的最後,則提及 PwC 在今年提出的六項建議,主要使已投資 AI 的公司能成功商轉,以及關於自動化資料處理和機械學習的現況。
本文提到如何以類神經網路為主的深度學習方法,來進行物體偵測。文中包括基礎的物體偵測簡介:如影像問題分類,影像處理和傳統非類神經網路為主的物體偵測方法。這些傳統方法,仍可以在類神經網路的方法中找到其應用。最後簡略敘述當前使用深度卷積網路作為物體偵測的主要研究方向,並對學術界常用的訓練資料集做分析介紹。
在此篇文章終將會簡述機械學習的發展,簡介深度學習以 Sequence to Sequence 為架構,並在多場機械翻譯的學術年會,獲得成績斐然的結果。在本文中,會粗略介紹 Sequence to Sequence 架構並以 google 在 2017 對Seq2Seq 所進行的大規模參數。
目前深度學習是人工智慧領域中最熱門的研究領域,許多美國科技巨頭紛紛推出他們的深度學習架構,以期能夠在人工智慧的商業應用上,能夠給使用者最無縫的服務。在本篇文章中,會以開發者和 DevOps 的角度,來談論該如何選擇最適合公司以及個人需求的深度學習架構。
連同上兩篇文章,我們介紹了機械學習裡的基石,並踩著這些基石了解了改變資料餵送方式,以及動態改變學習率或在更新項中加入動量的方法。我們可以看到這些梯度下降的變化,主要是解決兩個問題:梯度震盪和非最佳的局部最小值造成學習停滯不前的問題。在這篇文章中,我們著重動量和 Adam 的方法來達成克服以上的問題。
這篇文章從類神經網路的起源,也就是單神經元的感知器。簡單的感知器迭代演算法使單神經元可以學習,但卻無法學習超過非線性,如 XOR 的資料分布。另外,本文還介紹了 Logistic regression,藉由透過非線性轉換來使線性輸出近似於機率分佈。最後則以一場大師賭局結束(SVM vs NN)。
在 2018 年,筆者介紹了普華永道(PwC)關於人工智慧的十項預測。我們將要藉由這篇文章,先來回顧在過去的一年中,電腦視覺和自然語言領域有什麼新的發展。在本文的最後,則提及 PwC 在今年提出的六項建議,主要使已投資 AI 的公司能成功商轉,以及關於自動化資料處理和機械學習的現況。
本文提到如何以類神經網路為主的深度學習方法,來進行物體偵測。文中包括基礎的物體偵測簡介:如影像問題分類,影像處理和傳統非類神經網路為主的物體偵測方法。這些傳統方法,仍可以在類神經網路的方法中找到其應用。最後簡略敘述當前使用深度卷積網路作為物體偵測的主要研究方向,並對學術界常用的訓練資料集做分析介紹。
在此篇文章終將會簡述機械學習的發展,簡介深度學習以 Sequence to Sequence 為架構,並在多場機械翻譯的學術年會,獲得成績斐然的結果。在本文中,會粗略介紹 Sequence to Sequence 架構並以 google 在 2017 對Seq2Seq 所進行的大規模參數。
目前深度學習是人工智慧領域中最熱門的研究領域,許多美國科技巨頭紛紛推出他們的深度學習架構,以期能夠在人工智慧的商業應用上,能夠給使用者最無縫的服務。在本篇文章中,會以開發者和 DevOps 的角度,來談論該如何選擇最適合公司以及個人需求的深度學習架構。
你可能也想看
Google News 追蹤
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
本篇是介紹《修復情緒的100個創作練習》這本書的下篇,上篇主要是介紹藝術治療的理論面,下篇重點則放在分享練習及我個人的經驗分享。這本書的創作練習涵蓋的創作媒材與方法滿廣的,每個人都可以從中找到自己喜歡入門的方法,一旦我們學會當情緒的主人,療癒效果就會慢慢浮現,獲得心靈的平靜。
Thumbnail
前面的憂鬱主題文介紹心理治療法主以認知、正念這兩種方法。這篇藉《修復情緒的100個創作練習》此書介紹另種對情緒釋放及療癒身心也很有效果的方法:藝術治療。作者莉亞‧古茲曼希望為個案創造一個安全的環境,使其有創意的表達情緒,同時建立生命的新契機。把壓力、焦慮、惶恐、不安轉交給藝術,卸下傷痛,撫慰身心。
Thumbnail
芳療節氣系列 | 小滿,萬物未全熟,用好奇心探索世界 所謂「小滿」 |萬物未全熟,用好奇心探索世界 ▼ 小滿,太陽到達黃經60°時開始。每年5月20-22日之間,也是呼應西方雙子座(包含節氣小滿以及節氣芒種)的開始。 在小滿節氣到下一個芒種節氣期間,各地都是漸次進入了夏季,《歷書》記載:「鬥指甲為
Thumbnail
你也使用探路客嗎?最近它們手機APP功能開通了。
Thumbnail
不管是在社群網站,還是身邊朋友,很長都會看到那些人拿著一瓶飲料,喝完就會嗨(不是你想的那種)。跟你說到感覺精神百倍,但你知道為什麼嗎? 本篇就來說給各位聽。本篇的主題就是...
Thumbnail
到目前為止,機器學習確實達成了許多以往看來不可能的任務,但如同Andrew所述,其實開發的過程非但不容易,還很容易觸法。 由於遊戲往往是一個有明確規則的產物,而在製作過程中的規格變化又是那麼頻繁,因此機器學習在遊戲業界的應用更是難上加難,希望Andrew接下來的分析能有所幫助。
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
本篇是介紹《修復情緒的100個創作練習》這本書的下篇,上篇主要是介紹藝術治療的理論面,下篇重點則放在分享練習及我個人的經驗分享。這本書的創作練習涵蓋的創作媒材與方法滿廣的,每個人都可以從中找到自己喜歡入門的方法,一旦我們學會當情緒的主人,療癒效果就會慢慢浮現,獲得心靈的平靜。
Thumbnail
前面的憂鬱主題文介紹心理治療法主以認知、正念這兩種方法。這篇藉《修復情緒的100個創作練習》此書介紹另種對情緒釋放及療癒身心也很有效果的方法:藝術治療。作者莉亞‧古茲曼希望為個案創造一個安全的環境,使其有創意的表達情緒,同時建立生命的新契機。把壓力、焦慮、惶恐、不安轉交給藝術,卸下傷痛,撫慰身心。
Thumbnail
芳療節氣系列 | 小滿,萬物未全熟,用好奇心探索世界 所謂「小滿」 |萬物未全熟,用好奇心探索世界 ▼ 小滿,太陽到達黃經60°時開始。每年5月20-22日之間,也是呼應西方雙子座(包含節氣小滿以及節氣芒種)的開始。 在小滿節氣到下一個芒種節氣期間,各地都是漸次進入了夏季,《歷書》記載:「鬥指甲為
Thumbnail
你也使用探路客嗎?最近它們手機APP功能開通了。
Thumbnail
不管是在社群網站,還是身邊朋友,很長都會看到那些人拿著一瓶飲料,喝完就會嗨(不是你想的那種)。跟你說到感覺精神百倍,但你知道為什麼嗎? 本篇就來說給各位聽。本篇的主題就是...
Thumbnail
到目前為止,機器學習確實達成了許多以往看來不可能的任務,但如同Andrew所述,其實開發的過程非但不容易,還很容易觸法。 由於遊戲往往是一個有明確規則的產物,而在製作過程中的規格變化又是那麼頻繁,因此機器學習在遊戲業界的應用更是難上加難,希望Andrew接下來的分析能有所幫助。