GM 004|你知道Transformers能成為統計人員嗎?

更新 發佈閱讀 2 分鐘

今天聊一聊由 Yu Bai [1] 於2023年發表的文章,


《Transformers as Statisticians: Provable In-Context Learning with In-Context Algorithm Selection》[2]。


本文章的標題很有意思,直接翻譯是「作為統計人員的Transformers」。


為什麼這樣說呢?


因為這篇文章探討語言模型的「脈絡內學習 In-context Learning」現象,


並且討論語言模型是否能勝任「統計人員 Statistician」的任務。


那麼統計人員的任務是什麼呢?


在這篇文章中,就是做「嶺回歸 Ridge Regression」[3],


做「LASSO Regression」[4]的能力。


而這篇文章還是一篇理論文章,


其使用的理論工具是所謂的「脈絡內梯度下降 In-Context Gradient Descent」。


能做梯度下降,代表可以寫「損失函數 Loss Function」[5],


而這個損失函數是基於Transformers[6]的性質寫出來的,


在文章的附錄D,非常值得統計學背景的研究生學習。


在這個Transformer的世界裡,


輸入的數據不再是傳統的「向量形式」的輸入數據,


而是從文本出發,進一步轉換為「符元 Token」[7],


然後轉為「向量形式」的表達,


再接入目前的深度學習架構。


Reference

[1] https://yubai.org/

[2] https://arxiv.org/abs/2306.04637

[3] https://en.wikipedia.org/wiki/Ridge_regression

[4] https://en.wikipedia.org/wiki/Lasso_(statistics)

[5] https://en.wikipedia.org/wiki/Loss_function

[6] https://en.wikipedia.org/wiki/Transformer_(deep_learning_architecture)

[7] https://www.threads.net/@chihua.wang.3/post/C8LKZ6tyopB

留言
avatar-img
王啟樺的沙龍
649會員
2.0K內容數
Outline as Content
王啟樺的沙龍的其他內容
2025/03/29
Passive Consumption(被動接收) vs. Active Reading(主動閱讀)|真正讓你進化的閱讀差在這裡 碩博士生每天都在讀論文、讀報告、讀教材, 但大多數人其實只是「看過了」,不是「讀進去了」。 讀很多卻吸收很少,記不起重點、寫不出心得, 不是你不夠努力,而是你還停
2025/03/29
Passive Consumption(被動接收) vs. Active Reading(主動閱讀)|真正讓你進化的閱讀差在這裡 碩博士生每天都在讀論文、讀報告、讀教材, 但大多數人其實只是「看過了」,不是「讀進去了」。 讀很多卻吸收很少,記不起重點、寫不出心得, 不是你不夠努力,而是你還停
2025/01/29
4 個關鍵洞見 + 讓你看懂中美 AI 競爭 + 若不讀,你就可能錯失整個時代的最大機遇 AI 的發展速度,真的快到讓人心驚。 我們常常以為美國在 AI 領域穩居頂尖,可現在中國的 AI 創新力好像開始迎頭趕上,這背後的原因是什麼? 若我們沒有跟上這波 AI 變革,就可能被遠遠拋在後面,錯失技
Thumbnail
2025/01/29
4 個關鍵洞見 + 讓你看懂中美 AI 競爭 + 若不讀,你就可能錯失整個時代的最大機遇 AI 的發展速度,真的快到讓人心驚。 我們常常以為美國在 AI 領域穩居頂尖,可現在中國的 AI 創新力好像開始迎頭趕上,這背後的原因是什麼? 若我們沒有跟上這波 AI 變革,就可能被遠遠拋在後面,錯失技
Thumbnail
看更多
你可能也想看
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
時間快轉至2030年,或許城市還無懸浮飛車,但AI先會像電力存在每一個角落。百工百業運用智慧算力,就像打開水龍頭一樣容易。這描述並非Cyberpunk科幻場景,正逐漸在世界各地悄然成形。
Thumbnail
時間快轉至2030年,或許城市還無懸浮飛車,但AI先會像電力存在每一個角落。百工百業運用智慧算力,就像打開水龍頭一樣容易。這描述並非Cyberpunk科幻場景,正逐漸在世界各地悄然成形。
Thumbnail
從今年OpenAI推出GPT-4o到COMPUTEX黃仁勳旋風,AI魔力已吹進台灣每一戶人家。2024年《台北國際數位廣告節(TIDAF)》無法迴避此一趨勢,以「AI的應用」為主題,探討「AI到底可以為我們做什麼?」本屆報名人數盛況空前,無論動機是焦慮或興奮,讓我們聚在一起擁抱AI的10+2個方法。
Thumbnail
從今年OpenAI推出GPT-4o到COMPUTEX黃仁勳旋風,AI魔力已吹進台灣每一戶人家。2024年《台北國際數位廣告節(TIDAF)》無法迴避此一趨勢,以「AI的應用」為主題,探討「AI到底可以為我們做什麼?」本屆報名人數盛況空前,無論動機是焦慮或興奮,讓我們聚在一起擁抱AI的10+2個方法。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
即將舉辦的2024 COMPUTEX Forum將聚集全球科技領袖,共同探討生成式 AI 的未來發展,也代表臺灣在全球 AI 產業中的重要地位。文章也特別介紹了GeniAuto_X應用在企業內部(業務及行銷部門)和外部客服的生成式AI對話機器人,有助於臺灣企業與生成式AI的接軌,提升整體運營效率。
Thumbnail
即將舉辦的2024 COMPUTEX Forum將聚集全球科技領袖,共同探討生成式 AI 的未來發展,也代表臺灣在全球 AI 產業中的重要地位。文章也特別介紹了GeniAuto_X應用在企業內部(業務及行銷部門)和外部客服的生成式AI對話機器人,有助於臺灣企業與生成式AI的接軌,提升整體運營效率。
Thumbnail
2024 年度臺灣人工智慧博覽會 TAIWAN AI EXPO,為期三天的展覽精彩總結。精選展覽上的內容,淺談 AI 的應用實例、新創獎決賽。強烈推薦各位明年也參加!實地收穫 AI 技術的發展和應用。
Thumbnail
2024 年度臺灣人工智慧博覽會 TAIWAN AI EXPO,為期三天的展覽精彩總結。精選展覽上的內容,淺談 AI 的應用實例、新創獎決賽。強烈推薦各位明年也參加!實地收穫 AI 技術的發展和應用。
Thumbnail
電電公會:拚AI 要解決供電問題 Google論文搜尋引擎|論文深造的影響力 2024 GenAI不斷的刺激各種層面的應用,有發現生活中有什麼實質現況正……腦力激盪……
Thumbnail
電電公會:拚AI 要解決供電問題 Google論文搜尋引擎|論文深造的影響力 2024 GenAI不斷的刺激各種層面的應用,有發現生活中有什麼實質現況正……腦力激盪……
Thumbnail
本文討論了人類在面對變化時的應對策略,包括數據分析的重要性,科技趨勢對工作形態的影響,以及對無條件基本收入的討論。透過工程師職涯教練Yi姐豐富的經驗,分享如何運用數據進行更好的決策,探討寫作和自媒體創業的投資報酬率,以及對未來的靈活規劃。
Thumbnail
本文討論了人類在面對變化時的應對策略,包括數據分析的重要性,科技趨勢對工作形態的影響,以及對無條件基本收入的討論。透過工程師職涯教練Yi姐豐富的經驗,分享如何運用數據進行更好的決策,探討寫作和自媒體創業的投資報酬率,以及對未來的靈活規劃。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News