GM 004|你知道Transformers能成為統計人員嗎?

更新於 發佈於 閱讀時間約 2 分鐘

今天聊一聊由 Yu Bai [1] 於2023年發表的文章,


《Transformers as Statisticians: Provable In-Context Learning with In-Context Algorithm Selection》[2]。


本文章的標題很有意思,直接翻譯是「作為統計人員的Transformers」。


為什麼這樣說呢?


因為這篇文章探討語言模型的「脈絡內學習 In-context Learning」現象,


並且討論語言模型是否能勝任「統計人員 Statistician」的任務。


那麼統計人員的任務是什麼呢?


在這篇文章中,就是做「嶺回歸 Ridge Regression」[3],


做「LASSO Regression」[4]的能力。


而這篇文章還是一篇理論文章,


其使用的理論工具是所謂的「脈絡內梯度下降 In-Context Gradient Descent」。


能做梯度下降,代表可以寫「損失函數 Loss Function」[5],


而這個損失函數是基於Transformers[6]的性質寫出來的,


在文章的附錄D,非常值得統計學背景的研究生學習。


在這個Transformer的世界裡,


輸入的數據不再是傳統的「向量形式」的輸入數據,


而是從文本出發,進一步轉換為「符元 Token」[7],


然後轉為「向量形式」的表達,


再接入目前的深度學習架構。


Reference

[1] https://yubai.org/

[2] https://arxiv.org/abs/2306.04637

[3] https://en.wikipedia.org/wiki/Ridge_regression

[4] https://en.wikipedia.org/wiki/Lasso_(statistics)

[5] https://en.wikipedia.org/wiki/Loss_function

[6] https://en.wikipedia.org/wiki/Transformer_(deep_learning_architecture)

[7] https://www.threads.net/@chihua.wang.3/post/C8LKZ6tyopB

留言
avatar-img
留言分享你的想法!
avatar-img
王啟樺的沙龍
634會員
2.0K內容數
Outline as Content
王啟樺的沙龍的其他內容
2025/03/29
Passive Consumption(被動接收) vs. Active Reading(主動閱讀)|真正讓你進化的閱讀差在這裡 碩博士生每天都在讀論文、讀報告、讀教材, 但大多數人其實只是「看過了」,不是「讀進去了」。 讀很多卻吸收很少,記不起重點、寫不出心得, 不是你不夠努力,而是你還停
2025/03/29
Passive Consumption(被動接收) vs. Active Reading(主動閱讀)|真正讓你進化的閱讀差在這裡 碩博士生每天都在讀論文、讀報告、讀教材, 但大多數人其實只是「看過了」,不是「讀進去了」。 讀很多卻吸收很少,記不起重點、寫不出心得, 不是你不夠努力,而是你還停
2025/01/29
4 個關鍵洞見 + 讓你看懂中美 AI 競爭 + 若不讀,你就可能錯失整個時代的最大機遇 AI 的發展速度,真的快到讓人心驚。 我們常常以為美國在 AI 領域穩居頂尖,可現在中國的 AI 創新力好像開始迎頭趕上,這背後的原因是什麼? 若我們沒有跟上這波 AI 變革,就可能被遠遠拋在後面,錯失技
Thumbnail
2025/01/29
4 個關鍵洞見 + 讓你看懂中美 AI 競爭 + 若不讀,你就可能錯失整個時代的最大機遇 AI 的發展速度,真的快到讓人心驚。 我們常常以為美國在 AI 領域穩居頂尖,可現在中國的 AI 創新力好像開始迎頭趕上,這背後的原因是什麼? 若我們沒有跟上這波 AI 變革,就可能被遠遠拋在後面,錯失技
Thumbnail
看更多
你可能也想看
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
時間快轉至2030年,或許城市還無懸浮飛車,但AI先會像電力存在每一個角落。百工百業運用智慧算力,就像打開水龍頭一樣容易。這描述並非Cyberpunk科幻場景,正逐漸在世界各地悄然成形。
Thumbnail
時間快轉至2030年,或許城市還無懸浮飛車,但AI先會像電力存在每一個角落。百工百業運用智慧算力,就像打開水龍頭一樣容易。這描述並非Cyberpunk科幻場景,正逐漸在世界各地悄然成形。
Thumbnail
從今年OpenAI推出GPT-4o到COMPUTEX黃仁勳旋風,AI魔力已吹進台灣每一戶人家。2024年《台北國際數位廣告節(TIDAF)》無法迴避此一趨勢,以「AI的應用」為主題,探討「AI到底可以為我們做什麼?」本屆報名人數盛況空前,無論動機是焦慮或興奮,讓我們聚在一起擁抱AI的10+2個方法。
Thumbnail
從今年OpenAI推出GPT-4o到COMPUTEX黃仁勳旋風,AI魔力已吹進台灣每一戶人家。2024年《台北國際數位廣告節(TIDAF)》無法迴避此一趨勢,以「AI的應用」為主題,探討「AI到底可以為我們做什麼?」本屆報名人數盛況空前,無論動機是焦慮或興奮,讓我們聚在一起擁抱AI的10+2個方法。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
即將舉辦的2024 COMPUTEX Forum將聚集全球科技領袖,共同探討生成式 AI 的未來發展,也代表臺灣在全球 AI 產業中的重要地位。文章也特別介紹了GeniAuto_X應用在企業內部(業務及行銷部門)和外部客服的生成式AI對話機器人,有助於臺灣企業與生成式AI的接軌,提升整體運營效率。
Thumbnail
即將舉辦的2024 COMPUTEX Forum將聚集全球科技領袖,共同探討生成式 AI 的未來發展,也代表臺灣在全球 AI 產業中的重要地位。文章也特別介紹了GeniAuto_X應用在企業內部(業務及行銷部門)和外部客服的生成式AI對話機器人,有助於臺灣企業與生成式AI的接軌,提升整體運營效率。
Thumbnail
2024 年度臺灣人工智慧博覽會 TAIWAN AI EXPO,為期三天的展覽精彩總結。精選展覽上的內容,淺談 AI 的應用實例、新創獎決賽。強烈推薦各位明年也參加!實地收穫 AI 技術的發展和應用。
Thumbnail
2024 年度臺灣人工智慧博覽會 TAIWAN AI EXPO,為期三天的展覽精彩總結。精選展覽上的內容,淺談 AI 的應用實例、新創獎決賽。強烈推薦各位明年也參加!實地收穫 AI 技術的發展和應用。
Thumbnail
電電公會:拚AI 要解決供電問題 Google論文搜尋引擎|論文深造的影響力 2024 GenAI不斷的刺激各種層面的應用,有發現生活中有什麼實質現況正……腦力激盪……
Thumbnail
電電公會:拚AI 要解決供電問題 Google論文搜尋引擎|論文深造的影響力 2024 GenAI不斷的刺激各種層面的應用,有發現生活中有什麼實質現況正……腦力激盪……
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News