GM 004|你知道Transformers能成為統計人員嗎?

更新 發佈閱讀 2 分鐘

今天聊一聊由 Yu Bai [1] 於2023年發表的文章,


《Transformers as Statisticians: Provable In-Context Learning with In-Context Algorithm Selection》[2]。


本文章的標題很有意思,直接翻譯是「作為統計人員的Transformers」。


為什麼這樣說呢?


因為這篇文章探討語言模型的「脈絡內學習 In-context Learning」現象,


並且討論語言模型是否能勝任「統計人員 Statistician」的任務。


那麼統計人員的任務是什麼呢?


在這篇文章中,就是做「嶺回歸 Ridge Regression」[3],


做「LASSO Regression」[4]的能力。


而這篇文章還是一篇理論文章,


其使用的理論工具是所謂的「脈絡內梯度下降 In-Context Gradient Descent」。


能做梯度下降,代表可以寫「損失函數 Loss Function」[5],


而這個損失函數是基於Transformers[6]的性質寫出來的,


在文章的附錄D,非常值得統計學背景的研究生學習。


在這個Transformer的世界裡,


輸入的數據不再是傳統的「向量形式」的輸入數據,


而是從文本出發,進一步轉換為「符元 Token」[7],


然後轉為「向量形式」的表達,


再接入目前的深度學習架構。


Reference

[1] https://yubai.org/

[2] https://arxiv.org/abs/2306.04637

[3] https://en.wikipedia.org/wiki/Ridge_regression

[4] https://en.wikipedia.org/wiki/Lasso_(statistics)

[5] https://en.wikipedia.org/wiki/Loss_function

[6] https://en.wikipedia.org/wiki/Transformer_(deep_learning_architecture)

[7] https://www.threads.net/@chihua.wang.3/post/C8LKZ6tyopB

留言
avatar-img
王啟樺的沙龍
648會員
2.0K內容數
Outline as Content
王啟樺的沙龍的其他內容
2025/03/29
Passive Consumption(被動接收) vs. Active Reading(主動閱讀)|真正讓你進化的閱讀差在這裡 碩博士生每天都在讀論文、讀報告、讀教材, 但大多數人其實只是「看過了」,不是「讀進去了」。 讀很多卻吸收很少,記不起重點、寫不出心得, 不是你不夠努力,而是你還停
2025/03/29
Passive Consumption(被動接收) vs. Active Reading(主動閱讀)|真正讓你進化的閱讀差在這裡 碩博士生每天都在讀論文、讀報告、讀教材, 但大多數人其實只是「看過了」,不是「讀進去了」。 讀很多卻吸收很少,記不起重點、寫不出心得, 不是你不夠努力,而是你還停
2025/01/29
4 個關鍵洞見 + 讓你看懂中美 AI 競爭 + 若不讀,你就可能錯失整個時代的最大機遇 AI 的發展速度,真的快到讓人心驚。 我們常常以為美國在 AI 領域穩居頂尖,可現在中國的 AI 創新力好像開始迎頭趕上,這背後的原因是什麼? 若我們沒有跟上這波 AI 變革,就可能被遠遠拋在後面,錯失技
Thumbnail
2025/01/29
4 個關鍵洞見 + 讓你看懂中美 AI 競爭 + 若不讀,你就可能錯失整個時代的最大機遇 AI 的發展速度,真的快到讓人心驚。 我們常常以為美國在 AI 領域穩居頂尖,可現在中國的 AI 創新力好像開始迎頭趕上,這背後的原因是什麼? 若我們沒有跟上這波 AI 變革,就可能被遠遠拋在後面,錯失技
Thumbnail
看更多
你可能也想看
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
時間快轉至2030年,或許城市還無懸浮飛車,但AI先會像電力存在每一個角落。百工百業運用智慧算力,就像打開水龍頭一樣容易。這描述並非Cyberpunk科幻場景,正逐漸在世界各地悄然成形。
Thumbnail
時間快轉至2030年,或許城市還無懸浮飛車,但AI先會像電力存在每一個角落。百工百業運用智慧算力,就像打開水龍頭一樣容易。這描述並非Cyberpunk科幻場景,正逐漸在世界各地悄然成形。
Thumbnail
從今年OpenAI推出GPT-4o到COMPUTEX黃仁勳旋風,AI魔力已吹進台灣每一戶人家。2024年《台北國際數位廣告節(TIDAF)》無法迴避此一趨勢,以「AI的應用」為主題,探討「AI到底可以為我們做什麼?」本屆報名人數盛況空前,無論動機是焦慮或興奮,讓我們聚在一起擁抱AI的10+2個方法。
Thumbnail
從今年OpenAI推出GPT-4o到COMPUTEX黃仁勳旋風,AI魔力已吹進台灣每一戶人家。2024年《台北國際數位廣告節(TIDAF)》無法迴避此一趨勢,以「AI的應用」為主題,探討「AI到底可以為我們做什麼?」本屆報名人數盛況空前,無論動機是焦慮或興奮,讓我們聚在一起擁抱AI的10+2個方法。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
即將舉辦的2024 COMPUTEX Forum將聚集全球科技領袖,共同探討生成式 AI 的未來發展,也代表臺灣在全球 AI 產業中的重要地位。文章也特別介紹了GeniAuto_X應用在企業內部(業務及行銷部門)和外部客服的生成式AI對話機器人,有助於臺灣企業與生成式AI的接軌,提升整體運營效率。
Thumbnail
即將舉辦的2024 COMPUTEX Forum將聚集全球科技領袖,共同探討生成式 AI 的未來發展,也代表臺灣在全球 AI 產業中的重要地位。文章也特別介紹了GeniAuto_X應用在企業內部(業務及行銷部門)和外部客服的生成式AI對話機器人,有助於臺灣企業與生成式AI的接軌,提升整體運營效率。
Thumbnail
2024 年度臺灣人工智慧博覽會 TAIWAN AI EXPO,為期三天的展覽精彩總結。精選展覽上的內容,淺談 AI 的應用實例、新創獎決賽。強烈推薦各位明年也參加!實地收穫 AI 技術的發展和應用。
Thumbnail
2024 年度臺灣人工智慧博覽會 TAIWAN AI EXPO,為期三天的展覽精彩總結。精選展覽上的內容,淺談 AI 的應用實例、新創獎決賽。強烈推薦各位明年也參加!實地收穫 AI 技術的發展和應用。
Thumbnail
電電公會:拚AI 要解決供電問題 Google論文搜尋引擎|論文深造的影響力 2024 GenAI不斷的刺激各種層面的應用,有發現生活中有什麼實質現況正……腦力激盪……
Thumbnail
電電公會:拚AI 要解決供電問題 Google論文搜尋引擎|論文深造的影響力 2024 GenAI不斷的刺激各種層面的應用,有發現生活中有什麼實質現況正……腦力激盪……
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News