GM 004|你知道Transformers能成為統計人員嗎?

閱讀時間約 2 分鐘

今天聊一聊由 Yu Bai [1] 於2023年發表的文章,


《Transformers as Statisticians: Provable In-Context Learning with In-Context Algorithm Selection》[2]。


本文章的標題很有意思,直接翻譯是「作為統計人員的Transformers」。


為什麼這樣說呢?


因為這篇文章探討語言模型的「脈絡內學習 In-context Learning」現象,


並且討論語言模型是否能勝任「統計人員 Statistician」的任務。


那麼統計人員的任務是什麼呢?


在這篇文章中,就是做「嶺回歸 Ridge Regression」[3],


做「LASSO Regression」[4]的能力。


而這篇文章還是一篇理論文章,


其使用的理論工具是所謂的「脈絡內梯度下降 In-Context Gradient Descent」。


能做梯度下降,代表可以寫「損失函數 Loss Function」[5],


而這個損失函數是基於Transformers[6]的性質寫出來的,


在文章的附錄D,非常值得統計學背景的研究生學習。


在這個Transformer的世界裡,


輸入的數據不再是傳統的「向量形式」的輸入數據,


而是從文本出發,進一步轉換為「符元 Token」[7],


然後轉為「向量形式」的表達,


再接入目前的深度學習架構。


Reference

[1] https://yubai.org/

[2] https://arxiv.org/abs/2306.04637

[3] https://en.wikipedia.org/wiki/Ridge_regression

[4] https://en.wikipedia.org/wiki/Lasso_(statistics)

[5] https://en.wikipedia.org/wiki/Loss_function

[6] https://en.wikipedia.org/wiki/Transformer_(deep_learning_architecture)

[7] https://www.threads.net/@chihua.wang.3/post/C8LKZ6tyopB

413會員
1.5K內容數
Outline as Content
留言0
查看全部
發表第一個留言支持創作者!
王啟樺的沙龍 的其他內容
1. 讀書基本的紀錄: - 紀錄書籍情報和感想是讀書的基本步驟。這個建議來自日本作者倉下忠憲的著書《ロギング仕事術》,在書中的第133頁提到這一點。從高中開始,我的閱讀記錄方式就一直在變化。 2. 書店探索的重要性: - 高中的國文老師李靜妤在第一堂課時告訴我們:「高中生要
人不容易區分理想與現實,會高估自己一天的產能,會以為事情要成靠毅力就可以。但實際有操作過的話,都會發現你其實對自己的狀況掌握沒有想像中那麼好。而計畫是用來制約你一天的行動,我也很有共感。如果一天沒有計畫,很容易不知道要做什麼,時間就消失在滑社群貼文,隨意逛影片之中了。
1. 回收沒有與研究主題相關經驗的申請人: - 自傳履歷中應顯示申請人是否有與我們研究主題相關的經歷。缺乏這類經驗的申請人可能無法滿足我們的需求,因為他們可能不具備執行所需工作的基本知識和技能。 2. 忽視申請人的基礎技能: - 我在自傳履歷中會特別尋找申請人是否具備與我們工作要求相符的基
步驟1 - 為筆記編號,建立索引 在Obsidian中,將每個筆記編上獨立編號,使其成為易於引用的對象。無論是日常寫作還是社交媒體分享的短文,每篇都有編號,有助於重讀和迭代。這種方法讓想法得以有效組織和管理,提高了信息檢索的效率。
1. 教育經費的來源: - 作為博士生,可能會好奇系上的設施、薪水和活動經費是從哪裡來的。這些經費實際上是從你的系所屬的學院來的,而學院的經費則是從更上層的機構來的,這包括政府機構或私人研究機構。 2. 政府與私人機構的資金來源: - 政府機構的經費來自國民的納稅錢,這些資
步驟一:對我指定的Paper寫 1-page Report,7天內提交 步驟二:與我一對一面試30分鐘 從步驟一,我可以看出這個小朋友的寫作與表達能力, 也可以看出這個小朋友是「做題家」「九官鳥」, 還是有自己想法,想要一個舞台去實踐的人。
1. 讀書基本的紀錄: - 紀錄書籍情報和感想是讀書的基本步驟。這個建議來自日本作者倉下忠憲的著書《ロギング仕事術》,在書中的第133頁提到這一點。從高中開始,我的閱讀記錄方式就一直在變化。 2. 書店探索的重要性: - 高中的國文老師李靜妤在第一堂課時告訴我們:「高中生要
人不容易區分理想與現實,會高估自己一天的產能,會以為事情要成靠毅力就可以。但實際有操作過的話,都會發現你其實對自己的狀況掌握沒有想像中那麼好。而計畫是用來制約你一天的行動,我也很有共感。如果一天沒有計畫,很容易不知道要做什麼,時間就消失在滑社群貼文,隨意逛影片之中了。
1. 回收沒有與研究主題相關經驗的申請人: - 自傳履歷中應顯示申請人是否有與我們研究主題相關的經歷。缺乏這類經驗的申請人可能無法滿足我們的需求,因為他們可能不具備執行所需工作的基本知識和技能。 2. 忽視申請人的基礎技能: - 我在自傳履歷中會特別尋找申請人是否具備與我們工作要求相符的基
步驟1 - 為筆記編號,建立索引 在Obsidian中,將每個筆記編上獨立編號,使其成為易於引用的對象。無論是日常寫作還是社交媒體分享的短文,每篇都有編號,有助於重讀和迭代。這種方法讓想法得以有效組織和管理,提高了信息檢索的效率。
1. 教育經費的來源: - 作為博士生,可能會好奇系上的設施、薪水和活動經費是從哪裡來的。這些經費實際上是從你的系所屬的學院來的,而學院的經費則是從更上層的機構來的,這包括政府機構或私人研究機構。 2. 政府與私人機構的資金來源: - 政府機構的經費來自國民的納稅錢,這些資
步驟一:對我指定的Paper寫 1-page Report,7天內提交 步驟二:與我一對一面試30分鐘 從步驟一,我可以看出這個小朋友的寫作與表達能力, 也可以看出這個小朋友是「做題家」「九官鳥」, 還是有自己想法,想要一個舞台去實踐的人。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
2019年時有一場很特別的TRPG推廣活動,名為「龍與地下城 5 版 GM 培訓課程」。 這活動特別地方在於,它是以培養龍與地下城系統的「DM」為目標,而不是「玩家」。對我來說,這是我實際開始接觸TRPG的起點。 這篇文章是想針對一些網路流言做釐清,並將幾年前的依稀記憶記錄下來…
Thumbnail
#2024GM春 #天國與地獄 雖然這款不禁讓我連想到2023年的「天使與惡魔」但它不是吃墩遊戲,而是大老二遊戲。看簡介有導入最近討論度很高的「接替手牌」機制,感覺有點意思,預備入手 #Bartendoubt (暫譯:吹牛調酒大師) 真正的調酒大師喝一口就知道比例,但是,你確定他說的是真的嗎
Polymetal International plc: Results of GM Polymetal International plc Results of GM Polymetal International plc (the “Company”) announces that at
Thumbnail
前陣子在滑噗浪河道時,看到了一波跟風潮提問了:分享一下對你而言,GM最重要的一項特質是什麼? 起初看到這個問題時,我猶豫了很久。除了選擇障礙的原因外,好像有其他更深的理由讓我遲遲無法下決定。 後來細思後,那個問題變成了:「面對TRPG時,GM最重要的特質是什麼?」
一個魚塘内的魚,從出世開始,便生活在這個魚塘之内,他們的視野也只能停留在魚塘之内,一直沒有受到外在的水流衝擊,哪怕出面風高浪急,也不管,也管不了。 日子長了,魚塘内的魚因爲沒有外在威脅,慢慢變得反應遲鈍,哪怕有漁夫拿著魚叉漁網,也不懂閃躲,漁夫們便樂翻了,一槍一條,一網一大羅,百發百中。 一家公司,
Thumbnail
GM 最新商業模式:幫特斯拉修車,趕特斯拉電動車銷售方面或許不太順利,但這家百年車廠在另一個市場找到契機:電動車維修。 不過也不用太傷心,目前賣電動車的廠商,還沒有人打贏特斯拉【註】,打不敗怎麼辦,那我就加入他,這是GM新嗅到的契機,雖然一開始看到這個新聞我覺得蠻好笑的,第一次有財經訊息讓我笑出來。
Thumbnail
在Tesla努力賣車賺錢的同時,有不少人覺得他們最後還是會被收購。然而,Tesla的市值其實已經超過許多傳統車廠的總和,應該是他們買別人吧?如果要買的話,Tesla會考慮乾脆買下一家傳統車廠,來取得更強大的生產和銷售能量嗎?
Thumbnail
​ 上面那隻是GM的奇怪吉祥物之一 看起來像企鵝跟紅面薑母鴨的混種XD 但是牠有肚臍ㄟ!!! 所以其實是胎生的??
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
2019年時有一場很特別的TRPG推廣活動,名為「龍與地下城 5 版 GM 培訓課程」。 這活動特別地方在於,它是以培養龍與地下城系統的「DM」為目標,而不是「玩家」。對我來說,這是我實際開始接觸TRPG的起點。 這篇文章是想針對一些網路流言做釐清,並將幾年前的依稀記憶記錄下來…
Thumbnail
#2024GM春 #天國與地獄 雖然這款不禁讓我連想到2023年的「天使與惡魔」但它不是吃墩遊戲,而是大老二遊戲。看簡介有導入最近討論度很高的「接替手牌」機制,感覺有點意思,預備入手 #Bartendoubt (暫譯:吹牛調酒大師) 真正的調酒大師喝一口就知道比例,但是,你確定他說的是真的嗎
Polymetal International plc: Results of GM Polymetal International plc Results of GM Polymetal International plc (the “Company”) announces that at
Thumbnail
前陣子在滑噗浪河道時,看到了一波跟風潮提問了:分享一下對你而言,GM最重要的一項特質是什麼? 起初看到這個問題時,我猶豫了很久。除了選擇障礙的原因外,好像有其他更深的理由讓我遲遲無法下決定。 後來細思後,那個問題變成了:「面對TRPG時,GM最重要的特質是什麼?」
一個魚塘内的魚,從出世開始,便生活在這個魚塘之内,他們的視野也只能停留在魚塘之内,一直沒有受到外在的水流衝擊,哪怕出面風高浪急,也不管,也管不了。 日子長了,魚塘内的魚因爲沒有外在威脅,慢慢變得反應遲鈍,哪怕有漁夫拿著魚叉漁網,也不懂閃躲,漁夫們便樂翻了,一槍一條,一網一大羅,百發百中。 一家公司,
Thumbnail
GM 最新商業模式:幫特斯拉修車,趕特斯拉電動車銷售方面或許不太順利,但這家百年車廠在另一個市場找到契機:電動車維修。 不過也不用太傷心,目前賣電動車的廠商,還沒有人打贏特斯拉【註】,打不敗怎麼辦,那我就加入他,這是GM新嗅到的契機,雖然一開始看到這個新聞我覺得蠻好笑的,第一次有財經訊息讓我笑出來。
Thumbnail
在Tesla努力賣車賺錢的同時,有不少人覺得他們最後還是會被收購。然而,Tesla的市值其實已經超過許多傳統車廠的總和,應該是他們買別人吧?如果要買的話,Tesla會考慮乾脆買下一家傳統車廠,來取得更強大的生產和銷售能量嗎?
Thumbnail
​ 上面那隻是GM的奇怪吉祥物之一 看起來像企鵝跟紅面薑母鴨的混種XD 但是牠有肚臍ㄟ!!! 所以其實是胎生的??