NAMMs 模仿人類記憶的選擇性保留和捨棄機制

更新於 2024/12/18閱讀時間約 2 分鐘
raw-image

想像一下,我們的大腦很厲害,能記住重要的東西,忘記不重要的細節。現在,有一種很酷的新技術叫做 “神經注意力記憶模型”(NAMM),它可以讓 Transformer 模型也像我們的大腦一樣聰明!

Transformer 模型就像語言模型的骨幹,它可以處理文字、圖片等等。但它們有一個問題,就是會一股腦地記住所有東西,就像一個塞滿東西的倉庫,很難快速找到需要的資訊。

經過語言訓練的完全進化的 NAMM 可以零樣本轉移到其他 Transformer,甚至跨輸入模式和任務域!

經過語言訓練的完全進化的 NAMM 可以零樣本轉移到其他 Transformer,甚至跨輸入模式和任務域!


NAMM 就像一個聰明的管理員,它會學習哪些資訊重要,哪些不重要。它會 “保留重要的資訊,丟掉不重要的雜訊”,讓 Transformer 模型運作更有效率。

NAMM 的厲害之處:

它可以讓 Transformer 模型在處理語言和寫程式碼時表現更好,而且還更省記憶體!
它可以應用在各種領域,像是視覺、機器人控制等等,即使它只接受過語言訓練!
它可以像玩樂高積木一樣,直接套用在不同的 Transformer 模型上,不需要重新訓練!

簡單來說,NAMM 就像給 Transformer 模型裝了一個升級版大腦,讓它們變得更聰明、更快速、更靈活!

透過進化優化、迭代變異和選擇網路參數來優化 NAMM,從而透過我們的新記憶系統產生最佳的語言建模表現。

透過進化優化、迭代變異和選擇網路參數來優化 NAMM,從而透過我們的新記憶系統產生最佳的語言建模表現。


研究人員還發現,NAMM 在處理不同任務時,會記住不同的資訊。例如,在處理程式碼時,它會刪除不必要的空格和註釋;而在處理自然語言時,它會忽略一些語法上的冗詞,專注於關鍵字和重要概念。

這項技術非常有潛力,未來可能會讓 transformer 模型 變得更強大,甚至可以像我們人類一樣,透過學習和記憶的迭代過程,不斷進化!


協助解決中小型製造企業數位轉型問題,傳產公司的痛點是缺乏 IT專業人才,我們提供便捷的智慧物聯網系統“EDC高效資料收集與分散式控制系統”。協助貴公司非專業人員短期培訓,即可自主完成物聯網部署,快速實現資料採集、資料可視、資料存儲和資料分析,助力傳統製造中小企業的數位轉型! 業務營銷|專案管理|工廠營運|跨業合作
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
隨著 AI 技術的不斷進步,我們正處於一個重要的轉折點,超連結作為信息組織和知識表達的重要工具正在被取代。 這不僅影響我們獲取信息的方式,也可能改變我們思考和創造知識的基本模式。未來,我們需要重新評估如何在AI摘要與超連結之間找到平衡,以保持思考的深度與多樣性。
Apollo Research 近期測試幾個最頂尖的 AI 聊天機器人,想看看它們會不會像人一樣「耍心機」。 研究人員設計了一些特別的情境,想讓這些 AI 幫他們做某件事。結果發現,這些 AI 不僅會想辦法達成目標,還會發現一些可能會阻礙它們的因素,像是「開發者其實不希望我這麼做」或是「系統裡有一
尼采在使用打字機後,其著作數量顯著增加,從平均三年一本增至一年一本半以上。 打字機不僅提高了尼采的寫作速度,更深刻地改變了他的意識和思維方式。 打字機這種「自動書寫」的機械性,與以往手寫的流暢性形成對比,影響了他的寫作風格: ● 從論證到格言:尼采原本的寫作風格以長句、複雜的推理和持續的反思為特
人們對自己知識的誤解,也就是所謂的“知識錯覺”,即使是相當聰明和受過教育的人,也可能會高估自己對世界運作方式的理解。 例如,大多數人認為自己能夠詳細解釋彩虹是如何形成的,但當被要求提供具體答案時,卻發現自己一無所知。這就是知識錯覺的一個例子。 知識錯覺可以導致各種後果。在工作中,它可能導致人們過
發育中的孩子,鞋子基本是半年一換,他們不斷長大,腳丫子也跟著變大! 一家美國公司設計了升縮鞋,鞋子會跟著腳一起長。它們把鞋底分成兩塊,中間使用彈性材料連接。它看起來是一個破裂或裂開的鞋底,鞋底上有專利的 Z 形圖案,這設計使鞋子可以拉伸。 為了穿著舒適,鞋面也採用升縮材料,編織成襪子狀的
隨著 AI 技術的不斷進步,我們正處於一個重要的轉折點,超連結作為信息組織和知識表達的重要工具正在被取代。 這不僅影響我們獲取信息的方式,也可能改變我們思考和創造知識的基本模式。未來,我們需要重新評估如何在AI摘要與超連結之間找到平衡,以保持思考的深度與多樣性。
Apollo Research 近期測試幾個最頂尖的 AI 聊天機器人,想看看它們會不會像人一樣「耍心機」。 研究人員設計了一些特別的情境,想讓這些 AI 幫他們做某件事。結果發現,這些 AI 不僅會想辦法達成目標,還會發現一些可能會阻礙它們的因素,像是「開發者其實不希望我這麼做」或是「系統裡有一
尼采在使用打字機後,其著作數量顯著增加,從平均三年一本增至一年一本半以上。 打字機不僅提高了尼采的寫作速度,更深刻地改變了他的意識和思維方式。 打字機這種「自動書寫」的機械性,與以往手寫的流暢性形成對比,影響了他的寫作風格: ● 從論證到格言:尼采原本的寫作風格以長句、複雜的推理和持續的反思為特
人們對自己知識的誤解,也就是所謂的“知識錯覺”,即使是相當聰明和受過教育的人,也可能會高估自己對世界運作方式的理解。 例如,大多數人認為自己能夠詳細解釋彩虹是如何形成的,但當被要求提供具體答案時,卻發現自己一無所知。這就是知識錯覺的一個例子。 知識錯覺可以導致各種後果。在工作中,它可能導致人們過
發育中的孩子,鞋子基本是半年一換,他們不斷長大,腳丫子也跟著變大! 一家美國公司設計了升縮鞋,鞋子會跟著腳一起長。它們把鞋底分成兩塊,中間使用彈性材料連接。它看起來是一個破裂或裂開的鞋底,鞋底上有專利的 Z 形圖案,這設計使鞋子可以拉伸。 為了穿著舒適,鞋面也採用升縮材料,編織成襪子狀的
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
有研究發現,人類大腦可能是一台大型量子電腦,此時做個大膽假設「大腦可以進行量子運作」,大腦中的電子神經元運作,就是接受來自宇宙深處的電訊號。
「長期趨勢表明“奇點 (Singularity)" 會在2045年迎來。」 「社群媒體與智慧型手機已經成為全天陪伴,連結了世界上大部分的人群。」 「GPT4與 Gemini 能將自然語言轉為程式碼,大大降低人與機器的邊界。」 「獲取人類基因序列的成本驟降,神經網路模擬生物機制,解鎖
Thumbnail
想像一下,只需用思想就能操控數位設備。這不再是科幻小說的情節,而是 Synchron 公司正在實現的未來。讓我們深入了解這項突破性技術,以及它如何為癱瘓患者帶來新的希望
Thumbnail
神經處理單元(NPU)主要用於加速人工智慧(AI)和機器學習(ML)任務。 以下是一些主要的應用領域和使用者: AI和機器學習:NPU是人工智慧和機器學習領域的直接受益者。這些技術依賴數據而蓬勃發展,NPU擅長消化和解釋大量資料集,使機器能夠以前所未有的速度學習。 智慧型設備和物聯網:在智慧型
解剖學上,人類有兩種不同的結構,讓我們能變得更聰明。 第一個結構是「大腦 Brain」,另一個結構是「拇指 Thumb」。 人類有拇指,可以製作工具,再從工具上製作工具, 製作一套一套的工具,如此增強我們的智力。 我們是唯一能持續發展工具增強智力的物種。 我們人類,創造工具,讓我們變得更聰明。
Thumbnail
美國學生其實並不輕鬆,完成program會花費很多時間精力,但也會有所收穫。 統整的學習,強調能應用於解決問題的能力、素養,實在不是紙筆測驗和抄寫背誦可以做到的。適當的統整學習方式,應該在知識認知學習之後,設計像機器人大賽這樣的專案(program),讓學生小組自行運用所學知識技能,統整完成任務。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
https://www.youtube.com/watch?v=f6XmHpPil6w剛好有幸朋友傳了這篇給我,趁著腦迴路還夠用的時候,來進行一些內容摘要與心得分享。 在提到演講內容之前,必須先有的一個概念:摩爾定律,由Intel的創始人之一摩爾所提出的,內容大概就是積體電路上可容納的電晶
Thumbnail
腦類器官 腦類器官指的是利用幹細胞培養出的三維神經組織。目前的研究已經證明腦類器官具備大腦細胞(包括神經元和星狀細胞)的基本結構和功能。近期,科學家利用腦類器官來作為人工智慧實體裝置。本文將簡介此研究。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
有研究發現,人類大腦可能是一台大型量子電腦,此時做個大膽假設「大腦可以進行量子運作」,大腦中的電子神經元運作,就是接受來自宇宙深處的電訊號。
「長期趨勢表明“奇點 (Singularity)" 會在2045年迎來。」 「社群媒體與智慧型手機已經成為全天陪伴,連結了世界上大部分的人群。」 「GPT4與 Gemini 能將自然語言轉為程式碼,大大降低人與機器的邊界。」 「獲取人類基因序列的成本驟降,神經網路模擬生物機制,解鎖
Thumbnail
想像一下,只需用思想就能操控數位設備。這不再是科幻小說的情節,而是 Synchron 公司正在實現的未來。讓我們深入了解這項突破性技術,以及它如何為癱瘓患者帶來新的希望
Thumbnail
神經處理單元(NPU)主要用於加速人工智慧(AI)和機器學習(ML)任務。 以下是一些主要的應用領域和使用者: AI和機器學習:NPU是人工智慧和機器學習領域的直接受益者。這些技術依賴數據而蓬勃發展,NPU擅長消化和解釋大量資料集,使機器能夠以前所未有的速度學習。 智慧型設備和物聯網:在智慧型
解剖學上,人類有兩種不同的結構,讓我們能變得更聰明。 第一個結構是「大腦 Brain」,另一個結構是「拇指 Thumb」。 人類有拇指,可以製作工具,再從工具上製作工具, 製作一套一套的工具,如此增強我們的智力。 我們是唯一能持續發展工具增強智力的物種。 我們人類,創造工具,讓我們變得更聰明。
Thumbnail
美國學生其實並不輕鬆,完成program會花費很多時間精力,但也會有所收穫。 統整的學習,強調能應用於解決問題的能力、素養,實在不是紙筆測驗和抄寫背誦可以做到的。適當的統整學習方式,應該在知識認知學習之後,設計像機器人大賽這樣的專案(program),讓學生小組自行運用所學知識技能,統整完成任務。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
https://www.youtube.com/watch?v=f6XmHpPil6w剛好有幸朋友傳了這篇給我,趁著腦迴路還夠用的時候,來進行一些內容摘要與心得分享。 在提到演講內容之前,必須先有的一個概念:摩爾定律,由Intel的創始人之一摩爾所提出的,內容大概就是積體電路上可容納的電晶
Thumbnail
腦類器官 腦類器官指的是利用幹細胞培養出的三維神經組織。目前的研究已經證明腦類器官具備大腦細胞(包括神經元和星狀細胞)的基本結構和功能。近期,科學家利用腦類器官來作為人工智慧實體裝置。本文將簡介此研究。