Native Sparse Attention (NSA) 機制概述 Native Sparse Attention

更新於 發佈於 閱讀時間約 2 分鐘
raw-image

Native Sparse Attention (NSA) 機制概述


Native Sparse Attention (NSA) 是一種新型的稀疏注意力機制,旨在提高長文本的訓練和推理效率。


這一機制由中國的人工智慧公司 DeepSeek 於 2025 年 2 月 18 日正式發布,並在其技術論文中詳細介紹了其設計理念和核心組件。


NSA 的核心特點


硬體對齊:

NSA 的設計考慮了現代硬體的特性,旨在加速推理過程,同時降低預訓練的成本,而不會犧牲模型的性能。


動態層次稀疏策略:

這一策略結合了粗粒度的標記壓縮和細粒度的標記選擇,能夠在保持全局上下文的同時,顯著提高處理速度。


高效的長文本處理:

NSA 特別適用於超快速的長文本訓練與推理,這使得它在處理大規模數據時表現出色。

技術創新


NSA 機制的創新之處在於其能夠在訓練過程中進行端到端的優化,並在推理階段顯著提高效率。


這一機制的推出被認為是對現有全注意力模型的一次重要補充,因為它在多項基準測試中表現出色,尤其是在長文本任務和基於指令的推理方面。

市場影響


NSA 的發布引起了市場的廣泛關注,相關的 AI 代幣如 SingularityNET (AGIX) 和 Fetch.AI (FET) 在發布後的短時間內出現了顯著的價格上漲,顯示出市場對於 NSA 能夠推動 AI 技術進步的信心。


Native Sparse Attention 機制的推出不僅在技術上具有創新性,還可能對 AI 相關的市場產生深遠的影響。

留言0
查看全部
avatar-img
發表第一個留言支持創作者!
xAI Grok 3 正式發表 Grok 3 概述 xAI 於 2025 年 2 月 18 日正式發表了其最新的 AI 聊天機器人 Grok 3。 這款聊天機器人被稱為「地球上最聰明的 AI」,其運算能力比前代 Grok 2 提升了十倍,並且採用了合成數據進行訓練,具備更強的推理能力和自我
Grok 3是由伊隆·馬斯克創辦的人工智慧公司xAI推出的最新一代聊天機器人,預計於2025年2月18日正式發布。 馬斯克自信地稱其為「地球上最聰明的AI」,並認為它將超越目前市場上所有的競爭對手,包括OpenAI的ChatGPT和中國的DeepSeek等。 Grok 3的開發背景 G
環境部長彭啓明於近日表示,台灣將於今年開始實施碳有價政策,並要求進口廠商試行申報碳足跡。 這一措施旨在比照歐盟的碳邊境調整機制(CBAM),以促進減碳並保護本地產業的競爭力。 政策背景 根據彭啓明的說法,台灣的碳費制度將於2023年正式啟動,並將針對進口的水泥和鋼鐵等高碳排放產品進行碳
人工智慧基本法與環境、社會及公司治理(ESG)之間的關係日益受到重視,尤其在美國、歐盟、英國和日本等國的立法考量中,這一議題顯得尤為重要。 人工智慧基本法的背景 各國在制定人工智慧(AI)相關法規時,普遍面臨如何平衡技術創新與風險管理的挑戰。台灣目前正在研擬《人工智慧基本法》,希望能在促
純強化式學習的概念與應用 純強化式學習(Pure Reinforcement Learning, RL)是一種機器學習方法,智能體(agent)通過與環境的互動來學習行為策略,目標是最大化累積獎勵。這種學習方式不依賴於標記數據,而是通過試錯過程來獲得經驗,從而改進其決策能力。 基本原理 在
邊緣AI四大商機噴發 隨著人工智慧(AI)技術的快速發展,邊緣AI的應用逐漸受到企業的重視,並成為未來投資的焦點。 根據最新的研究,2024年全球邊緣AI市場的規模預計將達到約211.9億美元,並在2034年增長至約1430.6億美元,年複合成長率(CAGR)為21.04%。 主要商機
xAI Grok 3 正式發表 Grok 3 概述 xAI 於 2025 年 2 月 18 日正式發表了其最新的 AI 聊天機器人 Grok 3。 這款聊天機器人被稱為「地球上最聰明的 AI」,其運算能力比前代 Grok 2 提升了十倍,並且採用了合成數據進行訓練,具備更強的推理能力和自我
Grok 3是由伊隆·馬斯克創辦的人工智慧公司xAI推出的最新一代聊天機器人,預計於2025年2月18日正式發布。 馬斯克自信地稱其為「地球上最聰明的AI」,並認為它將超越目前市場上所有的競爭對手,包括OpenAI的ChatGPT和中國的DeepSeek等。 Grok 3的開發背景 G
環境部長彭啓明於近日表示,台灣將於今年開始實施碳有價政策,並要求進口廠商試行申報碳足跡。 這一措施旨在比照歐盟的碳邊境調整機制(CBAM),以促進減碳並保護本地產業的競爭力。 政策背景 根據彭啓明的說法,台灣的碳費制度將於2023年正式啟動,並將針對進口的水泥和鋼鐵等高碳排放產品進行碳
人工智慧基本法與環境、社會及公司治理(ESG)之間的關係日益受到重視,尤其在美國、歐盟、英國和日本等國的立法考量中,這一議題顯得尤為重要。 人工智慧基本法的背景 各國在制定人工智慧(AI)相關法規時,普遍面臨如何平衡技術創新與風險管理的挑戰。台灣目前正在研擬《人工智慧基本法》,希望能在促
純強化式學習的概念與應用 純強化式學習(Pure Reinforcement Learning, RL)是一種機器學習方法,智能體(agent)通過與環境的互動來學習行為策略,目標是最大化累積獎勵。這種學習方式不依賴於標記數據,而是通過試錯過程來獲得經驗,從而改進其決策能力。 基本原理 在
邊緣AI四大商機噴發 隨著人工智慧(AI)技術的快速發展,邊緣AI的應用逐漸受到企業的重視,並成為未來投資的焦點。 根據最新的研究,2024年全球邊緣AI市場的規模預計將達到約211.9億美元,並在2034年增長至約1430.6億美元,年複合成長率(CAGR)為21.04%。 主要商機
你可能也想看
Google News 追蹤
提問的內容越是清晰,強者、聰明人越能在短時間內做判斷、給出精準的建議,他們會對你產生「好印象」,認定你是「積極」的人,有機會、好人脈會不自覺地想引薦給你
「長期趨勢表明“奇點 (Singularity)" 會在2045年迎來。」 「社群媒體與智慧型手機已經成為全天陪伴,連結了世界上大部分的人群。」 「GPT4與 Gemini 能將自然語言轉為程式碼,大大降低人與機器的邊界。」 「獲取人類基因序列的成本驟降,神經網路模擬生物機制,解鎖
Thumbnail
隨著近年來的AI浪潮,讓大家普遍對於AI後續的發展充滿了期待。今年所舉辦的台北電腦展 (Computex),讓這樣的相關的討論更加熱烈。有在投資的讀者們或多或少都會看到相關產業鏈的梳理,像是AI伺服器需要什麼奈米的晶圓製程、需要那些先進封裝測試技術、需要什麼樣的水冷技術、哪些的OEM廠 (O
Thumbnail
前言 承上一篇筆記文章,繼續閱讀推薦的第二篇論文:Identity Mappings in Deep Residual Networks—Kaiming He、Xiangyu Zhang、Shaoqing Ren、Jian Sun。也是一樣的發表者,內容是對他們之前發表的Deep Residual
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
感知器是一種基本的神經網路模型,用於二分類問題。它模擬了人腦神經元的工作原理,通過調整權重和偏差值來達到預測和分類的目的。 感知器流程 輸入 資料的輸入: 輸入層接受資料的輸入,每個輸入對應一個特徵,還有一個固定的偏差神經元。 資料經過每個神經元時,會乘上相應的
Thumbnail
在現今這個信息爆炸的時代,我們如何解讀信息對世界的影響?
Thumbnail
本文章探討了多智能體系統(MAS)在生成式AI領域中的應用,以及GenAI對於AI_MCU和Software defined hardware的影響。文章還總結了SDH設計模式對數據科學和人工智能時代的影響,並提供了有關GenAI的一些額外信息。
別小看語言模型,我們的歷史記載,不是都靠著文本嗎?
Thumbnail
近年來,隨著科技的迅速發展,軟體開發領域也在不斷演進。在這股潮流中,敏捷開發備受矚目,成為企業追求靈活性和快速交付的首選方法。本文將探討敏捷開發在台灣的現況,深入了解這一趨勢的興起、面臨的挑戰以及實踐的實際情況。
提問的內容越是清晰,強者、聰明人越能在短時間內做判斷、給出精準的建議,他們會對你產生「好印象」,認定你是「積極」的人,有機會、好人脈會不自覺地想引薦給你
「長期趨勢表明“奇點 (Singularity)" 會在2045年迎來。」 「社群媒體與智慧型手機已經成為全天陪伴,連結了世界上大部分的人群。」 「GPT4與 Gemini 能將自然語言轉為程式碼,大大降低人與機器的邊界。」 「獲取人類基因序列的成本驟降,神經網路模擬生物機制,解鎖
Thumbnail
隨著近年來的AI浪潮,讓大家普遍對於AI後續的發展充滿了期待。今年所舉辦的台北電腦展 (Computex),讓這樣的相關的討論更加熱烈。有在投資的讀者們或多或少都會看到相關產業鏈的梳理,像是AI伺服器需要什麼奈米的晶圓製程、需要那些先進封裝測試技術、需要什麼樣的水冷技術、哪些的OEM廠 (O
Thumbnail
前言 承上一篇筆記文章,繼續閱讀推薦的第二篇論文:Identity Mappings in Deep Residual Networks—Kaiming He、Xiangyu Zhang、Shaoqing Ren、Jian Sun。也是一樣的發表者,內容是對他們之前發表的Deep Residual
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
感知器是一種基本的神經網路模型,用於二分類問題。它模擬了人腦神經元的工作原理,通過調整權重和偏差值來達到預測和分類的目的。 感知器流程 輸入 資料的輸入: 輸入層接受資料的輸入,每個輸入對應一個特徵,還有一個固定的偏差神經元。 資料經過每個神經元時,會乘上相應的
Thumbnail
在現今這個信息爆炸的時代,我們如何解讀信息對世界的影響?
Thumbnail
本文章探討了多智能體系統(MAS)在生成式AI領域中的應用,以及GenAI對於AI_MCU和Software defined hardware的影響。文章還總結了SDH設計模式對數據科學和人工智能時代的影響,並提供了有關GenAI的一些額外信息。
別小看語言模型,我們的歷史記載,不是都靠著文本嗎?
Thumbnail
近年來,隨著科技的迅速發展,軟體開發領域也在不斷演進。在這股潮流中,敏捷開發備受矚目,成為企業追求靈活性和快速交付的首選方法。本文將探討敏捷開發在台灣的現況,深入了解這一趨勢的興起、面臨的挑戰以及實踐的實際情況。