Native Sparse Attention (NSA) 機制概述 Native Sparse Attention

Native Sparse Attention (NSA) 機制概述 Native Sparse Attention

更新於 發佈於 閱讀時間約 2 分鐘
raw-image

Native Sparse Attention (NSA) 機制概述


Native Sparse Attention (NSA) 是一種新型的稀疏注意力機制,旨在提高長文本的訓練和推理效率。


這一機制由中國的人工智慧公司 DeepSeek 於 2025 年 2 月 18 日正式發布,並在其技術論文中詳細介紹了其設計理念和核心組件。


NSA 的核心特點


硬體對齊:

NSA 的設計考慮了現代硬體的特性,旨在加速推理過程,同時降低預訓練的成本,而不會犧牲模型的性能。


動態層次稀疏策略:

這一策略結合了粗粒度的標記壓縮和細粒度的標記選擇,能夠在保持全局上下文的同時,顯著提高處理速度。


高效的長文本處理:

NSA 特別適用於超快速的長文本訓練與推理,這使得它在處理大規模數據時表現出色。

技術創新


NSA 機制的創新之處在於其能夠在訓練過程中進行端到端的優化,並在推理階段顯著提高效率。


這一機制的推出被認為是對現有全注意力模型的一次重要補充,因為它在多項基準測試中表現出色,尤其是在長文本任務和基於指令的推理方面。

市場影響


NSA 的發布引起了市場的廣泛關注,相關的 AI 代幣如 SingularityNET (AGIX) 和 Fetch.AI (FET) 在發布後的短時間內出現了顯著的價格上漲,顯示出市場對於 NSA 能夠推動 AI 技術進步的信心。


Native Sparse Attention 機制的推出不僅在技術上具有創新性,還可能對 AI 相關的市場產生深遠的影響。

avatar-img
AI.ESG.數位轉型顧問 沈重宗
19會員
345內容數
留言
avatar-img
留言分享你的想法!
xAI Grok 3 正式發表 Grok 3 概述 xAI 於 2025 年 2 月 18 日正式發表了其最新的 AI 聊天機器人 Grok 3。 這款聊天機器人被稱為「地球上最聰明的 AI」,其運算能力比前代 Grok 2 提升了十倍,並且採用了合成數據進行訓練,具備更強的推理能力和自我
Grok 3是由伊隆·馬斯克創辦的人工智慧公司xAI推出的最新一代聊天機器人,預計於2025年2月18日正式發布。 馬斯克自信地稱其為「地球上最聰明的AI」,並認為它將超越目前市場上所有的競爭對手,包括OpenAI的ChatGPT和中國的DeepSeek等。 Grok 3的開發背景 G
環境部長彭啓明於近日表示,台灣將於今年開始實施碳有價政策,並要求進口廠商試行申報碳足跡。 這一措施旨在比照歐盟的碳邊境調整機制(CBAM),以促進減碳並保護本地產業的競爭力。 政策背景 根據彭啓明的說法,台灣的碳費制度將於2023年正式啟動,並將針對進口的水泥和鋼鐵等高碳排放產品進行碳
人工智慧基本法與環境、社會及公司治理(ESG)之間的關係日益受到重視,尤其在美國、歐盟、英國和日本等國的立法考量中,這一議題顯得尤為重要。 人工智慧基本法的背景 各國在制定人工智慧(AI)相關法規時,普遍面臨如何平衡技術創新與風險管理的挑戰。台灣目前正在研擬《人工智慧基本法》,希望能在促
純強化式學習的概念與應用 純強化式學習(Pure Reinforcement Learning, RL)是一種機器學習方法,智能體(agent)通過與環境的互動來學習行為策略,目標是最大化累積獎勵。這種學習方式不依賴於標記數據,而是通過試錯過程來獲得經驗,從而改進其決策能力。 基本原理 在
邊緣AI四大商機噴發 隨著人工智慧(AI)技術的快速發展,邊緣AI的應用逐漸受到企業的重視,並成為未來投資的焦點。 根據最新的研究,2024年全球邊緣AI市場的規模預計將達到約211.9億美元,並在2034年增長至約1430.6億美元,年複合成長率(CAGR)為21.04%。 主要商機
xAI Grok 3 正式發表 Grok 3 概述 xAI 於 2025 年 2 月 18 日正式發表了其最新的 AI 聊天機器人 Grok 3。 這款聊天機器人被稱為「地球上最聰明的 AI」,其運算能力比前代 Grok 2 提升了十倍,並且採用了合成數據進行訓練,具備更強的推理能力和自我
Grok 3是由伊隆·馬斯克創辦的人工智慧公司xAI推出的最新一代聊天機器人,預計於2025年2月18日正式發布。 馬斯克自信地稱其為「地球上最聰明的AI」,並認為它將超越目前市場上所有的競爭對手,包括OpenAI的ChatGPT和中國的DeepSeek等。 Grok 3的開發背景 G
環境部長彭啓明於近日表示,台灣將於今年開始實施碳有價政策,並要求進口廠商試行申報碳足跡。 這一措施旨在比照歐盟的碳邊境調整機制(CBAM),以促進減碳並保護本地產業的競爭力。 政策背景 根據彭啓明的說法,台灣的碳費制度將於2023年正式啟動,並將針對進口的水泥和鋼鐵等高碳排放產品進行碳
人工智慧基本法與環境、社會及公司治理(ESG)之間的關係日益受到重視,尤其在美國、歐盟、英國和日本等國的立法考量中,這一議題顯得尤為重要。 人工智慧基本法的背景 各國在制定人工智慧(AI)相關法規時,普遍面臨如何平衡技術創新與風險管理的挑戰。台灣目前正在研擬《人工智慧基本法》,希望能在促
純強化式學習的概念與應用 純強化式學習(Pure Reinforcement Learning, RL)是一種機器學習方法,智能體(agent)通過與環境的互動來學習行為策略,目標是最大化累積獎勵。這種學習方式不依賴於標記數據,而是通過試錯過程來獲得經驗,從而改進其決策能力。 基本原理 在
邊緣AI四大商機噴發 隨著人工智慧(AI)技術的快速發展,邊緣AI的應用逐漸受到企業的重視,並成為未來投資的焦點。 根據最新的研究,2024年全球邊緣AI市場的規模預計將達到約211.9億美元,並在2034年增長至約1430.6億美元,年複合成長率(CAGR)為21.04%。 主要商機