【AI觀察日記】NPU及小模型帶來新機會

發佈於產業/投資等個房間

更新於 2025/07/31發佈於 2025/02/03閱讀時間約 4 分鐘

2025年2月快速崛起的 DeepSeek ，透過「知識蒸餾（Knowledge Distillation）」的方法，從 OpenAI 的大型模型中萃取出小型高效的語言模型。這不僅降低了運算成本，也讓 AI 應用變得更具普及性。這種趨勢結合 NPU（神經處理單元）技術，將為語言模型的應用場景帶來顛覆性的改變。

※ AI 的發展方向：小模型、低成本、客製化

小模型的崛起：大型語言模型雖然強大，但運行成本高昂。DeepSeek 透過蒸餾技術達到模型輕量化，同時也保留了核心能力。
降低部署成本：小型模型的計算需求降低，使其能夠在成本更低的硬體上運行，例如行動裝置、邊緣設備等。
高度客製化：企業與個人可以根據自身需求微調 AI 模型，提升效率與應用價值。

※ 消費性市場的催化劑：NPU + 小模型的全新體驗

NPU的介紹及應用可以參考這部影片：

簡而言之，NPU（Neural Processing Unit）是一種專門設計來加速人工智慧（AI）和機器學習（ML）推理運算的處理器。與傳統的 CPU（中央處理器）或 GPU（圖形處理器）相比，NPU 針對神經網路運算進行了優化，能夠以更低的功耗執行深度學習任務。

目前大多數 AI 應用仍依賴 Nvidia GPU 進行推理，但隨著 NPU 技術的發展，企業與亦可以選擇NPU，作為更具成本效益的解決方案。

除了NPU以外，大廠也會開發自有ASIC用於AI運算，以降低對於GPU依賴。如Google Cloud TPU v4、Huawei Ascend 910、AWS Inferentia。

AI 模型的輕量化讓手機、筆電等消費級設備得以運行高效的語言模型。透過內建 NPU 或 ASIC 晶片，手機與電腦將能夠即時進行語音識別、文字生成、圖像處理等 AI 任務，而無需仰賴雲端運算。

※ 影響與市場機會

刺激手機更換需求：隨著 AI 功能的提升，未來 AI 手機將能夠提供更強的智慧助手、即時翻譯、影像增強等功能，促使消費者升級設備。
聯發科受惠：聯發科等晶片製造商將受惠於 AI 手機市場的擴展，NPU 成為新一代晶片的標準配置。
利基型記憶體需求增長：AI應用能帶動消費性電子的去庫存化，也帶動特定記憶體市場的成長。
降低導入 AI 應用門檻：經濟實惠的解決方案，有助於 AI 應用的普及化，讓更多企業能在本地部署 AI 模型，處理個人化問題，如企業內部搜尋、專屬 AI 助理等。

※ 結論：NPU + 小模型開創 AI 新時代

DeepSeek 展示了小型語言模型的潛力，而 NPU 則為其提供了高效能的運行環境。隨著 AI 手機、PC、企業地端 AI 推論的發展，未來的 AI 生態將更加去中心化，不再依賴昂貴的 GPU，而是轉向更節能、高效、低成本的解決方案。這將帶來 AI 技術的普及化，並創造更多新的商業機會。

EMO先生的沙龍產業/投資EMO先生的沙龍系統/程式

留言

留言分享你的想法！

EMO先生的沙龍

159會員

76內容數

本專題主要放一些投資理財方面的個人研究，投資理念偏向價值投資，習慣從產業的角度、產品營收佔比分析公司體質，近期研究的主題著重於：（1）半導體產業鏈：IC設計、IC製造、CoWos （2）重電產業鏈：台電強韌電網、智慧電網計畫（3）營建股追蹤：隆大、新美齊、憶聲、順達、名軒

EMO先生的沙龍的其他內容

2025/02/28

南亞科｜焦點新聞｜DDR5、DDR4市場競爭與邊緣運算的未來佈局

南亞科(2408)股價來到近期波段高點，本文探討其在DDR5、DDR4市場的競爭力，以及在邊緣運算的未來佈局。儘管中國長鑫存儲的崛起帶來競爭壓力，但南亞科可望受惠於轉單效應及高階DDR5高密度模組市場的發展。本文也分析了市場對於南亞科股價的觀望態度，以及其在去庫存化壓力下的挑戰與機會。

2025/02/28

南亞科｜焦點新聞｜DDR5、DDR4市場競爭與邊緣運算的未來佈局

2025/02/15

本週科技股精選動態｜聯發科 (2454) ｜群聯電子 (8299)

聯發科發表Breeze 2繁體中文多模態大語言模型，具備聊天、視覺多模態及工具使用等多元功能，並推出臺灣口音語音合成與Android APP，致力於推廣邊緣運算與NPU技術。群聯電子受惠美國對中國半導體產業的管制政策，因其NAND Flash控制IC設計能力而受惠，股價上漲。

2025/02/15

本週科技股精選動態｜聯發科 (2454) ｜群聯電子 (8299)

2025/02/10

聯發科短評｜Edge Computing｜估值的藝術

聯發科2024年營收創歷史次高，2025年成長動能來自天璣9400/9300系列晶片、AI與邊緣運算、Wi-Fi 7及車用業務。然而，市場預期2025年營收增長放緩，毛利率及獲利成長也將面臨挑戰，需關注晶片代工成本、ARM授權費及營運費用等風險。

2025/02/10

聯發科短評｜Edge Computing｜估值的藝術

看更多

你可能也想看

EMO先生的沙龍

【AI觀察日記】NPU及小模型帶來新機會

DeepSeek 開發出透過知識蒸餾技術打造的小型高效語言模型，結合 NPU 技術，降低 AI 應用成本並提升普及性。此趨勢將促進 AI 手機及 PC 市場發展，使聯發科等晶片製造商及利基型記憶體市場受惠，並降低企業導入 AI 應用的門檻。

2025/02/03

2025/02/03

GPU不香了？NPU的低功耗，AI PC能否讓PC重新成為引領世界的潮流｜怪獸科技公司

AI PC 是將 AI 模型與傳統 PC 緊密結合的裝置，為本地 AI 運算能力，更能保護用戶的隱私和數據安全。 AI PC 具有 NPU、CPU 以及 GPU，並能夠具備高算力 AI 應用的需求，在 AI 運算性能、效率跟功耗方面，NPU 相較 CPU 與 GPU 具有大幅優勢。

#AIPC#AI#COMPUTEX

2024/07/31

怪獸科技公司✖️沙龍

GPU不香了？NPU的低功耗，AI PC能否讓PC重新成為引領世界的潮流｜怪獸科技公司

#AIPC#AI#COMPUTEX

2024/07/31

真師傅的AI沙龍

未來是否會出現更節能高效的AI處理器取代NPU？

未來的AI處理器發展趨勢將會持續專注於提升效能並降低能源消耗。以下是一些可能的發展方向：新一代NPU：例如，英特爾已經發表了新一代AI PC處理器Lunar Lake，該處理器的NPU算力是前一代的3倍多，且耗能較前一代低40%。多模態生成式AI的興起：這種AI結合了文本、圖像、視頻等多

#取代NPU#未來更節能高效的AI處理器取代NPU#更節能高效的AI處理器

2024/07/18

真師傅的AI沙龍

未來是否會出現更節能高效的AI處理器取代NPU？

#取代NPU#未來更節能高效的AI處理器取代NPU#更節能高效的AI處理器

2024/07/18

真師傅的AI沙龍

NPU（神經網路處理器）目前的全球市場佔有率僅有 8% 是用在哪些方面? 誰在用呢?

神經處理單元（NPU）主要用於加速人工智慧（AI）和機器學習（ML）任務。以下是一些主要的應用領域和使用者： AI和機器學習：NPU是人工智慧和機器學習領域的直接受益者。這些技術依賴數據而蓬勃發展，NPU擅長消化和解釋大量資料集，使機器能夠以前所未有的速度學習。智慧型設備和物聯網：在智慧型

#NPU是用在哪些方面#誰在用NPU

2024/07/18

真師傅的AI沙龍

NPU（神經網路處理器）目前的全球市場佔有率僅有 8% 是用在哪些方面? 誰在用呢?

#NPU是用在哪些方面#誰在用NPU

2024/07/18

商業洞察趨勢的沙龍

同一晶片，雙重革命：GPU在AI和量子計算的嶄新前景

GPU，既能支援大規模人工智慧計算，現在也能夠支援一些量子軟體，各家公司都在密切關注這個發展趨勢。 GPU已經改變了人工智慧的格局，現在也準備投身量子計算領域，儘管量子技術尚未成熟，但許多公司已經找到可以在與人工智慧相同的晶片上，運行複雜的量子演算法。近年來，由於GPU和其他先進晶片提供的計算

#GPU#人工智慧#晶片

2023/09/25

商業洞察趨勢的沙龍

同一晶片，雙重革命：GPU在AI和量子計算的嶄新前景

#GPU#人工智慧#晶片

2023/09/25

股市鴿園地

奪Google AI大單?聯發科重訊駁斥傳言

你好，我是股市鴿~ 聯發科與Google合作開發AI伺服器晶片，展現AI實力大家好，歡迎來到我的部落格。今天我想跟大家分享一個有關AI的熱門話題，那就是聯發科與Google的合作計畫。據媒體報導12，聯發科將協助Google打造最新的AI伺服器晶片，並將以台積電5奈米製程生產，力拚明年初量產。這意

#Google#聯發科#AI伺服器

2023/06/20

股市鴿園地

奪Google AI大單?聯發科重訊駁斥傳言

#Google#聯發科#AI伺服器

2023/06/20

股市鴿園地

聯發科傳奪 Google AI 大單

你好，我是股市鴿~ Google與聯發科合作開發AI伺服器晶片 Google是全球最大的網路搜尋引擎，也是人工智慧（AI）的領導者之一。Google多項服務都與AI有關，例如語音助理、翻譯、地圖、雲端運算等。為了提升AI的運算效能和效率，Google自行開發了專用於深度學習的處理器晶片，稱為張量處理

#Google#聯發科#AI伺服器

2023/06/19