【AI觀察日記】NPU及小模型帶來新機會

EMO先生-avatar-img
發佈於產業/投資 個房間
更新 發佈閱讀 4 分鐘

2025年2月快速崛起的 DeepSeek ,透過「知識蒸餾(Knowledge Distillation)」的方法,從 OpenAI 的大型模型中萃取出小型高效的語言模型。這不僅降低了運算成本,也讓 AI 應用變得更具普及性。這種趨勢結合 NPU(神經處理單元)技術,將為語言模型的應用場景帶來顛覆性的改變。

raw-image

※ AI 的發展方向:小模型、低成本、客製化

  1. 小模型的崛起:大型語言模型雖然強大,但運行成本高昂。DeepSeek 透過蒸餾技術達到模型輕量化,同時也保留了核心能力。
  2. 降低部署成本:小型模型的計算需求降低,使其能夠在成本更低的硬體上運行,例如行動裝置、邊緣設備等。
  3. 高度客製化:企業與個人可以根據自身需求微調 AI 模型,提升效率與應用價值。

※ 消費性市場的催化劑:NPU + 小模型的全新體驗

NPU的介紹及應用可以參考這部影片:

簡而言之,NPU(Neural Processing Unit)是一種專門設計來加速人工智慧(AI)和機器學習(ML)推理運算的處理器。與傳統的 CPU(中央處理器)或 GPU(圖形處理器)相比,NPU 針對神經網路運算進行了優化,能夠以更低的功耗執行深度學習任務。

目前大多數 AI 應用仍依賴 Nvidia GPU 進行推理,但隨著 NPU 技術的發展,企業與亦可以選擇NPU,作為更具成本效益的解決方案。

除了NPU以外,大廠也會開發自有ASIC用於AI運算,以降低對於GPU依賴。如Google Cloud TPU v4Huawei Ascend 910AWS Inferentia

AI 模型的輕量化讓手機、筆電等消費級設備得以運行高效的語言模型。透過內建 NPU 或 ASIC 晶片,手機與電腦將能夠即時進行語音識別、文字生成、圖像處理等 AI 任務,而無需仰賴雲端運算。

影響與市場機會

  1. 刺激手機更換需求:隨著 AI 功能的提升,未來 AI 手機將能夠提供更強的智慧助手、即時翻譯、影像增強等功能,促使消費者升級設備。
  2. 聯發科受惠:聯發科等晶片製造商將受惠於 AI 手機市場的擴展,NPU 成為新一代晶片的標準配置。
  3. 利基型記憶體需求增長:AI應用能帶動消費性電子的去庫存化,也帶動特定記憶體市場的成長。
  4. 降低導入 AI 應用門檻:經濟實惠的解決方案,有助於 AI 應用的普及化,讓更多企業能在本地部署 AI 模型,處理個人化問題,如企業內部搜尋、專屬 AI 助理等

結論:NPU + 小模型開創 AI 新時代

DeepSeek 展示了小型語言模型的潛力,而 NPU 則為其提供了高效能的運行環境。隨著 AI 手機、PC、企業地端 AI 推論的發展,未來的 AI 生態將更加去中心化,不再依賴昂貴的 GPU,而是轉向更節能、高效、低成本的解決方案。這將帶來 AI 技術的普及化,並創造更多新的商業機會。

留言
avatar-img
EMO先生的沙龍
160會員
94內容數
本專題主要放一些投資理財方面的個人研究,投資理念偏向價值投資,習慣從產業的角度、產品營收佔比分析公司體質,近期研究的主題著重於: (1)半導體產業鏈:IC設計、IC製造、CoWos (2)重電產業鏈:台電強韌電網、智慧電網計畫 (3)營建股追蹤:隆大、新美齊、憶聲、順達、名軒
EMO先生的沙龍的其他內容
2025/02/28
南亞科(2408)股價來到近期波段高點,本文探討其在DDR5、DDR4市場的競爭力,以及在邊緣運算的未來佈局。儘管中國長鑫存儲的崛起帶來競爭壓力,但南亞科可望受惠於轉單效應及高階DDR5高密度模組市場的發展。本文也分析了市場對於南亞科股價的觀望態度,以及其在去庫存化壓力下的挑戰與機會。
Thumbnail
2025/02/28
南亞科(2408)股價來到近期波段高點,本文探討其在DDR5、DDR4市場的競爭力,以及在邊緣運算的未來佈局。儘管中國長鑫存儲的崛起帶來競爭壓力,但南亞科可望受惠於轉單效應及高階DDR5高密度模組市場的發展。本文也分析了市場對於南亞科股價的觀望態度,以及其在去庫存化壓力下的挑戰與機會。
Thumbnail
2025/02/15
聯發科發表Breeze 2繁體中文多模態大語言模型,具備聊天、視覺多模態及工具使用等多元功能,並推出臺灣口音語音合成與Android APP,致力於推廣邊緣運算與NPU技術。群聯電子受惠美國對中國半導體產業的管制政策,因其NAND Flash控制IC設計能力而受惠,股價上漲。
Thumbnail
2025/02/15
聯發科發表Breeze 2繁體中文多模態大語言模型,具備聊天、視覺多模態及工具使用等多元功能,並推出臺灣口音語音合成與Android APP,致力於推廣邊緣運算與NPU技術。群聯電子受惠美國對中國半導體產業的管制政策,因其NAND Flash控制IC設計能力而受惠,股價上漲。
Thumbnail
2025/02/10
聯發科2024年營收創歷史次高,2025年成長動能來自天璣9400/9300系列晶片、AI與邊緣運算、Wi-Fi 7及車用業務。然而,市場預期2025年營收增長放緩,毛利率及獲利成長也將面臨挑戰,需關注晶片代工成本、ARM授權費及營運費用等風險。
Thumbnail
2025/02/10
聯發科2024年營收創歷史次高,2025年成長動能來自天璣9400/9300系列晶片、AI與邊緣運算、Wi-Fi 7及車用業務。然而,市場預期2025年營收增長放緩,毛利率及獲利成長也將面臨挑戰,需關注晶片代工成本、ARM授權費及營運費用等風險。
Thumbnail
看更多
你可能也想看
Thumbnail
神經處理單元(NPU)主要用於加速人工智慧(AI)和機器學習(ML)任務。 以下是一些主要的應用領域和使用者: AI和機器學習:NPU是人工智慧和機器學習領域的直接受益者。這些技術依賴數據而蓬勃發展,NPU擅長消化和解釋大量資料集,使機器能夠以前所未有的速度學習。 智慧型設備和物聯網:在智慧型
Thumbnail
神經處理單元(NPU)主要用於加速人工智慧(AI)和機器學習(ML)任務。 以下是一些主要的應用領域和使用者: AI和機器學習:NPU是人工智慧和機器學習領域的直接受益者。這些技術依賴數據而蓬勃發展,NPU擅長消化和解釋大量資料集,使機器能夠以前所未有的速度學習。 智慧型設備和物聯網:在智慧型
Thumbnail
你好,我是股市鴿~ Google與聯發科合作開發AI伺服器晶片 Google是全球最大的網路搜尋引擎,也是人工智慧(AI)的領導者之一。Google多項服務都與AI有關,例如語音助理、翻譯、地圖、雲端運算等。為了提升AI的運算效能和效率,Google自行開發了專用於深度學習的處理器晶片,稱為張量處理
Thumbnail
你好,我是股市鴿~ Google與聯發科合作開發AI伺服器晶片 Google是全球最大的網路搜尋引擎,也是人工智慧(AI)的領導者之一。Google多項服務都與AI有關,例如語音助理、翻譯、地圖、雲端運算等。為了提升AI的運算效能和效率,Google自行開發了專用於深度學習的處理器晶片,稱為張量處理
Thumbnail
AI技術的發展為人們的生產和生活帶來了巨大的變革,從智能家居、智能醫療、自動駕駛等,現在AI已經漸漸地出現在你的生活中,如果未來AI會更盛行的,我們可以從中找到甚麼投資機會 那以下就要稍微介紹一下AI,但因為菜鳥也是自己去爬文,去找資料,不是相關的專業人士,所以僅供參考就好了,那AI也有蠻多法規跟倫
Thumbnail
AI技術的發展為人們的生產和生活帶來了巨大的變革,從智能家居、智能醫療、自動駕駛等,現在AI已經漸漸地出現在你的生活中,如果未來AI會更盛行的,我們可以從中找到甚麼投資機會 那以下就要稍微介紹一下AI,但因為菜鳥也是自己去爬文,去找資料,不是相關的專業人士,所以僅供參考就好了,那AI也有蠻多法規跟倫
Thumbnail
AI PC 是將 AI 模型與傳統 PC 緊密結合的裝置,為本地 AI 運算能力,更能保護用戶的隱私和數據安全。 AI PC 具有 NPU、CPU 以及 GPU,並能夠具備高算力 AI 應用的需求,在 AI 運算性能、效率跟功耗方面,NPU 相較 CPU 與 GPU 具有大幅優勢。
Thumbnail
AI PC 是將 AI 模型與傳統 PC 緊密結合的裝置,為本地 AI 運算能力,更能保護用戶的隱私和數據安全。 AI PC 具有 NPU、CPU 以及 GPU,並能夠具備高算力 AI 應用的需求,在 AI 運算性能、效率跟功耗方面,NPU 相較 CPU 與 GPU 具有大幅優勢。
Thumbnail
GPU,既能支援大規模人工智慧計算,現在也能夠支援一些量子軟體,各家公司都在密切關注這個發展趨勢。 GPU已經改變了人工智慧的格局,現在也準備投身量子計算領域,儘管量子技術尚未成熟,但許多公司已經找到可以在與人工智慧相同的晶片上,運行複雜的量子演算法。近年來,由於GPU和其他先進晶片提供的計算
Thumbnail
GPU,既能支援大規模人工智慧計算,現在也能夠支援一些量子軟體,各家公司都在密切關注這個發展趨勢。 GPU已經改變了人工智慧的格局,現在也準備投身量子計算領域,儘管量子技術尚未成熟,但許多公司已經找到可以在與人工智慧相同的晶片上,運行複雜的量子演算法。近年來,由於GPU和其他先進晶片提供的計算
Thumbnail
DeepSeek 開發出透過知識蒸餾技術打造的小型高效語言模型,結合 NPU 技術,降低 AI 應用成本並提升普及性。此趨勢將促進 AI 手機及 PC 市場發展,使聯發科等晶片製造商及利基型記憶體市場受惠,並降低企業導入 AI 應用的門檻。
Thumbnail
DeepSeek 開發出透過知識蒸餾技術打造的小型高效語言模型,結合 NPU 技術,降低 AI 應用成本並提升普及性。此趨勢將促進 AI 手機及 PC 市場發展,使聯發科等晶片製造商及利基型記憶體市場受惠,並降低企業導入 AI 應用的門檻。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
未來的AI處理器發展趨勢將會持續專注於提升效能並降低能源消耗。 以下是一些可能的發展方向: 新一代NPU:例如,英特爾已經發表了新一代AI PC處理器Lunar Lake,該處理器的NPU算力是前一代的3倍多,且耗能較前一代低40%。 多模態生成式AI的興起:這種AI結合了文本、圖像、視頻等多
Thumbnail
未來的AI處理器發展趨勢將會持續專注於提升效能並降低能源消耗。 以下是一些可能的發展方向: 新一代NPU:例如,英特爾已經發表了新一代AI PC處理器Lunar Lake,該處理器的NPU算力是前一代的3倍多,且耗能較前一代低40%。 多模態生成式AI的興起:這種AI結合了文本、圖像、視頻等多
Thumbnail
你好,我是股市鴿~ 聯發科與Google合作開發AI伺服器晶片,展現AI實力 大家好,歡迎來到我的部落格。今天我想跟大家分享一個有關AI的熱門話題,那就是聯發科與Google的合作計畫。據媒體報導12,聯發科將協助Google打造最新的AI伺服器晶片,並將以台積電5奈米製程生產,力拚明年初量產。這意
Thumbnail
你好,我是股市鴿~ 聯發科與Google合作開發AI伺服器晶片,展現AI實力 大家好,歡迎來到我的部落格。今天我想跟大家分享一個有關AI的熱門話題,那就是聯發科與Google的合作計畫。據媒體報導12,聯發科將協助Google打造最新的AI伺服器晶片,並將以台積電5奈米製程生產,力拚明年初量產。這意
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News