Amazon 參戰!Nova 2 模型全面解析

EgentHub 閱讀筆記-avatar-img
發佈於AI Agent 個房間
更新 發佈閱讀 9 分鐘

( 2025年12月4日更新 )上個月底,Open AIAnthropicGooglexAI 相繼推出了全新模型,想不到12月才剛開始,Amazon也參與了這場 AI模型的「華山論劍」。在年度盛會 AWS re:Invent 上,Amazon Web Services (AWS) 執行長 Matt Garman 發布了旗下 Nova 模型的全新升級,並且涵蓋了客製化模型、應用Agent等全面產品的組合擴張。

重點整理 Takeaway

  • 全新 Nova 2 模型家族: AWS 推出了四款各具特色的新模型,分別是 Nova 2 Lite、Pro、Sonic 及 Omni,在多項公開基準測試中皆有良好的表現,涵蓋從日常推理、複雜規劃、即時語音與多模態生成等全方位應用。
  • Nova Forge 服務: AWS 推出名為 Nova Forge 的服務,允許企業透過開放式訓練方法,融合自身專有數據,打造稱為Novellas的專屬 frontier AI 模型,並提供強化學習與 AI 安全工具組等強大功能。
  • Nova Act : AWS 發布了 Nova Act 服務,專門用於建構與管理能夠在網頁瀏覽器中執行任務的 AI Agent。
raw-image

Nova 2 模型家族各司其職

Nova 2 模型家族的設計理念是在速度、成本和智慧之間取得平衡,以滿足不同用戶在特定需求下的彈性選擇,分爲以下四款模型:

1. Nova 2 Lite:日常推理,快速、高性價比

Nova 2 Lite 被定位為一款快速且具成本效益的推理模型,專為處理日常工作負載而設,可以處理文字、圖像和影片輸入生成文字輸出

根據 AWS 公布的數據,其性能在 15 項基準測試中的 13 項與 Claude Haiku 4.5 持平或更優;在 17 項基準測試中的 11 項與 GPT-5 Mini 持平或更優;在 18 項基準測試中的 14 項與 Gemini Flash 2.5 持平或更優。

Nova 2 Lite可調整 思考程度 參數,分為三種等級,在智慧深度、速度與成本之間取得平衡;技術規格方面,它擁有 100 萬 token 的上下文視窗,並內建了網路資訊引用 (web grounding)程式碼直譯器工具,使其能夠存取最新資訊並執行程式碼,主要應用場景包括客戶服務聊天機器人、文件處理和業務流程自動化。

2. Nova 2 Pro:複雜推理任務,多模態輸入

Nova 2 Pro 是 Amazon 最智慧的推理模型,專為高度複雜的任務而生,能處理更廣泛的輸入類型,包括文字、圖像、影片和語音,以生成文字輸出。

根據 AWS 公布的數據,在性能上,Nova 2 Pro 在 16 項基準測試中的 10 項與 Claude Sonnet 4.5 持平或更優,並在 16 項中的 8 項與 GPT-5.1 持平或更優,展現了其在處理複雜指令、多文件分析及軟體工程任務上的強大實力。

Nova 2 Pro 同樣內建了網路資訊引用程式碼直譯器功能,此外,它可以透過知識蒸餾(knowledge distillation)的過程,將其強大的能力轉移到更小、更高效的子模型中,以應用於特定領域。主要應用場景涵蓋了代理式編碼 (agentic coding)、長遠規劃和複雜問題解決等。

延伸閱讀《一文看懂 多模態(Multimodal)》

3. Nova 2 Sonic:真人對話感,語音對語音

Nova 2 Sonic對話式 AI 領域實現了重大突破。它是一款語音對語音 (speech-to-speech) 模型,擁有 100 萬 token 的上下文視窗,目標是實現自然、即時的語音對話,本次更新引入了創新的多語言聲音 (polyglot voices) 功能,讓單一聲音即可在同一對話中流暢切換多種語言。

同步比較《Gemini Live : 即時互動模式》

技術優勢方面,它提供了文字與語音輸入無縫切換的跨模態互動 (crossmodal support),以及能同時處理多項請求的非同步工具呼叫 (asynchronous tool calling),讓 AI 可以在背景處理任務(如預訂航班)的同時,繼續與使用者自然對話。

4. Nova 2 Omni:業界首創,多模態生成

Nova 2 Omni 的推出堪稱業界首創,能單模型同時處理多模態輸入與輸出,不僅能處理文字、圖像、影片和語音輸入,更能同時生成文字和圖像

其處理能力強大,能夠一次性分析包含高達 750,000 字詞、數小時音訊、長影片和數百頁文件的龐大資料集,徹底消除了連接多個專用模型的成本與複雜性。雖然目前業界尚無直接可比的同類模型,但 Nova 2 Omni 在多模態推理的公開基準測試中,能生成與其他頂尖圖像生成模型品質相當的影像。

實際應用情境上,行銷團隊可以利用它分析所有格式的產品資料,並在單一流程中立即生成完整的行銷活動,包括標題、文案、社群貼文和視覺圖像。

raw-image

Nova Forge: 打造企業專屬Novellas

企業在將專有知識融入 AI 時,現行方式大多是透過Fine Tuning或RAG的方式微調模型,或是提供外部資料給模型調用,但Nova Forge 獨創了開放式訓練 (open training)方法,讓客戶能在模型訓練的前、中、後期檢查點,將自有數據與 AWS 的數據集混合,最終製作出出稱為Novellas的客製化 frontier 模型。

Nova Forge 還提供三大能力:自建強化學習的模擬訓練環境(gym)、利用大型模型產生的合成資料做模型蒸餾以縮小模型體積、以及負責資料安全的 AI 工具組。藉由這些功能,企業不只可以訓練自己的大型模型,也能打造更小、更快、成本更低但仍保持智慧水準的版本,完成的自家模型可直接部署在 Amazon Bedrock 上,享有企業級的安全、隱私與可擴展性。


Nova Act:實現高可靠度的 UI 自動化代理

Nova Act 是 AWS 推出的新型AI Agent服務,專門用來執行在瀏覽器中操作 UI的任務。它背後使用了客製化的 Nova 2 Lite 模型,並透過強化學習在大量模擬的網頁環境中訓練,使Agent能理解頁面結構、判斷行為步驟並可靠地完成操作。

這種以真實 UI 工作流為中心的訓練方式,使 Nova Act 在早期測試中就能達到約 90% 的穩定度,遠高於一般僅依賴推理的 LLM。它適合處理像更新後台資料、填寫表單、登入系統、跑 QA 測試等需要精準點擊、輸入與多步驟流程的任務,降低企業在大量重複性網頁操作上的人力負擔。


AWS 從通用模型邁向完整企業生態系

綜合來看,AWS 這次正式端出一套完整的企業級 AI 生態系:從基礎模型 Nova 2 系列、能打造專屬 Frontier 模型的 Nova Forge,到可直接執行網頁操作與任務代理的 Nova Act。這套組合等於替企業打通了一條「從模型能力 → 企業知識整合 → 實際工作流程自動化」的完整路徑,讓導入 AI 不再是分散式的拼裝,而是可被串成一個整合式、可擴展的系統,雖然實際的使用體驗與效能表現仍待時間驗證。但可以確定的是,AWS 在這波模型競賽中,已在 AI 基建與模型生態中占據了自己的一席之地。

在各模型推陳出新的迭代中,企業如何根據需求自由選擇模型顯得格外重要,這也正是 EgentHub 這類專業 AI Agent服務商的價值所在, EgentHub 作為AI 服務商,是台灣 AI 企業應用首選,擁有支援多模型、可靈活配置的企業級 AI Agent 管理平台,加上MCP串接功能,幫助企業在這場 AI 導入的競賽中,始終能運用最頂尖的技術,保持領先地位。


留言
avatar-img
EgentHub 閱讀筆記
27會員
96內容數
EgentHub是由智慧方案股份有限公司打造的企業級 AI Agent 平台,協助企業將知識、經驗與流程萃取並轉化爲AI SOP,打造AI Agents支援日常決策、執行與協作,已有百家企業採用,涵蓋製造、紡織、金屬加工、電子、石化等產業,每月釋放超過2,000 小時人力工時,提升營運效率與精準度。
EgentHub 閱讀筆記的其他內容
2025/11/25
近期的 AI 模型,除了追求原始智慧(IQ),也開始重視使用者體驗、情感智慧(EQ)與可靠性,xAI 推出的 Grok 4.1 在這個賽道也成為一個重要指標。Grok 4.1在正式發布前的盲測比較中,取得了高達 64.78% 的用戶偏好率,預示著 xAI 正朝向更人性化、更易用的目標邁進。
Thumbnail
2025/11/25
近期的 AI 模型,除了追求原始智慧(IQ),也開始重視使用者體驗、情感智慧(EQ)與可靠性,xAI 推出的 Grok 4.1 在這個賽道也成為一個重要指標。Grok 4.1在正式發布前的盲測比較中,取得了高達 64.78% 的用戶偏好率,預示著 xAI 正朝向更人性化、更易用的目標邁進。
Thumbnail
2025/11/25
Anthropic 也不忍了,在 2025 年 11 月 24 日再度投下震撼彈,正式發布其最新的旗艦 AI 模型:Claude Opus 4.5。這是 Anthropic 在短短兩個月內發布的第三個主要模型,官方直接宣稱其為coding最佳模型,為其卓越的專業能力設定了明確的基調。
Thumbnail
2025/11/25
Anthropic 也不忍了,在 2025 年 11 月 24 日再度投下震撼彈,正式發布其最新的旗艦 AI 模型:Claude Opus 4.5。這是 Anthropic 在短短兩個月內發布的第三個主要模型,官方直接宣稱其為coding最佳模型,為其卓越的專業能力設定了明確的基調。
Thumbnail
2025/11/18
(2025年11月20日更新)Gemini 3 Pro 正式上線!本文將整理 Google 本次的更新內容,聚焦 Gemini 3 Pro 及其推出的新功能,用最精簡、好理解的方式帶你快速掌握所有亮點。你不需要逐頁翻官方網站,就能一次了解 Gemini 3 的完整能力與最新功能。
Thumbnail
2025/11/18
(2025年11月20日更新)Gemini 3 Pro 正式上線!本文將整理 Google 本次的更新內容,聚焦 Gemini 3 Pro 及其推出的新功能,用最精簡、好理解的方式帶你快速掌握所有亮點。你不需要逐頁翻官方網站,就能一次了解 Gemini 3 的完整能力與最新功能。
Thumbnail
看更多
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
亞馬遜的 AI 機器人艦隊 已部署超過 100 萬台,公開宣稱目標是「消除每一個單調工作」。 重點衝擊數字: 到 2027 年,可能減少約 16 萬 美國職缺需求。新型機器人如 Blue Jay 已能處理 75% 的商品揀選,將物流效率提升到極致。人類的價值,正在從體力勞動轉向複雜推理與創新。
Thumbnail
亞馬遜的 AI 機器人艦隊 已部署超過 100 萬台,公開宣稱目標是「消除每一個單調工作」。 重點衝擊數字: 到 2027 年,可能減少約 16 萬 美國職缺需求。新型機器人如 Blue Jay 已能處理 75% 的商品揀選,將物流效率提升到極致。人類的價值,正在從體力勞動轉向複雜推理與創新。
Thumbnail
電商與雲服務科技巨頭亞馬遜 AMZN,於上個月底正式發布了今年 2025 第三季的財報,交出了一份漂亮的成績單。飽受外界質疑是否有跟上 AI 大爆發需求的 AWS 服務,終於開始明確加速成長,這也讓亞馬遜本季財報發布後,股價就出現非常正向的回饋。究竟,亞馬遜的雲服務現在真的追上 AI 浪潮了嗎?
Thumbnail
電商與雲服務科技巨頭亞馬遜 AMZN,於上個月底正式發布了今年 2025 第三季的財報,交出了一份漂亮的成績單。飽受外界質疑是否有跟上 AI 大爆發需求的 AWS 服務,終於開始明確加速成長,這也讓亞馬遜本季財報發布後,股價就出現非常正向的回饋。究竟,亞馬遜的雲服務現在真的追上 AI 浪潮了嗎?
Thumbnail
[裁員潮] 微軟2025年裁員逾1.5萬人,AI效率成背後推手 [編程焦慮] 程式設計師轉型,專注創造性與運算思維 [道德挑戰] Crunchyroll因AI字幕錯誤引發用戶不滿 [隱私爭議] 紐約時報與OpenAI訴訟揭示AI數據風險 [教育變革] 美國大學重塑課程,強調AI素養與批判思維
Thumbnail
[裁員潮] 微軟2025年裁員逾1.5萬人,AI效率成背後推手 [編程焦慮] 程式設計師轉型,專注創造性與運算思維 [道德挑戰] Crunchyroll因AI字幕錯誤引發用戶不滿 [隱私爭議] 紐約時報與OpenAI訴訟揭示AI數據風險 [教育變革] 美國大學重塑課程,強調AI素養與批判思維
Thumbnail
在今年以來,電商與雲服務巨頭 Amazon 亞馬遜的股價表現相當不顯眼 – 無論是川普的關稅壓力,又或者是 AI場域的競爭,都讓亞馬遜的營運面臨著很高的不確定性。在 Andy Jassy 帶領著亞馬遜走出 2022 的谷底之後,亞馬遜究竟又遇到了什麼挑戰,以及該如何面對?在今年的第一季,亞馬遜再次交
Thumbnail
在今年以來,電商與雲服務巨頭 Amazon 亞馬遜的股價表現相當不顯眼 – 無論是川普的關稅壓力,又或者是 AI場域的競爭,都讓亞馬遜的營運面臨著很高的不確定性。在 Andy Jassy 帶領著亞馬遜走出 2022 的谷底之後,亞馬遜究竟又遇到了什麼挑戰,以及該如何面對?在今年的第一季,亞馬遜再次交
Thumbnail
當企業的系統看起來像在回覆,其實背後是 Amazon Bedrock 串接 AI 模型幫你回答。這是一種「租智慧」的方式,讓問題進得來,答案出得去,企業不用自己訓練模型,只要選對工具,就能快速整合 AI 到應用裡。
Thumbnail
當企業的系統看起來像在回覆,其實背後是 Amazon Bedrock 串接 AI 模型幫你回答。這是一種「租智慧」的方式,讓問題進得來,答案出得去,企業不用自己訓練模型,只要選對工具,就能快速整合 AI 到應用裡。
Thumbnail
Amazon 亞馬遜(AMZN)2024Q4營收突破1,878億美元,但股價為何下跌4%?本文分析亞馬遜在AI領域的投資計劃,以及AWS、廣告業務的成長。
Thumbnail
Amazon 亞馬遜(AMZN)2024Q4營收突破1,878億美元,但股價為何下跌4%?本文分析亞馬遜在AI領域的投資計劃,以及AWS、廣告業務的成長。
Thumbnail
Amazon的AWS和微軟Azure都在成長,而且Azure增速還比較快。為什麼Q3財報一出反而亞馬遜漲微軟跌?
Thumbnail
Amazon的AWS和微軟Azure都在成長,而且Azure增速還比較快。為什麼Q3財報一出反而亞馬遜漲微軟跌?
Thumbnail
亞馬遜推出了一個新工具,利用人工智慧快速回應顧客對特定產品的查詢,這一新功能集中在提供簡潔而有創意的回答上,與OpenAI的ChatGPT不同,它並不旨在進行延伸的對話,但擅長對用戶的提示提供簡明而有創意的例子。
Thumbnail
亞馬遜推出了一個新工具,利用人工智慧快速回應顧客對特定產品的查詢,這一新功能集中在提供簡潔而有創意的回答上,與OpenAI的ChatGPT不同,它並不旨在進行延伸的對話,但擅長對用戶的提示提供簡明而有創意的例子。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News