AWS 上線 DeepSeek-R1 系列模型:企業生成式 AI 的新突破

更新於 發佈於 閱讀時間約 5 分鐘
AWS & DeepSeek

AWS & DeepSeek

近期,AWS 正式在 Amazon Bedrock Marketplace 與 Amazon SageMaker JumpStart 平台推出全新的 DeepSeek-R1 系列模型,為企業在生成式 AI 部署上帶來了更高的效能與成本優化方案。

企業級 AI 部署的新見解

在最近的 AWS re:Invent 大會上,Amazon 執行長 Andy Jassy 分享了亞馬遜內部應用近千項生成式 AI 解決方案的寶貴經驗。他強調,隨著生成式 AI 應用規模不斷擴大,三大關鍵因素必不可少:

  • 運算成本:隨著規模擴展,追求高性價比的運算資源變得尤為重要。
  • 技術難度:打造一個優質的生成式 AI 應用需要克服重重技術挑戰。
  • 模型多樣性:不同業務需求下,靈活選擇適合的模型至關重要,沒有一款單一模型能適應所有場景。

這些觀察不僅指引了 AWS 的產品策略,也為新模型的上線奠定了堅實基礎。

DeepSeek:中國 AI 初創的新力量

來自中國的 AI 初創公司 DeepSeek,自 2024 年底推出 DeepSeek-V3 以來,一直持續創新。2025 年初,DeepSeek 接連發布了 DeepSeek-R1 系列,包括擁有 6710 億參數的 DeepSeek-R1-Zero 以及多種規模的 DeepSeek-R1-Distill 模型。這些模型不僅在推理表現上突出,據悉在成本上也比市面上同類產品低 90-95%,為企業用戶提供了更具吸引力的選擇。

多重部署方案 靈活應對各類需求

AWS 為使用者提供了多種部署 DeepSeek-R1 模型的方式,滿足不同應用場景的需求:

  • Amazon Bedrock Marketplace
    使用者可透過統一的模型目錄輕鬆訂閱並部署 DeepSeek-R1 模型。平台支持自定義端點、配置安全設置及高級網路選項,同時內建 Guardrails 功能,可過濾不當輸入和輸出,確保應用安全穩定。
  • Amazon SageMaker JumpStart
    對於追求快速上手及高度自定義的企業,用戶可以通過 SageMaker Studio 或 API 方式迅速部署 DeepSeek-R1 模型。平台還結合了各種監控、調試工具,便於在生產環境中持續優化模型表現。
  • Amazon Bedrock Custom Model Import
    此方案允許企業上傳自定義的 DeepSeek-R1-Distill 模型,免除繁瑣的基礎架構管理,並享有 AWS 提供的企業級安全與彈性擴展能力。
  • AWS Trainium 與 Inferentia 加持的 Amazon EC2 部署
    對於追求極致性價比的應用場景,企業可以在搭載 AWS Trainium 或 Inferentia 處理器的 EC2 實例上運行 DeepSeek-R1-Distill 模型,透過專用深度學習 AMI 快速啟動大規模運算任務。

強化安全,驅動創新未來

無論是選用 Bedrock 或 SageMaker 平台,AWS 都將安全性與數據隱私作為首要考量。透過虛擬私有雲(VPC)配置和先進的 Guardrails 功能,用戶能夠在確保數據不外泄的前提下,安心進行生成式 AI 的實驗與部署。

結語

隨著 DeepSeek-R1 系列模型正式上線,AWS 為企業帶來了從模型選擇、部署到安全管理的一站式解決方案。這不僅降低了企業創新 AI 應用的門檻,更為業界未來的生成式 AI 應用提供了充足的技術支撐。企業用戶如今可以在美國東部與西部等主要區域,通過 AWS 平台探索這一全新技術,從而在數位轉型的浪潮中搶得先機。

資料來源: https://aws.amazon.com/tw/blogs/aws/deepseek-r1-models-now-available-on-aws/


🔥你還在等什麼? 立即追蹤我們🔥



🔗 立即量身打造最省錢的雲端解決方案!

Elite Cloud | 你最智慧、最靈活的雲端夥伴

留言
avatar-img
留言分享你的想法!
avatar-img
Elite Cloud 勤英科技的沙龍
0會員
10內容數
Elite Cloud | 雲端成本優化,提供企業級雲端解決方案 勤英科技為全球領先的雲端代理商,專注 AWS、GCP、阿里雲、騰訊雲、Azure 等雲端費用管理,提供 24/7 的技術支援,透過透明帳單管理,幫助企業降低支出、提升效能,確保雲端資源最佳化,加速業務成長。
2025/04/22
還在苦惱 S3 架的網站打開超慢?本篇教你如何用 AWS CloudFront 加速靜態網站,打造超快 CDN 架構,速度提升、安全加倍!
Thumbnail
2025/04/22
還在苦惱 S3 架的網站打開超慢?本篇教你如何用 AWS CloudFront 加速靜態網站,打造超快 CDN 架構,速度提升、安全加倍!
Thumbnail
2025/03/17
快速搜尋 GCP費用優化策略!本文解析主要計費模式與常見支出源,並提供实用管理工具和優化策略,助您降低雲端成本。
Thumbnail
2025/03/17
快速搜尋 GCP費用優化策略!本文解析主要計費模式與常見支出源,並提供实用管理工具和優化策略,助您降低雲端成本。
Thumbnail
2025/03/17
AWS 計費架構複雜,企業該如何降低雲端支出?本篇將解析 AWS 費用結構、提供 3 大優化策略,並介紹 Elite Cloud 的費用試算與多雲整合服務,幫助企業最大化成本效益!
Thumbnail
2025/03/17
AWS 計費架構複雜,企業該如何降低雲端支出?本篇將解析 AWS 費用結構、提供 3 大優化策略,並介紹 Elite Cloud 的費用試算與多雲整合服務,幫助企業最大化成本效益!
Thumbnail
看更多
你可能也想看
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型,並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing,現
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型,並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing,現
Thumbnail
今天來和你分享這本我剛讀完的「AI 世界的底層邏輯與生存法則」。當大家一股腦地想投入AI的領域當中時,這本書的作者程世嘉帶著我們用更高的視角和思維來思考,在AI時代下最重要的底層思考邏輯,找出那些最有價值的核心觀念,幫助我們在這個快速變化的世界當中站穩腳步,釐清未來的方向。
Thumbnail
今天來和你分享這本我剛讀完的「AI 世界的底層邏輯與生存法則」。當大家一股腦地想投入AI的領域當中時,這本書的作者程世嘉帶著我們用更高的視角和思維來思考,在AI時代下最重要的底層思考邏輯,找出那些最有價值的核心觀念,幫助我們在這個快速變化的世界當中站穩腳步,釐清未來的方向。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
  這回來介紹 AWS 在目前生成式 AI 各種群魔亂舞下推出的 Bedrock 服務,其官網說明可以快速且傻瓜式的部屬生成式 AI 到你的應用上,看看是不是如其所述的功能強大。
Thumbnail
  這回來介紹 AWS 在目前生成式 AI 各種群魔亂舞下推出的 Bedrock 服務,其官網說明可以快速且傻瓜式的部屬生成式 AI 到你的應用上,看看是不是如其所述的功能強大。
Thumbnail
本篇使用 AWS Lambda 結合 Amazon Bedrock 和 Claude 3 來分析儲存在 Amazon S3 中的圖像的示範
Thumbnail
本篇使用 AWS Lambda 結合 Amazon Bedrock 和 Claude 3 來分析儲存在 Amazon S3 中的圖像的示範
Thumbnail
實踐AWS中使用Lambda來負責登入簽核及與OpenAI API溝通,並利用S3容器託管一個靜態網頁做為前端
Thumbnail
實踐AWS中使用Lambda來負責登入簽核及與OpenAI API溝通,並利用S3容器託管一個靜態網頁做為前端
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News