AWS m8i.large vs m7i.large 效能評測與成本分析:升級策略建議

更新 發佈閱讀 9 分鐘

結論直接看

隨需:換。效能提升有感但不多。
走SP:效能沒有瓶頸的情況下,繼續等。

在相同 1C/2T 配置與同套指令集下,m8i.large 憑藉更大的快取(回報 480 MB)與更快的 DDR5-7200 記憶體,帶來約 10~20% 的實際工作負載增益(編譯/編碼/渲染/棋引擎最明顯)。

Wei 啥的結論

隨需的價格為 m8i.large $0.10584/hr 及 m7i.large $0.1008/hr,這樣算下來大概 5% 的費用漲幅。但是卻能帶來 10%~20% 的性能提升。怎麼有種中華電信 300M 跟 500M 的感覺?

但如果你的 RI 跟 SP 合約還在走,在 Oregon 裡。

m7i.large 的一年預付 Compute Saving Plans 是 $605.49,可選擇會被鎖死在 Region 的 EC2 Instance Savings Plans,價格是一年全預付 $545.13。

m8i.large 的一年預付 Compute Saving Plans 是 $635.8,不能選擇 EC2 Instance Savings Plans

這樣價差就出來了,同樣在單一 Region 跑固定 workload,m8i.large 成本比 m7i.large 至少高 11%+,因為 m8i 沒有 Instance SP 折扣可選。

所以代理商大鍋飯 SP可以換
如果是自己買 SP 的效能沒有瓶頸的話繼續用吧?

起因

有鑒於上一篇 AWS m8i.large 與 m8i-flex.large 效能評測:持續高負載 vs. 性價比的選擇 說的 Credit 還沒燒完,這次就來燒 m7i 好了。

一樣用 phoronix-test-suite 來跑跑看,有興趣的可以去 Github 上看看。

測試的 Region 選在 Oregon。
OS 選擇 Amazon Linux 2023 AMI 2023.8.20250915.0 x86_64 HVM kernel-6.1。
EBS 選用普遍的 gp3 IOPS 3000,Throughput 125。
用 lscpu 來看 CPU 參數。

過程

安裝 phoronix-test-suite

# 需要 git 與 php-cli
sudo yum install -y php-cli php-xml git gcc unzip wget

# clone 最新版
git clone https://github.com/phoronix-test-suite/phoronix-test-suite.git
cd phoronix-test-suite

# 安裝
sudo ./install-sh

m7i 與 m8i 的差別

不同世代的 CPU。
m7i 的 Sapphire Rapids 是 Intel 的第四代 Xeon,Golden Cove,支援 DDR5-4800。
m8i 的 Granite Rapids 是 Intel 的第六代 Xeon,Redwood Cove,支援 DDR5-7200。

    • m7i.large:Sapphire Rapids(Intel Xeon Platinum 8488C)
    • m8i.large:Granite Rapids(Intel Xeon 6975P-C)

兩者都是 1 核 / 2 執行緒(同樣 SMT/HT 開啟)
兩者皆有:SSE4.2、AVX、AVX2、AVX-512(含 VNNI)、AVX-512CD、AMX_TILE、RDRAND、FSGSBASE

最重要的就是快取了,集合在 CPU 上更大的 LLC 快取能夠讓資料更快地來回運算。看看那個精美的消費級 AMD 9800 x3d。

    • m7i.large105 MB
    • m8i.large480 MB

記憶體部分就是不同的時脈差異。

    • m7i.large:1×8 GB DDR5-4800
    • m8i.large:1×8 GB DDR5-7200

有趣的是 m7i 在 ctx_clock 這項有小幅度勝出。但問題應該是在這項是 cycles,然後測的是 Content Switch,也就是那時候計算機組織唸的那些鬼。寄存啊切換啊什麼的。

看起來 m8i 的超大快取跟複雜的架構在這項是有點吃虧的,但影響並不大,實際在跑也有 AWS 宣稱的效能的八折

跑分比較

EC2 m8i.large vs m7i.large

科學計算類

Rodinia LavaMD(秒,越低越好)
1340.62 vs 1418.23(m8i 快約 5.5%)

Rodinia CFD Solver(秒,越低越好)
95.42 vs 102.38(m8i 快約 6.8%)

NAMD ATPase / STMV(ns/day,越高越好)
ATPase:0.24267 vs 0.23382(m8i 快約 3.8%)
STMV:0.07108 vs 0.06755(m8i 快約 5.2%)


影音編碼類(FPS,越高越好)

Kvazaar (HEVC/H.265)
4K Slow:1.28 vs 1.10(m8i 快 16.4%)
4K Medium:1.31 vs 1.12(m8i 快 17.0%)
1080p Slow:7.15 vs 6.19(m8i 快 15.5%)
1080p Medium:7.34 vs 6.40(m8i 快 14.7%)
4K Very Fast:3.19 vs 2.75(m8i 快 16.0%)
4K Ultra Fast:5.33 vs 4.53(m8i 快 17.7%)
1080p Very Fast:15.03 vs 12.76(m8i 快 17.8%)
1080p Ultra Fast:24.92 vs 21.26(m8i 快 17.2%)

x264 / x265
x264 4K:4.20 vs 3.51(m8i 快 19.7%)
x264 1080p:19.01 vs 15.84(m8i 快 20.0%)
x265 4K:3.30 vs 2.87(m8i 快 15.0%)
x265 1080p:14.71 vs 12.68(m8i 快 16.0%)

壓縮與解壓縮(MIPS,越高越好)

7-Zip
壓縮:12244 vs 10588(m8i 快 15.6%)
解壓:7313 vs 6413(m8i 快 14.0%)

AI / 演算法類(Nodes/s,越高越好)


Stockfish 16.1:1,704,166 vs 1,545,789(m8i 快 10.2%)
asmFish:3,657,558 vs 3,005,961(m8i 快 21.7%)

編譯與建構(秒,越低越好)

GCC Compilation 13.2:4748.84 vs 5369.76(m8i 快 11.6%)
defconfig:661.38 vs 764.42(m8i 快 13.5%)
allmodconfig:9969.90 vs 11585.14(m8i 快 13.9%)

渲染(秒,越低越好)

POV-Ray 3.7:274.01 vs 305.72(m8i 快 10.4%)

Radiance
Serial:489.28 vs 537.70(m8i 快 9.0%)
SMP:426.84 vs 516.02(m8i 快 17.3%)

系統測試

ctx_clock(clocks,越低越好):194 vs 171(m7i 較佳,m8i 慢約 13.5%)
Sysbench CPU(events/s,越高越好):3532.75 vs 3321.30(m8i 快 6.4%)

結論

在相同 1C/2T 配置與同套指令集下,m8i.large 憑藉更大的快取(回報 480 MB)與更快的 DDR5-7200 記憶體,帶來約 10–20% 的實際工作負載增益(編譯/編碼/渲染/棋引擎最明顯)。


留言
avatar-img
留言分享你的想法!
avatar-img
Wei 的工程師聊什麼
3會員
9內容數
2025/09/28
本文針對 AWS m8i.large 和 m8i-flex.large 執行詳細效能評測,比較兩者在科學計算、影音編碼、編譯渲染等多方面的表現。結論顯示,m8i 在需要持續高效能的多執行緒任務上表現更佳,而 m8i-flex 則適合一般及間歇性工作負載,並提供更好的性價比。
Thumbnail
2025/09/28
本文針對 AWS m8i.large 和 m8i-flex.large 執行詳細效能評測,比較兩者在科學計算、影音編碼、編譯渲染等多方面的表現。結論顯示,m8i 在需要持續高效能的多執行緒任務上表現更佳,而 m8i-flex 則適合一般及間歇性工作負載,並提供更好的性價比。
Thumbnail
2025/09/20
這篇文章介紹一個自動音檔轉錄工具,利用FFmpeg處理音檔,並結合OpenAI的Whisper API進行轉錄,有效提升轉錄速度和穩定性。此工具具備檔案大小與時長控制、靜音對齊切割、輕量化轉檔及多工併發等功能,大幅優化轉錄流程。
2025/09/20
這篇文章介紹一個自動音檔轉錄工具,利用FFmpeg處理音檔,並結合OpenAI的Whisper API進行轉錄,有效提升轉錄速度和穩定性。此工具具備檔案大小與時長控制、靜音對齊切割、輕量化轉檔及多工併發等功能,大幅優化轉錄流程。
2025/09/18
本文探討AWS東京區域(ap-northeast-1)的Availability Zone apne1-az3即將於2025年2月28日終止服務的事件。文章分析事件背景、影響範圍以及可能原因,並參考相關文件與討論,提供完整的事件脈絡與技術說明。
2025/09/18
本文探討AWS東京區域(ap-northeast-1)的Availability Zone apne1-az3即將於2025年2月28日終止服務的事件。文章分析事件背景、影響範圍以及可能原因,並參考相關文件與討論,提供完整的事件脈絡與技術說明。
看更多
你可能也想看
Thumbnail
疫情世代後,企業在思考的已經不是要不要上雲,而是哪些服務或內容可以上雲,透過混合雲的形式,搭配公司的策略達到靈活且彈性的最佳效益。 而既然要能達到最佳效益,選擇適合公司環境的雲端環境,對於現代企業來說非常重要,這篇文章將與大家分享AWS、GCP、Azure三大公有雲的特點與優勢。
Thumbnail
疫情世代後,企業在思考的已經不是要不要上雲,而是哪些服務或內容可以上雲,透過混合雲的形式,搭配公司的策略達到靈活且彈性的最佳效益。 而既然要能達到最佳效益,選擇適合公司環境的雲端環境,對於現代企業來說非常重要,這篇文章將與大家分享AWS、GCP、Azure三大公有雲的特點與優勢。
Thumbnail
在網路速度有限的情況下,依序記錄不斷產生的資訊,能統計使用者在頁面上操作了哪些功能。
Thumbnail
在網路速度有限的情況下,依序記錄不斷產生的資訊,能統計使用者在頁面上操作了哪些功能。
Thumbnail
本篇使用 AWS Lambda 結合 Amazon Bedrock 和 Claude 3 來分析儲存在 Amazon S3 中的圖像的示範
Thumbnail
本篇使用 AWS Lambda 結合 Amazon Bedrock 和 Claude 3 來分析儲存在 Amazon S3 中的圖像的示範
Thumbnail
實驗目的:Lambda@Edge (L@E) 讓 CLoudFront (CF) 回源時,自動選擇較近的 S3 region 回源
Thumbnail
實驗目的:Lambda@Edge (L@E) 讓 CLoudFront (CF) 回源時,自動選擇較近的 S3 region 回源
Thumbnail
內容十分精實,一百多頁很薄的一本書,但含了很多有用的資訊,就算不是開發微服務,書中的內容也可以用在很多雲端服務的開發與維運上。中文版唯一可惜的地方,翻譯非常不通順,很多不像中文的句子,會看到好幾個「與」連在一起用,標點符號的用法也有點怪,閱讀的痛苦指數有點高...
Thumbnail
內容十分精實,一百多頁很薄的一本書,但含了很多有用的資訊,就算不是開發微服務,書中的內容也可以用在很多雲端服務的開發與維運上。中文版唯一可惜的地方,翻譯非常不通順,很多不像中文的句子,會看到好幾個「與」連在一起用,標點符號的用法也有點怪,閱讀的痛苦指數有點高...
Thumbnail
客戶提出以下需求: 當用戶在日本,會導到離用戶最近的CloudFront節點(亞洲),當CF要回原站時,需要導到新加坡的S3 當用戶為美國,會導到離用戶最近的CloudFront節點(美國東岸),當CF要回原站時,需要導到美國的S3
Thumbnail
客戶提出以下需求: 當用戶在日本,會導到離用戶最近的CloudFront節點(亞洲),當CF要回原站時,需要導到新加坡的S3 當用戶為美國,會導到離用戶最近的CloudFront節點(美國東岸),當CF要回原站時,需要導到美國的S3
Thumbnail
AWS CloudFront + S3 遇到 CORS 解決方式
Thumbnail
AWS CloudFront + S3 遇到 CORS 解決方式
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News