結論直接看
隨需:換。效能提升有感但不多。
走SP:效能沒有瓶頸的情況下,繼續等。
在相同 1C/2T 配置與同套指令集下,m8i.large 憑藉更大的快取(回報 480 MB)與更快的 DDR5-7200 記憶體,帶來約 10~20% 的實際工作負載增益(編譯/編碼/渲染/棋引擎最明顯)。
Wei 啥的結論
隨需的價格為 m8i.large $0.10584/hr 及 m7i.large $0.1008/hr,這樣算下來大概 5% 的費用漲幅。但是卻能帶來 10%~20% 的性能提升。怎麼有種中華電信 300M 跟 500M 的感覺?
但如果你的 RI 跟 SP 合約還在走,在 Oregon 裡。
m7i.large 的一年預付 Compute Saving Plans 是 $605.49,可選擇會被鎖死在 Region 的 EC2 Instance Savings Plans,價格是一年全預付 $545.13。
m8i.large 的一年預付 Compute Saving Plans 是 $635.8,不能選擇 EC2 Instance Savings Plans。
這樣價差就出來了,同樣在單一 Region 跑固定 workload,m8i.large 成本比 m7i.large 至少高 11%+,因為 m8i 沒有 Instance SP 折扣可選。
所以代理商大鍋飯 SP,可以換。
如果是自己買 SP 的,效能沒有瓶頸的話繼續用吧?
起因
有鑒於上一篇 AWS m8i.large 與 m8i-flex.large 效能評測:持續高負載 vs. 性價比的選擇 說的 Credit 還沒燒完,這次就來燒 m7i 好了。
一樣用 phoronix-test-suite 來跑跑看,有興趣的可以去 Github 上看看。
測試的 Region 選在 Oregon。
OS 選擇 Amazon Linux 2023 AMI 2023.8.20250915.0 x86_64 HVM kernel-6.1。
EBS 選用普遍的 gp3 IOPS 3000,Throughput 125。
用 lscpu 來看 CPU 參數。
過程
安裝 phoronix-test-suite
# 需要 git 與 php-cli
sudo yum install -y php-cli php-xml git gcc unzip wget
# clone 最新版
git clone https://github.com/phoronix-test-suite/phoronix-test-suite.git
cd phoronix-test-suite
# 安裝
sudo ./install-sh
m7i 與 m8i 的差別
不同世代的 CPU。
m7i 的 Sapphire Rapids 是 Intel 的第四代 Xeon,Golden Cove,支援 DDR5-4800。
m8i 的 Granite Rapids 是 Intel 的第六代 Xeon,Redwood Cove,支援 DDR5-7200。
- m7i.large:Sapphire Rapids(Intel Xeon Platinum 8488C)
- m8i.large:Granite Rapids(Intel Xeon 6975P-C)
兩者都是 1 核 / 2 執行緒(同樣 SMT/HT 開啟)
兩者皆有:SSE4.2、AVX、AVX2、AVX-512(含 VNNI)、AVX-512CD、AMX_TILE、RDRAND、FSGSBASE
最重要的就是快取了,集合在 CPU 上更大的 LLC 快取能夠讓資料更快地來回運算。看看那個精美的消費級 AMD 9800 x3d。
- m7i.large:105 MB
- m8i.large:480 MB
記憶體部分就是不同的時脈差異。
- m7i.large:1×8 GB DDR5-4800
- m8i.large:1×8 GB DDR5-7200
有趣的是 m7i 在 ctx_clock 這項有小幅度勝出。但問題應該是在這項是 cycles,然後測的是 Content Switch,也就是那時候計算機組織唸的那些鬼。寄存啊切換啊什麼的。
看起來 m8i 的超大快取跟複雜的架構在這項是有點吃虧的,但影響並不大,實際在跑也有 AWS 宣稱的效能的八折。
跑分比較
EC2 m8i.large vs m7i.large
科學計算類
Rodinia LavaMD(秒,越低越好)
1340.62 vs 1418.23(m8i 快約 5.5%)
Rodinia CFD Solver(秒,越低越好)
95.42 vs 102.38(m8i 快約 6.8%)
NAMD ATPase / STMV(ns/day,越高越好)
ATPase:0.24267 vs 0.23382(m8i 快約 3.8%)
STMV:0.07108 vs 0.06755(m8i 快約 5.2%)
影音編碼類(FPS,越高越好)
Kvazaar (HEVC/H.265)
4K Slow:1.28 vs 1.10(m8i 快 16.4%)
4K Medium:1.31 vs 1.12(m8i 快 17.0%)
1080p Slow:7.15 vs 6.19(m8i 快 15.5%)
1080p Medium:7.34 vs 6.40(m8i 快 14.7%)
4K Very Fast:3.19 vs 2.75(m8i 快 16.0%)
4K Ultra Fast:5.33 vs 4.53(m8i 快 17.7%)
1080p Very Fast:15.03 vs 12.76(m8i 快 17.8%)
1080p Ultra Fast:24.92 vs 21.26(m8i 快 17.2%)
x264 / x265
x264 4K:4.20 vs 3.51(m8i 快 19.7%)
x264 1080p:19.01 vs 15.84(m8i 快 20.0%)
x265 4K:3.30 vs 2.87(m8i 快 15.0%)
x265 1080p:14.71 vs 12.68(m8i 快 16.0%)
壓縮與解壓縮(MIPS,越高越好)
7-Zip
壓縮:12244 vs 10588(m8i 快 15.6%)
解壓:7313 vs 6413(m8i 快 14.0%)
AI / 演算法類(Nodes/s,越高越好)
Stockfish 16.1:1,704,166 vs 1,545,789(m8i 快 10.2%)
asmFish:3,657,558 vs 3,005,961(m8i 快 21.7%)
編譯與建構(秒,越低越好)
GCC Compilation 13.2:4748.84 vs 5369.76(m8i 快 11.6%)
defconfig:661.38 vs 764.42(m8i 快 13.5%)
allmodconfig:9969.90 vs 11585.14(m8i 快 13.9%)
渲染(秒,越低越好)
POV-Ray 3.7:274.01 vs 305.72(m8i 快 10.4%)
Radiance
Serial:489.28 vs 537.70(m8i 快 9.0%)
SMP:426.84 vs 516.02(m8i 快 17.3%)
系統測試
ctx_clock(clocks,越低越好):194 vs 171(m7i 較佳,m8i 慢約 13.5%)
Sysbench CPU(events/s,越高越好):3532.75 vs 3321.30(m8i 快 6.4%)
結論
在相同 1C/2T 配置與同套指令集下,m8i.large 憑藉更大的快取(回報 480 MB)與更快的 DDR5-7200 記憶體,帶來約 10–20% 的實際工作負載增益(編譯/編碼/渲染/棋引擎最明顯)。