【評測】Mac Studio 2025 M3 Ultra 版本 實測本地 LLM 大型語言模型 + AI 繪圖效能
Apple 剛剛推出最新 Mac Studio 2025 版本,用上 M4 Max 處理器以及最新發表的 M3 Ultra 處理器。今次 Mac Studio 沿用上代的機殼以及散熱系統,並將硬件升級。除了 M4 Max, M3 Ultra 處理器本身增多了 CPU、GPU 的核心數量之外,其實 Apple 將可搭載的統一記憶體 RAM 容量加大到最多 512GB、記憶體頻寬升到 819GB/s,而且將最多可配置 SSD 儲存空間加大到 16TB。連接方面,M4 Max 版用上 4 個 Thunderbolt 5 插口、M3 Ultra 版搭載 6 個 Thunderbolt 5 插口。
相關評測影片:
Mac Studio 除了適合有錢買快電腦的進階用家之外,其實真正面向的消費者是需要大量記憶體去處理複雜架構的影片、3D 模型等影像製作範疇,而現在 AI 盛行,這類工作站級電腦更適用於在本地運行 AI 大模型,我們就嘗試運行 70b 大模型都迎刃有餘,Mac Studio 的統一記憶體特性,更讓 AI 應用能盡情發揮速度。
對於進階用家來說,M4 Max 型號會是非常不錯的選擇,基本款配備 14 核心 CPU、32 核心 GPU、16 核心神經網絡引擎以及 36GB 統一記憶體;而面向專業人士的 M3 Ultra 基本款則擁有 28 核心 CPU、60 核心 GPU、32 核心神經網絡引擎以及 96GB 統一記憶體。
對於好多個人影片工作室而言,選擇基本款的 M3 Ultra,亦足以應付一般影音剪輯、廣告設計及 3D 渲染等需求,比起 MacBook Pro 擁有非常顯著優勢的散熱能力。
相關文章:
M3 Ultra 和 M4 Max 跑分結果出爐 兩者 CPU 效能分別不大
機身外觀與介面:維持方正設計 + Thunderbolt 5 升級
Mac Studio 2025 與前一代大致相同,維持小巧方正的外型,機身頂部鋁製外殼手感扎實,底部與背面仍有大面積散熱孔。機面提供 2 個 USB-C 或 Thunderbolt 5 連接埠(視你選擇的晶片型號而定),以及一個 SDXC 讀卡機。機背則設有:
4 個 Thunderbolt 5 連接埠
2 個 USB-A
1 個 HDMI
1 個 10Gb Ethernet
1 個 3.5mm 耳筒插孔
Thunderbolt 5 是今次更新主要特點之一,可支援理論上最高 120Gb/s 傳輸速度,方便外接高速硬碟陣列或 8K 以上高解析度顯示器。同時也支援多台顯示器並行輸出,M3 Ultra 配置下最多可驅動 8 部 6K 熒幕,對於專業級工作者或工作室來說,應付龐大的螢幕需求更加游刃有餘。
【評測】Mac Studio 2025 M3 Ultra 版本 實測本地 LLM 大型語言模型 + AI 繪圖效能
【評測】Mac Studio 2025 M3 Ultra 版本 實測本地 LLM 大型語言模型 + AI 繪圖效能
相關文章:
M3 Ultra 和 M4 Max 跑分結果出爐 兩者 CPU 效能分別不大
專業應用實測 AI 模型推理
M3 Ultra 内建 32 核心神經網絡引擎,搭配 256GB 統一記憶體,能在本機進行部分中大型 AI 模型推理。如執行 Stable Diffusion 生成影像、運行 AI 大模型,甚至用 Whisper 將聲音檔案轉換成文字,都可大大加速。
實試 1:本地運行 DeepSeek-R1 70b 人工智能引擎
今次我們就安裝了 DeepSeek-R1 70b 模型進行推理測試,包括進行推理運算、文章寫作等運用較多資源的任務。結果對比起上代 M2 Max 型號,有非常顯著的效能增長。
誠實者與騙子邏輯題
測試首先要求 DeepSeek R1 70B Q4 在兩部電腦上同時解答一題複雜邏輯推理題(需包含推理步驟,並限制在 2800-3000 字)。結果顯示:
- M2 Max 完成整個生成約需 7 分 24 秒,初次輸出耗時 0.65 秒,Token 生成速度為 6.41 token/s,總共生成 2819 個 Token。
- M3 Ultra 僅需 3 分 59 秒即可完成,初次輸出耗時 1.53 秒,Token 生成速度為 11.62 token/s,總共生成 2752 個 Token。
綜合而論,M3 Ultra 完成總時間比 M2 Max 快近一倍,Token 生成速度亦較前代高出約 1.8 倍。
關於誠實者與騙子邏輯題:
在一個村莊裡,所有居民要麼只說真話(誠實者),要麼只說謊話(騙子)。一天,你遇到三個人——A、B 和 C。他們分別說了以下的話: A 說:「B 是誠實者。」 B 說:「C 是騙子。」 C 說:「A 是騙子。」 已知至少有一人是誠實者,請判斷誰是誠實者,誰是騙子。
三神問題
接著以著名邏輯難題「三神問題」作為測試,依然要求模型提供推理過程,字數限制相同。結果如下:
- M2 Max:完成耗時 12 分 14 秒,初次輸出 3.10 秒,Token 生成速度 6.32 token/s,最終生成 4604 個 Token。
- M3 Ultra:完成耗時 6 分 48 秒,初次輸出 1.30 秒,Token 生成速度 11.33 token/s,最終生成 4592 個 Token。
M3 Ultra 的整體效能依然快上一代約一倍,而且未出現明顯的降頻現象。測試期間,兩部電腦的 GPU 利用率均到達 100%,但 CPU 部分尚有餘裕;其中,M3 Ultra 的 E-CPU 利用率通常維持在 50% 以下,顯示 Mac Studio 本身在電源及散熱方面仍有充分空間。此外,將 M3 Ultra 的上下文長度(context length)限制提高至 130,000 亦可穩定運作,最終花費約 4 分 47 秒完成,Token 生成速度與預設 4096 context length 基本相當,可見 256GB 統一記憶體 的優勢非常明顯。
關於三神問題:
- [支持最多的] 慕尼黑狂欢派对大批“兔女郎”上阵(图)
- [反對最多的] 十三届华表奖优秀故事片提名:超强台风
對本文中的事件或人物打分: | |
當前平均分:-0.39 (18次打分) | |
|
|
對本篇資訊內容的質量打分: | |
當前平均分:0 (15次打分) | |
|
- [感動最多的] 台湾18岁少女 32E胸围火速蹿红(组图)
- [路過最多的] 無綫《西遊記》網民唔like 揚言罷睇
- [高興最多的] 台湾18岁少女 32E胸围火速蹿红(组图)
- [難過最多的] 十三届华表奖优秀故事片提名:超强台风
- [搞笑最多的] 刘嘉玲恶斗张曼玉显疲惫 素颜现身太阳镜遮
- [憤怒最多的] 慕尼黑狂欢派对大批“兔女郎”上阵(图)
- [無聊最多的] 元朗7.21事件八個月晚上有人堵路 警方放催
- [同情最多的] 比利时男子持AK步枪扫射人群致5死123伤