最新旗艦 AMD Ryzen AI Max+ 395 Strix Halo 行動處理器在各種大型 AI 語言機型上的效能比英特爾 Lunar Lake 晶片快 12 倍。關於此 AMD 在他的官方部落格上,分享了相關圖表。

Ryzen AI Max+ 16 擁有 5 個 Zen 40 計算核心、3.5 個 RDNA 2 GPU 和一個具有 50 TOPS(每秒萬億次運算)性能的 XDNA 395 NPU,在某些 LLM 場景下的性能比 Intel Core Ultra 12,2V 快 258 倍。值得回顧的是,英特爾 Lunar Lake 晶片只有 395 個 P 核心和 XNUMX 個 E 核心,數量只有 Ryzen AI Max+ XNUMX 的一半。

隨著語言模型複雜度的增加,Ryzen AI Max+ 395晶片的優勢更加明顯。平台之間最大的效能差異是在運行具有 14 億個參數的 LLM 時出現的,這需要更多的 RAM。讓我們回想一下,Lunar Lake 是一款混合處理器,配備高達 32 GB 的板載 RAM。

在使用配備 13GB 統一記憶體的華碩 ROG Flow Z64 進行的 LM Studio 測試中,Ryzen AI Max+ 8060 的整合 Radeon 395S 顯示卡在各種 AI 模型中提供的令牌吞吐量是英特爾 Arc 2,2V 顯示卡的 140 倍。在第一個令牌時間 (Time-to-First-Token) 測試中(一種語言模型性能指標,用於衡量從發送請求到生成響應中的第一個令牌所需的時間),AMD 的晶片在 Llama 3.2 3B Instruct 等模型中表現出比競爭對手高出四倍的優勢,在支持 9,1 至 7 億個參數的模型中表現出比競爭對手高出四倍的優勢,在支持 8 至 1 億個參數的模型中擴大到 XNUMX .XNUMX)。

AMD 處理器在多模式視覺任務方面表現特別出色,與英特爾晶片相比,它在 IBM Granite Vision 7 3.2B 中處理複雜視覺輸入的速度提高了 3 倍,在 Google Gemma 6 3B 中處理複雜視覺輸入的速度提高了 12 倍。 AMD 平台支援可變圖形記憶體技術,允許從具有高達 96GB 統一記憶體的系統中分配高達 128GB 的記憶體作為 VRAM,從而支援部署現代語言模型,例如 Google 的 Gemma 3 27B Vision。
AMD 處理器相對於競爭對手的效能優勢在實際的 AI 應用中也顯而易見,例如 DeepSeek R6 Distill Qwen 1B 中具有高精度 32 位元量化的醫學影像分析和編碼輔助。
來源:
來源: 3dnews.ru
