Intel Core i9-10980XE 處理器評測,AVX-512 加料 VNNI 又降價,更超值的 HEDT 平台處理器誕生

T客邦

454

發佈時間: 2019-11-25 08:17

更新時間: 2019-11-25 08:17

訂閱文章

Intel HEDT 平台改朝換代,這次不是 Skylake 伺服器級微架構 refresh 再更新時脈加強版,而是導入 Cascade Lake 微架構,並同步感受到競爭對手 AMD 步步進逼,Core i9-10980XE 價格對半砍,讓想要進入 HEDT 市場的消費者有著更划算的選擇。

降價成最大優勢

HEDT 平台市場,Intel 與 AMD 均有相關產品推出,雖然前者被後者的多晶片封裝殺手鐧影響,不得不推出實體十二核心以上的產品型號,定位詭異的 Kaby Lake X 也快快下架,卻也依靠較為先進的微架構設計,支撐產品售價不至於崩落。

隸屬 Skylake 微架構的前、後代 Core i9-7980XE 和 Core i9-9980XE 處理器,每千顆的單顆建議售價均為美金 1,979 元,折合新台幣 60,550 元左右。最新一代 Core i9-10980XE 則是大降價至美金 979 元,折合約新台幣 29,950 元,比腰斬一半還要多出些許,一方面是受到 AMD 第三代 Ryzen Threadripper chiplet 設計,SP3/TRX4 腳位可以塞入 64 個實體核心,另一方面則是 Zen 2 微架構 AVX2 執行單元寬度已進步成 256bit,不若 Zen/Zen+ 採用 128bit 寬度執行 2 次。

▲ Intel Core i9-10000X/XE 與前一世代 Core 9000X/XE 規格比較表。(註:不含 AVX,點圖放大)Intel Core i9-10000X/XE 與前一世代 Core 9000X/XE 規格比較表。(註:不含 AVX,點圖放大)

AVX-512、DL Boost/VNNI

對於消費市場而言,Cascade Lake 微架構內部相較於 Skylake(伺服器級)並沒有太大的變動,除了執行單元因應新指令集稍作調整,其餘前端、執行單元、記憶體子系統均沒有變化,Optane DC Persistent Memory 支援性在 HEDT 市場被拔除,但已修復先前多個重大硬體漏洞。Cascade Lake 另外一個和消費市場沒有太大關係的演進,能夠透過 2 個實體 28 核心 XCC 配置晶粒共同封裝,藉由 UPI 相互連結打造單一封裝、56 核心、112 執行緒處理器。

要理解 Cascade Lake FMA 執行單元新增的 VNNI 指令集(Vector Neural Network Instructions),須從 AVX 指令集(Advanced Vector Extensions)開始說起。AVX 為 SSE(Streaming SIMD Extensions)的延伸,如同文字敘述,採用單指令多資料流向量處理方式,特別適合平行處理多媒體內容。AVX 之所以是 SSE 的擴展,主要是因為 AVX 把處理資料寬度從 128bit 提升 1 倍達 256bit,並支援 3 元運算,AVX2 則是把整數命令也擴展至 256bit。

▲ Cascade Lake 加入 Deep Learning Boost/AVX-512_VNNI 指令集,可加速深度學習經常使用的矩陣運算。Cascade Lake 加入 Deep Learning Boost/AVX-512_VNNI 指令集,可加速深度學習經常使用的矩陣運算。

Intel 並未把處理寬度擴展成 512bit 的 AVX 指令集稱為 AVX3,而是一眼就可看穿的 AVX-512,從 Xeon Phi 代號 Knights Landing 開始支援 AVX-512 F/CD/ER/PF 等子集,並支援 4 運算元。Cascade Lake Port 0 和 Port 1 各自的 256bit 合併成 512bit 即可支援 AVX-512,Port 5 則有獨立的 512bit FMA,此外 Intel 還在擴展 AVX-512 指令集的階段,市場推廣口號 DL Boost 的 VNNI 即為一例。

VNNI 新增 4 個指令,包含 VPDPBUSD、VPDPBUSDS、VPDPWSSD、VPDPWSSDS,前 2 者為無符號/有符號 8bit 位元組(byte)的乘與加,後 2 者為無符號/有符號 16bit 字組(word)的乘與加,單一指令相對於過往需要 VPMADDUBSW+VPMADDWD+VPADDD 等 3 個指令,VNNI 可加速整數量化矩陣運算。

PCIe 通道與供電同步加強

Cascade Lake 硬體部分沒有太大變化,規格部分倒是變化不少。記憶體等效時脈從前一世代的 DDR4-2666 往上躍升一級來到 DDR4-2933,單通道理論頻寬為 23466MB/s,四通道理論頻寬即為 91.7GB/s 左右。另外,Cascade Lake 消費市場層級產品額外拉出 4 條 PCIe 3.0 通道,達 48 條,這部分需要新款 X299 晶片組主機板才可享受。(VROC 仍舊需要另外買授權)

▲ Cascade Lake 相對 Skylake(伺服器級)多出 4 條 PCIe 3.0 通道共 48 條,需換裝新款 X299 晶片組主機板才享受得到。Cascade Lake 相對 Skylake(伺服器級)多出 4 條 PCIe 3.0 通道共 48 條,需換裝新款 X299 晶片組主機板才享受得到。

受限於產品開發時程,Intel 2.5Gbps 乙太網路控制晶片 I-255V 並未能夠搭上這股 X299 晶片組主機板更新熱潮,但主機板廠商也會依據產品定位額外加裝支援 802.3bz 2.5Gbps 或是 5Gbps 的網路控制晶片,10Gbps 802.3ab 規格支援自然不在話下;無線網路部分,還是那 101 個 Intel Wi-Fi 6 AX200 無線網路卡,2.4GHz 和 5GHz 均可支援 Wi-Fi 6/802.11ax 雙空間流。

AMD 第一代 Ryzen Threadripper 推出之時,殺得 Intel HEDT 平台措手不及,逼得 Intel 也不得不推出實體十二核心以上的產品,相信大家還記憶猶新。由於推出 Core i9-7980XE 並不在原本的計畫之中,致使部分 X299 晶片組主機板不太能應付這款產品及其繼任者 Core i9-9980XE。這次 X299 晶片組主機板 refresh,眾廠商也都加強處理器供電轉換規模,加上 Core i9-10980XE 處理器價格對半砍,先前已覬覦此平台的玩家,不妨趁此機會逢低買進。

▲ 早買早享受、晚買享折扣,Intel HEDT 平台頂級處理器 Core i9-9980XE、Core i9-10980XE 前後世代相隔 1 年,價格直接腰斬!早買早享受、晚買享折扣,Intel HEDT 平台頂級處理器 Core i9-9980XE、Core i9-10980XE 前後世代相隔 1 年,價格直接腰斬!

▲ Core i9-10980XE Tjunction 從 i9-9980XE 的 84℃ 提升至 86℃。Core i9-10980XE Tjunction 從 i9-9980XE 的 84℃ 提升至 86℃。

14nm 能源效率提升

縱使市場經常拿 Intel 的 14nm 製程普拉斯開玩笑,但每一代處理器產品推出之時,總會有些不相同。下列平台耗電量與處理器溫度測試,Core i9-7980XE 和 Core i9-10980XE 均採用 Asus Prime X299 Edition 30 主機板與 GIGABYTE AORUS Liquid Cooler 240 一體式水冷散熱器,測試結果可說明製程演進變化,至於 Ryzen Threadripper 2990WX 則是使用 Enermax LIQTECH TR4 240。

Core i9-7980XE 和 Core i9-10980XE 均為實體十八核心,後者基礎與自動超頻時脈均多出 400MHz,但是平台耗電量與處理器溫度表現卻更加優秀(註:測試時,Core i9-7980XE 已將內部熱界面材料替換成液態金屬合金),AIDA64 與 Blender Benchmark 燒機可下降 10W 左右,溫度則是下降 2℃。

▲ Core i9-10980XE 時脈相對 Core i9-7980XE 更高,耗電量與溫度表現卻更好,說明 Intel 透過 14nm 製程打造的處理器不盡相同,越晚推出的產品擁有比較好的表現。(室溫 25℃)Core i9-10980XE 時脈相對 Core i9-7980XE 更高,耗電量與溫度表現卻更好,說明 Intel 透過 14nm 製程打造的處理器不盡相同,越晚推出的產品擁有比較好的表現。(室溫 25℃,Ryzen Threadripper 2990WX 為 Tjunction 溫度。)

(下一頁:Core i9-10980XE 實測對比)

AVX-512 與記憶體延遲優勢

誠如文章開頭所述,AMD Zen 2 微架構對於 AVX2 指令集的處理,已經從 128bit 寬度做 2 次變成 256bit 做 1 次,對於現今已大量使用 AVX2 指令集的軟體而言,Intel 與 AMD 處理器雙方差距已不若 Zen/Zen+ 時代,那麼 Intel HEDT 平台的優勢在哪?

Intel HEDT 平台在過去幾年之間,一直擁有的優勢為 AVX-512 指令集,Cascade Lake 則再加入針對深度學習應用較有利的 VNNI 子集,前者指令集已導入部分商用軟體、渲染繪圖、影像轉檔之中。從下方的 SiSoftware Sandra 20/20 測試項目即可觀察到,AVX-512 讓 Intel 平台實體十八核心產品對比對手 32 核心產品並不遜色。

下列測試效能表格,除了本文主角 Cascade Lake 世代 Core i9-10980XE,筆者另外選擇 Core i9-7980XE 與 Ryzen Threadripper 2990WX、Ryzen 9 3950X,選擇後 2 者的理由很簡單,其一為第三代 Ryzen Threadripper 解禁時間還沒到,只能抓它來比較(Ryzen Threadripper 2990WX 目前市場售價約新台幣 42,000 元),後者則是可以挑戰 HEDT 平台計算能力的主流平台處理器。

▲ Cascade Lake 世代的 JEDEC DDR4 記憶體等效時脈提升至 DDR4-2933,與第二代 Ryzen Threadripper 相同。Cascade Lake 世代的 JEDEC DDR4 記憶體等效時脈提升至 DDR4-2933,與第二代 Ryzen Threadripper 相同。(點圖放大)

▲ CPU-Z 測試部分,Core i9-10980XE 保有單執行緒最佳表現,Ryzen Threadripper 2990WX 則因 32 核心 64 執行緒獲得較高的多執行緒分數。CPU-Z 測試部分,Core i9-10980XE 保有單執行緒最佳表現,Ryzen Threadripper 2990WX 則因 32 核心 64 執行緒獲得較高的多執行緒分數。

▲ Sandra 20/20 運算效能測試當中,Ryzen Threadripper 2990WX 因為半速 AVX2 指令集效能吃了許多悶虧,幾乎被核心數量只有一半的 Ryzen 9 3950X 迎頭趕上,而 Core i9-10980XE 則因支援 AVX-512,於部分項目有著不錯的優勢。Sandra 20/20 運算效能測試當中,Ryzen Threadripper 2990WX 因為半速 AVX2 指令集效能吃了許多悶虧,幾乎被核心數量只有一半的 Ryzen 9 3950X 迎頭趕上,而 Core i9-10980XE 則因支援 AVX-512,於部分項目有著不錯的優勢。

另外一個 Cascade Lake 所擁有的優勢,或著應該說是一直以來相對對手所保持的優勢,即為記憶體存取能力,即便是與對手同樣運作於 DDR4-2933 16-18-18-36 1T,Core i9-10980XE 不僅擁有較高的讀寫頻寬,存取延遲也更低。

▲ AIDA64 快取與記憶體頻寬測試結果,Intel 平台保有記憶體頻寬與低存取延遲優勢。AIDA64 快取與記憶體頻寬測試結果,Intel 平台保有記憶體頻寬與低存取延遲優勢。

相反地,若是軟體單純地喜愛多執行緒,那麼 Ryzen Threadripper 2990WX 32 核心 64 執行緒可取得效能優勢,但若是喜愛多執行緒又同時採用 AVX2 指令集,那麼越級挑戰選手 Ryzen 9 3950X 可以獲得不錯的成績。

▲ Core i9-10980XE 相對於 Core i9-7980XE,在 7-Zip 測試大約成長 5% 效能,Intel 於壓縮部分佔有優勢,反觀 AMD 則是於解壓縮部分占上風。Core i9-10980XE 相對於 Core i9-7980XE,在 7-Zip 測試大約成長 5% 效能,Intel 於壓縮部分佔有優勢,反觀 AMD 則是於解壓縮部分占上風。

▲ x264 FHD Benchmark 和 HWBOT x265 Benchmark 使用 AVX2 指令集,執行緒則是越多越好,因此 Ryzen 9 3950X 贏過自家 Ryzen Threadripper 2990WX 不少,同時依靠略高的運作時脈贏過 Core i9-10980XE。x264 FHD Benchmark 和 HWBOT x265 Benchmark 使用 AVX2 指令集,執行緒則是越多越好,因此 Ryzen 9 3950X 贏過自家 Ryzen Threadripper 2990WX 不少,同時依靠略高的運作時脈贏過 Core i9-10980XE。

▲ 多款 3D 渲染測試軟體均偏向多執行緒,整體而言以 Ryzen Threadripper 2990WX 最佳,Ryzen 9 3950X 接著同樣以略高的時脈勝過 Core i9-10980XE。多款 3D 渲染測試軟體均偏向多執行緒,整體而言以 Ryzen Threadripper 2990WX 最佳,Ryzen 9 3950X 接著同樣以略高的時脈勝過 Core i9-10980XE。

測量電腦整體效能的 PCMark 10,Core i9-10980XE 和 Ryzen 9 3950X 總分均超過 1 萬分,前者於必要測試項目、生產力測試項目的得分較高,後者則在 3D、遊戲部分得分較高,Ryzen Threadripper 2990WX 反而屈居末位。Ryzen Threadripper 2990WX 比較特殊的 NUMA 結構,似乎在 VRMark 測試當中遇到些麻煩,較低的運作時脈同樣於 3DMark 討不到便宜。

▲ Core i9-10980XE 和 Ryzen 9 3950X 於 PCMark 10 得分均突破 1 萬分,前者於工作表現較佳、後者優勢則存在於 3D 遊戲項目。Core i9-10980XE 和 Ryzen 9 3950X 於 PCMark 10 得分均突破 1 萬分,前者於工作表現較佳、後者優勢則存在於 3D 遊戲項目。

▲ Ryzen Threadripper 2990WX 採用消費平台不常見的 NUMA 架構,因此於 VRMark 當中位居末位。Ryzen Threadripper 2990WX 採用消費平台不常見的 NUMA 架構,因此於 VRMark 當中位居末位。

▲ 3DMark 內含不同等級畫面的測試項目,當畫面越簡單,Ryzen 9 3950X 較高運作時脈特色得以展現出來。3DMark 內含不同等級畫面的測試項目,當畫面越簡單,Ryzen 9 3950X 較高運作時脈特色得以展現出來。

你挑對處理器了嗎?

HEDT 平台之所以為 HEDT 平台,表示該使用者對於平行運算能力有著更多的需求,相對於主流平台工作性質也會更為單純、更為專精。縱使 AMD 第三代 Ryzen Threadripper 處理器測試尚有數個小時才能夠公布,但從目前所釋出的規格項目,仍舊可以判斷出 Intel Cascade Lake HEDT 平台優勢。

首先為記憶體存取效能,Intel 平台繼續保持高頻寬、低延遲特色,即便 AMD 於單個 CCD 當中塞入 32MB L3 快取,倘若運算工作內容不符快取演算法,因而需要經常性地存取系統記憶體,那麼替 AMD 帶來任意拼湊核心、功能區塊的 Infinity Fabric,反而增加通訊延遲變成缺點。再者,chiplet 帶來更多 x86 核心,也讓 AM4 主流平台和 TRX4 HEDT 平台市場間隔過大,容易被 Intel 見縫插針。

另一方面為指令集支援性,AVX-512 前些年只在 Intel HEDT 平台與伺服器當中出現,因此大多是商業軟體或是科學模擬軟體採用。今年開始,筆記型電腦代號 Ice Lake 處理器也開始支援 AVX-512,更有甚者同時納入 VNNI 子集,接下來可以預期將有更多的軟體將會使用。因此 HEDT 平台並非是贏者全拿的狀況,而是依據使用者使用的軟體,進而選擇 Intel 或是 AMD 平台。

產品資訊

Intel Core i9-10980XE

資料來源

Intel Architecture Instruction Set Extensions and Future Features Programming Reference

Intel 64 and IA-32 Architectures Optimization Reference Manual

延伸閱讀

測試平台

  • Intel:
  • 主機板:Asus Prime X299 Edition 30
  • 記憶體:Kingston HyperX Fury RGB DDR4-3466 8GB x 4 @DDR4-2666 or @DDR4-2933
  • 顯示卡:NVIDIA GeForce RTX 2080 Ti Founders Edition
  • 系統碟:Plextor M9Pe(G) 512GB
  • 電源供應器:Seasonic Platinum SS-1000XP
  • 作業系統:Microsoft Windows 10 Pro 64bit 1909
  • AMD AM4:
  • 主機板:GIGABYTE X570 AORUS Master
  • 記憶體:Kingston HyperX Fury RGB DDR4-3466 8GB x 4 @DDR4-3200
  • 顯示卡:NVIDIA GeForce GTX 2080 Ti Founders Edition
  • 系統碟:Corsair Force MP600 Gen4 PCIe x4 NVMe M.2 SSD 1TB
  • 電源供應器:Seasonic Platinum SS-1000XP
  • 作業系統:Microsoft Windows 10 Pro 64bit 1909
  • AMD TRX4:
  • 主機板:Asus ROG Zenith II Extreme
  • 記憶體:Cosair Dominator Platinum RGB DDR4-3600 16GB x 4 @DDR4-3200
  • 顯示卡:NVIDIA GeForce GTX 2080 Ti Founders Edition
  • 系統碟:Corsair Force MP600 Gen4 PCIe x4 NVMe M.2 SSD 1TB
  • 電源供應器:Seasonic Platinum SS-1000XP
  • 作業系統:Microsoft Windows 10 Pro 64bit 1909
想看小編精選的3C科技情報&實用評測文,快來加入《T客邦》LINE@查看原始文章訂閱文章
延伸閱讀
小編推薦

資料來源Intel Core i9-10980XE 處理器評測,AVX-512 加料 VNNI 又降價,更超值的 HEDT 平台處理器誕生
若針對此內容有任何建議,請聯繫客服