2025 年 3 月,英偉達(dá)發(fā)布了 DGX B300 AI 加速計(jì)算平臺(tái)。2025 年 5 月,英特爾發(fā)布了三款全新英特爾至強(qiáng) 6 性能核處理器,其中一款 6776P 被用作是 DGX B300 的主控 CPU,這款處理器究竟有什么特殊之處呢?
AI 加速系統(tǒng)為何看重 CPU 主控能力?
作為造價(jià)極高的 AI 加速系統(tǒng),DGX B300 可以不計(jì)成本地選任何 CPU,只要它能充分的發(fā)揮整套系統(tǒng)的性能。選擇英特爾至強(qiáng) 6 作為默認(rèn)推薦的 CPU 配置,這意味著它能很好地滿足需求,也意味大量 AI 加速系統(tǒng)會(huì)搭載這款英特爾處理器。
在 AI 服務(wù)器中,CPU 其實(shí)很重要,它不僅要運(yùn)行操作系統(tǒng),還要負(fù)責(zé)協(xié)調(diào) GPU 的工作、管理系統(tǒng)資源,支撐整個(gè) AI 系統(tǒng)穩(wěn)定運(yùn)行。此前,來自 IDC 的數(shù)據(jù)顯示,有 73% 的 GPU 加速服務(wù)器都在使用英特爾至強(qiáng)處理器作為主控 CPU。
從技術(shù)細(xì)節(jié)看,主控 CPU 需要和 GPU 協(xié)同工作。因此,CPU 在 I/O、核心性能、內(nèi)存(容量和帶寬)、CPU 上的預(yù)處理或卸載(offload)能力、RAS 特性,以及對(duì)于多種形態(tài)的 AI 服務(wù)器架構(gòu)的支持,都會(huì)影響整個(gè) AI 系統(tǒng)的性能。
英特爾至強(qiáng) 6:理想主控 CPU 的優(yōu)勢(shì)解析
首先,我們從產(chǎn)品角度來簡(jiǎn)要介紹一下,為什么英偉達(dá)會(huì)選擇英特爾至強(qiáng) 6 處理器作為推薦配置?
首先,在 I/O 部分,英特爾至強(qiáng) 6 性能核處理器最多支持 96 個(gè) PCIe 5.0 通道,相較于第五代至強(qiáng)可擴(kuò)展處理器增加了 20%。像 DGX B300 這種雙路服務(wù)器系統(tǒng),PCIe 總數(shù)能來到 192 個(gè)。
在 CPU 核心部分,英特爾至強(qiáng) 6 支持最多 128 個(gè)性能核心,相較于上代直接翻倍。平均單核性能提升 20%,平均每瓦性能提升高達(dá) 1.6 倍,同等性能水平下平均可以節(jié)省 30% 的 TCO。并且還具備卓越的單線程能力。
在內(nèi)存部分,英特爾至強(qiáng) 6 支持 DDR5-6400MT/s、最高達(dá) 8800MT/s 的 MRDIMM 內(nèi)存以及 CXL 技術(shù),可提供更大內(nèi)存帶寬和更大內(nèi)存容量。其中,英特爾至強(qiáng) 6 性能核還將內(nèi)存通道數(shù)從 8 個(gè)提升到了 12 個(gè),整體內(nèi)存帶寬和內(nèi)存容量都有了大幅提升。
英特爾至強(qiáng) 6 可以更好地支持在 CPU 上做預(yù)處理和卸載,這一部分會(huì)用到高級(jí)矩陣擴(kuò)展(AMX)。因?yàn)楝F(xiàn)在的 MoE 模型越來越多,在 CPU 上做一些卸載工作現(xiàn)在變成了很熱點(diǎn)的話題,英特爾和很多合作伙伴也在進(jìn)行積極探索。
英特爾至強(qiáng) 6 支持專門的 RAS(Reliability, Availability, Serviceability)功能,它可以減少系統(tǒng)宕機(jī)時(shí)間。這次英偉達(dá)的 DGX B300 采用的是雙路服務(wù)器,豐富的 RAS 特性支持可以顯著減少宕機(jī)時(shí)間,提高系統(tǒng)資源的利用率。
因此,不管是英偉達(dá)的 DGX(英偉達(dá)的一體化平臺(tái))、MGX(英偉達(dá)開放給合作伙伴的模塊化服務(wù)器設(shè)計(jì)規(guī)范),還是 DC-MHS 全球標(biāo)準(zhǔn)(英特爾牽頭的模塊化標(biāo)準(zhǔn)架構(gòu)),英特爾至強(qiáng) 6 都可以靈活支持。
2025 年 5 月下旬,英特爾發(fā)布了三款新的性能核處理器,分別是 6962P、6776P 以及 6774P。其中,6776P 被用作英偉達(dá)的 DGX B300 系統(tǒng)的主控 CPU,為什么要選擇這款處理器呢?
為什么選英特爾至強(qiáng) 6776P 做 DGX B300 的主控 CPU?
此前,推薦作為英偉達(dá) DGX 主控的 CPU 型號(hào)是 6767P,這是一個(gè) 64 核的處理器,它的基礎(chǔ)頻率是 2.4GHz,全核睿頻是 3.6GHz,最大睿頻來到了 3.9GHz。
6776P 也是一塊 64 核的處理器,基礎(chǔ)頻率是 2.3GHz,全核睿頻是 3.6GHz,最大睿頻是 3.9GHz。得益于英特爾創(chuàng)新的 PCT 技術(shù),最高主頻提升到了 4.6GHz,更高的主頻可以讓數(shù)據(jù)更快傳遞到 GPU,從而提高 GPU 在高強(qiáng)度工作負(fù)載下的性能。
PCT 指的是英特爾 Priority Core Turbo 技術(shù),它讓部分核心成為高優(yōu)先級(jí)的核心,相應(yīng)的,其他的核心就是低優(yōu)先級(jí)。搭配英特爾 Speed Select 睿頻頻率(Intel SST-TF)技術(shù),讓高優(yōu)先級(jí)的核心以更高的主頻工作。
英特爾官方用這種方式把少數(shù)核心拉到更高頻率,意味著用戶可以不用額外考慮散熱等問題,還能保證可以長(zhǎng)時(shí)間穩(wěn)定運(yùn)行。
英特爾此次發(fā)布的 3 款支持 PCT 的至強(qiáng)處理器當(dāng)中,6774P 是單路 CPU,6776P 和 6962P 是雙路 CPU。為了獲得更高的 4.6GHz PCT 頻率,又因?yàn)橐С蛛p路服務(wù)器,所以要選 6776P。
雙路的 DGX B300 可以提供 176 條 Gen 5.0 通道。內(nèi)存部分,在 DGX B300 系統(tǒng)中,它只支持 8 個(gè)內(nèi)存通道,為了追求更大容量,這里采用了 2 DPC 的設(shè)置,每個(gè)通道配置 2 個(gè) DIMM,雙路理論最高容量為 8TB,可以更好地應(yīng)對(duì)未來更大數(shù)據(jù)規(guī)模。
上方在 AI 系統(tǒng)中使用至強(qiáng) 6 為主控 CPU 的示意圖中,有兩塊 CPU 帶著 8 塊 GPU,8 塊 GPU 之間通過 NVLink 互連,兩塊 CPU 之間通過 UPI 互連。
6776P 最多支持 8 個(gè) PCT 核心,也就是讓 8 個(gè)核心運(yùn)行在高頻率,用戶可以根據(jù)需求選擇 8 個(gè)、6 個(gè)、4 個(gè)或 2 個(gè)。
PCT 核心的設(shè)置也比較簡(jiǎn)單,一種是在 BIOS 里進(jìn)行設(shè)置,把一定數(shù)量的核心設(shè)定為 PCT 高核心。另外一種是通過 SST 的 TF 工具進(jìn)行設(shè)置,在系統(tǒng)運(yùn)行時(shí)可以動(dòng)態(tài)配置調(diào)整,這種方式更便捷。
從英特爾專家的介紹中了解到,這三款處理器都是英特爾至強(qiáng)常規(guī)產(chǎn)品路線圖中的一部分,三款產(chǎn)品都是可以面向所有客戶開放的標(biāo)準(zhǔn)產(chǎn)品,而不是為特定用戶特定場(chǎng)景定制的特殊方案。
對(duì)于選擇 DGX B300 的用戶來說,6776P 已是默認(rèn)選項(xiàng)。如果是 MGX 用戶,則可以使用此前已發(fā)布的 6767P。理論上,英特爾至強(qiáng) 6 的所有型號(hào)都支持作為 AI 加速計(jì)算系統(tǒng)的主控 CPU,用戶在選用時(shí)可以根據(jù)實(shí)際需求作出選擇。