推開(kāi)新時(shí)代PC的大門(mén),英特爾全新“AI處理器”解析
此前在今年9月,我們?nèi)咨钤?jīng)結(jié)合當(dāng)時(shí)最新的架構(gòu)資料,以及所拿到的一些獨(dú)家內(nèi)部數(shù)據(jù),率先為大家“解析”了英特爾的最新一代移動(dòng)處理器架構(gòu)。
當(dāng)然,現(xiàn)在大家都已經(jīng)知道,當(dāng)時(shí)我們所“解析”的對(duì)象就是剛剛發(fā)布的第一代酷睿Ultra處理器的某個(gè)ES版本。
不過(guò)平心而論,當(dāng)時(shí)我們拿到的資料畢竟還比較早期,所以它盡管已經(jīng)講得十分詳細(xì),但距離最終上市的版本還是有著一些差距,這也就是為什么我們非常要關(guān)注2023年12月15日英特爾這場(chǎng)新品發(fā)布會(huì)的原因。以結(jié)果來(lái)說(shuō),這次活動(dòng)也確實(shí)沒(méi)有令我們失望。
更大、更強(qiáng),第五代可擴(kuò)展至強(qiáng)“大殺器”登場(chǎng)
不得不說(shuō),英特爾此次新品發(fā)布會(huì)與以往相比最大的一點(diǎn)不同,就在于他們幾乎是首次將面向企業(yè)的云端服務(wù)器CPU新品,和面向消費(fèi)者的端側(cè)計(jì)算設(shè)備CPU新品放到了一起。
首先亮相的,是第五代至強(qiáng)可擴(kuò)展處理器。根據(jù)相關(guān)技術(shù)資料顯示,與第四代至強(qiáng)可擴(kuò)展處理器相比,代號(hào)“Emerald Rapide-SP”的新CPU依然沿用了Intel7制程,但對(duì)架構(gòu)進(jìn)行了大幅度的重新設(shè)計(jì)。
此次亮相的第五代至強(qiáng)可擴(kuò)展處理器“完整規(guī)格”,擁有64顆、而不再是上代的60顆內(nèi)核,并且這些核心現(xiàn)在被分為2個(gè)MCM模塊、而不再是上代的4個(gè)。這也就意味著新架構(gòu)的每一個(gè)CPU模塊,都具備了相當(dāng)于上代2倍還多的內(nèi)核數(shù)量。
在此基礎(chǔ)上,第五代至強(qiáng)可擴(kuò)展處理器的基本架構(gòu)也從Golden Cove更新到了Raptor Cove,這就意味著它與大家熟悉的13代、14代酷睿一樣,對(duì)緩存和內(nèi)存子系統(tǒng)進(jìn)行了大幅度的增強(qiáng)。比如將新款的Xeon8592+與前代Xeon8490H對(duì)比就會(huì)發(fā)現(xiàn),它的L3Cache從112.5MB一口氣增加到了320MB。同時(shí)與前代的DDR5-4800相比,八通道DDR5-5600起步的內(nèi)存頻率,也代表其內(nèi)存帶寬得到了顯著的增強(qiáng)。
當(dāng)然,以上的這些架構(gòu)、性能改進(jìn),主要服務(wù)的都是諸如京東、阿里、百度這樣的云服務(wù)廠商。也就是說(shuō),它的作用在于加速如今AI大模型在云端的迭代和應(yīng)用效率。但除此之外,大家都知道英特爾還有一個(gè)相對(duì)“民用”、面向發(fā)燒友的產(chǎn)品線Xeon W,所以第五代可擴(kuò)展至強(qiáng)的架構(gòu),實(shí)際上也相當(dāng)于變相預(yù)告了下一代Xeon W的諸多信息。
更多核心、更強(qiáng)核顯、還有NPU,酷睿Ultra來(lái)了
接下來(lái)就是此次發(fā)布會(huì)的重頭戲,全新的英特爾酷睿Ultra處理器了。
首先在架構(gòu)上,第一代酷睿Ultra是英特爾旗下首款采用了多模塊、多制程混合封裝設(shè)計(jì)的處理器。它的每一顆核心擁有四個(gè)模塊,分別是采用Intel4制程的CPU模塊、采用臺(tái)積電5nm制程的GPU模塊,以及采用臺(tái)積電6nm制程的SoC模塊、和同樣是基于臺(tái)積電6nm制程的IO模塊。
這樣的設(shè)計(jì)有什么好處呢?一方面它可以讓處理器集成更多的功能組件。比如以這一代定位最高的酷睿i9-185H為例,它的CPU模塊集成了6P+8E、總共14顆CPU核心,同時(shí)在SoC模塊里還有2顆額外的E核,可以在運(yùn)行極低負(fù)載時(shí)完全關(guān)閉CPU模塊,從而達(dá)到更省電的目的。
又比如說(shuō),酷睿Ultra的ARC GPU模塊現(xiàn)在擁有更“全”的Xe架構(gòu)。它最多擁有128個(gè)執(zhí)行單元(而非前代的96個(gè)),運(yùn)行頻率可以高達(dá)2250MHz,并擁有64個(gè)紋理單元和32個(gè)光柵單元,此外還支持硬件光追和XeSS硬件AI超分抗鋸齒。在這樣的配置下,新的核顯FP32性能可以高達(dá)4.608TFlops,相當(dāng)于前代的整整兩倍。
除此之外,酷睿Ultra也成為了英特爾首款集成NPU的移動(dòng)處理器方案,根據(jù)相關(guān)技術(shù)資料顯示,它的NPU算力可達(dá)10TOPs。與此同時(shí),其還集成了雷電4控制器。
除了架構(gòu)、設(shè)計(jì)上的大幅改進(jìn),酷睿Ultra此次還有一個(gè)非常值得關(guān)注的亮點(diǎn),那就是它標(biāo)壓版本的默認(rèn)TDP僅28-45W,最大TDP也不過(guò)115W。要知道自11代開(kāi)始,標(biāo)壓的移動(dòng)版酷睿已經(jīng)很久沒(méi)有過(guò)如此低的官方TDP參數(shù)了,諸如14900HX這樣的高端標(biāo)壓移動(dòng)CPU,更是有著157W的官方最高TDP設(shè)定。從目前各個(gè)渠道曝光的相關(guān)信息來(lái)看,超高的能效比很可能會(huì)是第一代酷睿Ultra在實(shí)際使用中的突出亮點(diǎn)。
如何讓“AI PC”真正實(shí)用,英特爾確實(shí)帶了個(gè)好頭
如果大家有關(guān)注最近的相關(guān)信息想必知道,其實(shí)英特爾的競(jìng)爭(zhēng)對(duì)手,比如高通、超微,在此前就發(fā)布了具備獨(dú)立NPU的移動(dòng)CPU產(chǎn)品線。相比之下,英特爾的酷睿Ultra系列反而算是來(lái)得比較晚的了。
但這并不意味著英特爾在“AI PC”的技術(shù)路線上,起步得就比競(jìng)爭(zhēng)對(duì)手晚。實(shí)際上,早在2019年英特爾就已經(jīng)在當(dāng)時(shí)的酷睿X系列處理器(Cascade Lake)里,首次加入了用于加速深度學(xué)習(xí)計(jì)算的DL Boost指令集。
后續(xù)到了10代、11代酷睿移動(dòng)版上,DL Boost和AVX-512指令集進(jìn)一步被普及到更多的普及型產(chǎn)品上,從而使得當(dāng)時(shí)的許多筆記本電腦產(chǎn)品就具備了類似攝像頭居中、麥克風(fēng)降噪、視頻超分這類AI體驗(yàn)。
后續(xù)隨著英特爾方面將Xe架構(gòu)引入酷睿處理器的核顯,這些核顯實(shí)際上也具備了AI加速能力。比如在一些12代、13代酷睿的筆記本、甚至臺(tái)式PC上,就都能夠看到基于核顯算力去實(shí)現(xiàn)的AI語(yǔ)音助手、AI背景虛化等功能。
正因如此,在第一代酷睿Ultra處理器里,雖然表面上看,它的“AI單元”好像就是一個(gè)NPU。但實(shí)際上,英特爾早就搞定了讓CPU、GPU、NPU根據(jù)不同代碼承擔(dān)不同AI任務(wù)、有時(shí)甚至可以協(xié)同計(jì)算的異構(gòu)加速體系,并且他們將這種技術(shù)稱之為“XPU”。
而且更為重要的是,在今天的發(fā)布會(huì)上可以看到,英特爾已經(jīng)拉來(lái)了大量的國(guó)內(nèi)軟件廠商,演示了他們的產(chǎn)品在酷睿Ultra上通過(guò)AI加速運(yùn)行的效果。據(jù)英特爾方面的說(shuō)法,即便在這個(gè)產(chǎn)品才剛剛發(fā)布的時(shí)間點(diǎn)上,酷睿Ultra就已經(jīng)得到了超過(guò)100款以上軟件的官方適配,可以發(fā)揮出AI的加速效果來(lái)。
不得不說(shuō),比起單純往CPU里塞硬件AI加速單元,英特爾這套獨(dú)特的異構(gòu)處理設(shè)計(jì),以及他們?yōu)橥苿?dòng)“AI PC”普及而進(jìn)行的大量適配,可能才是酷睿Ultra與競(jìng)爭(zhēng)對(duì)手相比最為明顯的優(yōu)勢(shì)所在。