北京時(shí)間12月12日晚,Intel在圣克拉拉舉辦了架構(gòu)日活動(dòng)。在五個(gè)小時(shí)的演講中,Intel揭開(kāi)了2021年CPU架構(gòu)路線圖、下一代核心顯卡、圖形業(yè)務(wù)的未來(lái)、全新3D封裝技術(shù),甚至部分2019年處理器新架構(gòu)的面紗。
姍姍來(lái)遲的消費(fèi)級(jí)CPU路線圖
近一段時(shí)間以來(lái),業(yè)界一直非常期待看到Intel未來(lái)的架構(gòu)路線圖,但自Skylake以來(lái)卻一直處于猶抱琵琶半遮面的狀態(tài)。最近幾個(gè)月Intel簡(jiǎn)單公布了一部分?jǐn)?shù)據(jù)中心產(chǎn)品路線圖,包括Cascade Lake,Cooper Lake和Ice Lake以及未來(lái)幾代,但消費(fèi)級(jí)產(chǎn)品卻依舊難產(chǎn)。
在本次架構(gòu)日活動(dòng)上,Intel終于帶來(lái)了消費(fèi)級(jí)的PC處理器架構(gòu)路線圖和Atom架構(gòu)路線圖。
在高性能的Core系列產(chǎn)品線上,Intel列出了未來(lái)三年內(nèi)的三個(gè)新代號(hào):Sunny Cove、Willow Cove和Golden Cove,其中離我們最近的Sunny Cove將于2019年上市(PS:你猜會(huì)不會(huì)鴿^_^)。
據(jù)悉,Sunny Cove架構(gòu)旨在提高通用計(jì)算任務(wù)下每時(shí)鐘計(jì)算性能和降低功耗,將擁有AVX-512單元,并包含了可加速人工智能和加密等專用計(jì)算任務(wù)的新功能,將成為Intel下一代PC和服務(wù)器處理器的基礎(chǔ)架構(gòu)。
隨后的Willow Cove在路線圖上位于2020年,很可能也是10nm。Intel將此處的重點(diǎn)列為緩存重新設(shè)計(jì)(可能意味著L1/L2調(diào)整)、新的晶體管優(yōu)化(基于制造)以及其他安全功能,可能是指新一類側(cè)信道攻擊的進(jìn)一步增強(qiáng)。
Golden Cove則位于圖表中的2021年,工藝制程仍是一個(gè)問(wèn)號(hào),可能是10nm也可能是7nm,Intel將進(jìn)一步提升其單線程性能和人工智能性能,并在核心設(shè)計(jì)中增加了潛在的網(wǎng)絡(luò)和AI功能,安全特性看起來(lái)也得到了提升。

Atom系列低功耗處理器的架構(gòu)路線圖比酷睿系列的節(jié)奏慢,考慮到其歷史,這并不奇怪。鑒于Atom必須適應(yīng)各種設(shè)備,業(yè)界更多的是期望產(chǎn)品能夠提供更廣泛的功能,尤其是SoC方面。
即將在2019年推出的架構(gòu)名為Tremont,專注于單線程性能、網(wǎng)絡(luò)服務(wù)器性能以及電池續(xù)航時(shí)間的提升。緊隨Tremont之后的將是Gracemont,Intel將其列為2021年的產(chǎn)品,可能會(huì)擁有更寬的矢量處理單元或支持新的矢量指令。
從路線圖上看,Gracemont之后還會(huì)有一款“XXXmont”系列核心,Intel正在研究這款新內(nèi)核在2023年時(shí)可能具備的性能、頻率和特性。

上面這些是架構(gòu)的名稱,而實(shí)際產(chǎn)品可能可能會(huì)有另外的代號(hào),也就是酷睿系列近些年來(lái)一直使用的“XXX-Lake”命名,比如代號(hào)為Ice Lake的處理器就是由Sunny Cove架構(gòu)的CPU內(nèi)核與Gen11核心顯卡聯(lián)合構(gòu)成。
活動(dòng)中的另一個(gè)值得關(guān)注的消息是,Intel未來(lái)的架構(gòu)很可能與工藝制程脫離關(guān)系。Raja Koduri和Murthy Renduchintala博士解釋稱,為了讓產(chǎn)品線擁有一定的彈性,未來(lái)這些架構(gòu)的最新產(chǎn)品將以當(dāng)時(shí)可用的最佳工藝制程推向市場(chǎng)。
雖然沒(méi)有明說(shuō),但雷鋒網(wǎng)認(rèn)為這應(yīng)該意味著目前已經(jīng)名存實(shí)亡的“Tick-Tock”策略徹底被掃進(jìn)了歷史的垃圾桶,未來(lái)某些核心設(shè)計(jì)跨越不同制程的情況可能會(huì)成為常態(tài)。
窺探Sunny Cove架構(gòu)
每次聽(tīng)到全新處理器架構(gòu)的消息時(shí),大家最期待的都是對(duì)于新架構(gòu)的詳細(xì)分析,以及相對(duì)前代的變化情況。
自Skylake于2015年首次推出以來(lái),到目前為止Intel已經(jīng)推出了Kaby Lake、Coffee Lake和Coffee Lake三代小改款,由于每代提升都不大,被玩家戲稱為“擠牙膏”。雖然這次Intel展示了全新的Sunny Cove架構(gòu),但遺憾的是其信息還不夠全面,主要集中在架構(gòu)設(shè)計(jì)的后端部分。
Intel將其微體系結(jié)構(gòu)更新分為兩個(gè)不同的部分:通用性能提升和特殊用途性能提升,通用性能提升指原始IPC(每時(shí)鐘指令)吞吐量或頻率增加,IPC的增加可能來(lái)自核心更寬(每個(gè)時(shí)鐘執(zhí)行指令更多)、更深(每個(gè)時(shí)鐘更多并行)或更智能(通過(guò)前端更好的數(shù)據(jù)傳輸),而頻率通常是實(shí)現(xiàn)和過(guò)程的函數(shù),而特殊用途性能提升可以通過(guò)其他加速方法(如專用IP或?qū)S弥噶睿﹣?lái)改進(jìn)特定方案中使用的某些工作負(fù)載。
據(jù)悉,Sunny Cove在通用性能和特殊用途性能兩個(gè)方面有著全方位的提升。在架構(gòu)的后端部分,Intel已經(jīng)做了包括增加高速緩存大小、增加核心執(zhí)行寬度、增加L1存儲(chǔ)帶寬等改進(jìn)。
Sunny Cove架構(gòu)的L1數(shù)據(jù)緩存從32KB升級(jí)為48KB,通常當(dāng)緩存容量增大時(shí),緩存未命中的概率將以平方根的比例降低,因此Sunny Cove架構(gòu)的L1緩存未命中率理論上可減少22%。同時(shí)Sunny Cove架構(gòu)Core和Xeon處理器的L2緩存也將分別比目前的256KB和1MB有所增加,具體容量尚未可知。
此外,微操作(uOp)緩存和二級(jí)TLB雖然不屬于后端,但其容量也都相比目前有所增加,這將有助于機(jī)器地址轉(zhuǎn)換。圖中還可以看到一些其他更改,例如執(zhí)行端口從8增加到10,允許一次從調(diào)度程序中獲得更多指令;重排序緩沖區(qū)的調(diào)度也從每個(gè)周期4條指令增加到5條指令;端口4和端口9鏈接到了一個(gè)循環(huán)數(shù)據(jù)存儲(chǔ),使帶寬加倍,但AGU存儲(chǔ)功能也增加了一倍,這將有助于增加L1-D大小。
Sunny Cove架構(gòu)的執(zhí)行端口也發(fā)生了重大變化,詳情見(jiàn)下圖:

我們看到Intel為核心的整數(shù)部分配備了更多LEA單元,以幫助進(jìn)行內(nèi)存尋址計(jì)算,可能有助于通過(guò)需要頻繁內(nèi)存計(jì)算的安全緩解來(lái)幫助改善性能損失,或者幫助提供具有恒定偏移的高性能陣列代碼。端口1從Skylake端口5獲取MUL(乘法)單元,可能用于重新平衡,但此處還有一個(gè)整數(shù)分頻器單元。這是一個(gè)小小的調(diào)整,Cannon Lake在其設(shè)計(jì)中也有一個(gè)64位IDIV(帶符號(hào)整數(shù)除法)單元,在這種情況下,它將64位整數(shù)除法從97個(gè)時(shí)鐘(混合指令)降低到18個(gè)時(shí)鐘,Sunny Cove可能與之類似。
在整數(shù)運(yùn)算單元方面,端口5的乘法單元已成為“MulHi”單元,在其他架構(gòu)中,它會(huì)在寄存器中留下最重要的半字節(jié)以便進(jìn)一步使用,但目前不能確定它在Sunny Cove核心中的位置究竟是什么。
在浮點(diǎn)運(yùn)算單元方面,Intel增加了洗牌資源,這是出于消除代碼中瓶頸的考慮。Intel沒(méi)有在核心的浮點(diǎn)運(yùn)算部分說(shuō)明FMA(熔加運(yùn)算)的功能,但既然核心內(nèi)有一個(gè)AVX-512單元,這些FMA中就應(yīng)至少有一個(gè)與之交互。Cannon Lake只有一個(gè)512位的FMA,這個(gè)FMA很可能在這里,而Xeon的可擴(kuò)展版本可能會(huì)有兩個(gè)FMA。