英特爾酷睿處理器系列可以說是十幾年來最為成功的處理器之一,憑借著出色的架構為英特爾的開疆拓土立下了汗馬功勞。不過畢竟是十幾年前的總體設計,英特爾傳統的酷睿處理器已經不能滿足如今的算力需求,尤其是從去年下半年開始的AI狂潮讓整個行業都被深深地震撼,其中也包括這家藍色巨人。

作為半導體巨頭的英特爾自然是不會放過這一輪的AI浪潮,在CPU發展的十字路口上推出了Meteor Lake處理器,不但徹底改變了CPU的設計思路,同時也將分離式模塊帶入其中,更為重要的是,英特爾這一次內置了NPU AI引擎,讓AI協助處理器,讓計算事半功倍。可以說Meteor Lake處理器的出現讓整個行業煥然一新。我們也提前了解到了Meteor Lake處理器的架構,在這里我們為大家帶來Meteor Lake處理器的解析,看看這顆引領CPU未來方向的先驅有什么特別的黑科技。 分離式模塊與Forveros封裝:讓CPU跟搭積木一樣 對于Meteor Lake來說,最重要的改變就是采用了全新的分離式模塊。過去英特爾在設計CPU的時候,則是按照整體進行設計,包括P核、E核、GPU等,在一個CPU內放置不同的計算單元。而到了Meteor Lake處理器,設計思路則完全變化,由英特爾提供CPU的基底,并在這個基底上放置不同的計算單元,而各自的計算單元實際上相互獨立,通過基底的總線進行數據通信和交換。 
如今的Meteor Lake將會分為四個模塊,包括性能核、能效核、I/O核以及圖形核。其中性能核相信大家都十分地熟悉,英特爾將P核放置其中,從而讓其從事繁瑣復雜的高性能計算任務,這部分跟以往的CPU還是一樣的。 
不過在能效核上,英特爾就做了比較大的改變,除了E核之外,還加入了人工智能的加速引擎也就是NPU,另外包括WiFi連接模塊以及編碼器等媒體處理模塊也放在了這里,英特爾表示你甚至可以讓能效核看作是一款迷你CPU,換句話說就類似于手機中的基帶。 
除此之外考慮到目前核顯性能提速幅度越來越大,英特爾也單獨為圖形處理器設置了一個圖形核,從事圖形的渲染,并且英特爾這一次還額外增加了I/O模塊,專門負責PCIe以及雷電5等高速接口的連接和溝通,英特爾表示這種設計帶來的優勢就是讓配置更加地靈活。 
英特爾官方對CPU這樣的布局也進行了解釋,表示未來的CPU應該朝著更高的性能以及更低的功耗發展,因此英特爾的設計團隊對Meteor Lake進行徹底的更新,包括對計算的密集型IP進行了重新劃分、I/O進行了擴展,引入了低功耗的核心,并且電源管理算法也進行了優化,也就是說原本大鍋飯的局面變成了各立爐灶,相互配合。這種設計能夠極大地增加CPU的能效比,同時借助更加優秀的電源管理讓CPU的運行效率更加高效,最終延長筆記本的續航時間。 
想要實現分離式模塊,除了CPU的總體設計之外,英特爾也將全新的Forveros封裝帶入其中。Foveros封裝技術相比傳統基于基板的連接,它具有更好的疊加性以及更高的密度。它實現了DIE與DIE的連接,從而可以在芯片層級實現低功耗和高密度的芯片連接,畢竟在Meteor Lake上各個計算單元獨立運行,這時候就需要通過新封裝工藝來確保計算單元之間能有一個極低的延遲,并且3D封裝工藝還可以用非常小的Tile去組成一個非常大的處理器芯片,這對于追求更高集成度的移動處理器來說十分地重要。 
正是因為有著全新的封裝工藝以及分離式模塊設計,英特爾Meteor Lake布局更加靈活,甚至未來也可以通過升級某個模塊從而讓新一代處理器盡快地跟大家見面。 Intel 4:EUV加持,晶體管密度更高 如今處理器的功能越來越多,而CPU的芯片面積又不可能無限增加,甚至為了確保功耗還要有所減小,因此更先進的制程工藝毫無疑問成為每家半導體制造商畢生追求的白月光。即使是作為藍色巨人的英特爾也如此。在推出Intel 7制程工藝之后,為了滿足Meteor Lake,英特爾終于帶來了Intel 4,能夠為Meteor Lake提供理想的晶體管密度。 
近年來光刻工藝成為了全球關注的熱點,先進制程離不開卓越的光源,這一次英特爾在Intel 4上終于采用了EUV光源,在更大能量密度的加持下,Intel 4制程工藝在電氣性能上也取得了飛躍的進步。并且英特爾也表示借助EUV,大幅簡化工藝流程,減少總掩模數和工藝總步驟數,同時支持微縮,對于芯片的設計起到了重要的作用。 
想要實現更高的晶體管密度,就需要對晶體管進行不斷地優化,減少晶體管的面積。與目前的Intel 7相比,Intel 4的接觸式柵極間距減少了17%,鰭片間距減少了12%,M0間距減少了25%,高性能庫間距減少了41%,進而讓高性能邏輯庫的面積減少了約2倍,進而帶來更高的晶體管密度。同時在材質上,Intel也拋棄了過去的氮化鉭以及帶鈷線的鉭隔離層,轉而在Intel 4中使用鉭/鈷與增強銅,從而提供健康的電磁可靠性。 

當然上述這些都是晶體管的理論密度,而處理器性能的影響實際上還是取決于其他的因素,不過英特爾也給了具體的性能對比,表示Intel 4將會比Intel 7在能效上有著20%左右的幅度提升。至于其他額外的晶體管,大概率用在了NPU的構建上。 
而且英特爾也帶來了一個好消息,那就是經過優化之后的Intel 4即使是初代也可以達到相當讓人滿意的能效比,而不是跟14nm以及Intel 7一樣,需要2-3代才可以把制程吃透,生產出讓人滿意的終端產品。可以說有了基于EUV加持下的Intel 4工藝制程,英特爾在設計芯片時才能顯得游刃有余。 改良的線程調度器:資源調配更加靈活 英特爾在12代酷睿處理器上由于采用了基于P核以及E核打造的混合架構,為了讓資源得到更加高效地運用,英特爾在CPU中加入了線程調度器,與Win11相配合,來讓12代酷睿處理器充分發揮作用,只不過由于這代是初代混合架構,因此在許多軟件上線程調度并不成熟,鬧出了不少笑話,而到了13代酷睿處理器這種情況才得到了有效的改觀。 
這一次的Meteor Lake處理器由于采用了全新的設計思路,因此對于線程調度的精準性和延遲提出了更高的要求。自然英特爾也對線程調度器進行了特別的優化與改良,以滿足全新設計的處理器架構。 就跟我們之前說過的一樣,Meteor Lake處理器的模塊化設計專門打造了“低功耗島”,這是為了在追求極致性能的前提下去強調能耗,延長電池使用時間。而英特爾也將部分低功耗的E核放到了“低功耗島”上,而且包括像多媒體顯示,AI計算單元,Wi-Fi等模塊也在“低功耗島”上,如果平時從事的是低功耗的任務,那么毫無疑問關閉計算或者圖形芯片便可以極大地增加設備的續航時間。 
英特爾在Meteor Lake處理器中設置了三個不同的計算單元,包括傳統的P核、E核,此外增加的便是面向低功耗的LP-E核,英特爾的硬件線程調度器并不是直接控制軟件的進程,而是介于處理器硬件和Windows操作系統中間的這一層,它提供P核、E核、LP E核的實時硬件能力,然后反饋給操作系統的線程調度器。 
英特爾與微軟首先對三種核心進行分類和打分,并將其分為Class 0-Class 3四個類型,而在實際應用運行中,英特爾會對每一個核心打兩個分數,包括E核分數以及P核的分數,分數最高的就代表著英特爾對操作系統的推薦。如果說你要追求性能,英特爾就會推薦你用P核,如果說OS你在這個線程上追求的是低功耗,系統就會使用E核。 而在Meteor Lake處理器上,英特爾增強了對操作系統的反饋。在其他IP占用功耗的時候,核心的功耗會被動態分配。在Meteor Lake上,英特爾做到更準確的去做內部能耗比的評估和判斷,提供更加精確的表格給到操作系統。此外NPU的加入也讓英特爾的線程調度更加地得心應手。 當然與以往的線程調度器一樣,想要讓Meteor Lake發揮最大的作用就必須使用最新版本的Win11系統,只不過現在英特爾和微軟都沒有表示應該使用哪一個版本的Win11系統,或許23H2版本更加適合。 NPU:打造生態系統更重要 如果說這兩年的科技行業什么最火,無疑就是AI,尤其是以OpenAI為主的GPT模型更是改變了整個行業。對于英特爾來說,AI這個行業的風口顯然是不能失去的。之前我們就提到了,英特爾在采用Intel 4制程工藝后原本應該有很多的晶體管用于計算單元的打造上,而實際并非這樣,那么這些額外的晶體管,更多的用在了NPU的打造上。 
考慮到英特爾在CPU、GPU上擁有極強的研發實力,因此英特爾對終端側AI所秉承的一個方法其實不是一個單一的架構,英特爾推動的是XPU,也就是CPU、GPU以及新增的NPU都可以從事AI的運算,英特爾認為不同的應用場景應該讓不同的AI單元去推理和運算,比如說輕量級的應用只需要CPU就可以完成,而復雜AI則需要高性能的GPU。至于NPU,則主打高效與低功耗場合,當然英特爾主打的是混合AI運算,從而獲得最為高效的AI產出。 
英特爾也舉了現在大紅大紫的Stable Diffusion的例子,以SD推理中的文本解碼器、Unet、VAE三個步驟為例,如果全部放置在CPU上,所花費的時間為43秒。如果全部跑在GPU上,耗時僅14.5秒,功耗是37W,而如果說將部分步驟放置在NPU其他的在CPU,那么耗時為20.7秒,功耗更是只有20W,這對于移動平臺來說還是相當重要的。正因為有了NPU的介入,用戶可以得到近8倍的效率提升。而NPU和GPU 混載可以得到5倍效率的提升。因此合理利用NPU,可以讓AI的效率得到巨大的提升。 
不過AI畢竟是一個專用計算極強的項目,除了硬件給力之外,軟件的配合同樣重要,如果能夠打造屬于自己的AI生態系統,那么顯然AI運算就可以事半功倍。現在英特爾有超過100多家合作伙伴做各種各樣終端側AI的應用,來豐富整個PC用戶使用體驗。而英特爾也已經和微軟合作,共同打造基于office下的AI應用,利用英特爾的NPU可以實現更高效的生產力,當然具體如何就需要產品正式落地后才知道。 圖形引擎:讓核顯也有獨顯實力 過去英特爾的核心一直都為人所詬病,當然其中一個重要的原因就是性能的不給力,尤其是對于游戲玩家來說,即使是1080P也不能很好地滿足。而到了Meteor Lake一代,這種觀念就應該被打破。 

首先是規格,得益于Intel 4等先進的制程工藝,英特爾可以堆放更多的規格。相比上一代顯卡,這一代核顯有更高的主頻,同時電壓更低。此外,英特爾的對于內部模塊也在做架構上的更新,包括緩存的優化與增加。目前英特爾的核顯擁有8個Xe GPU核心128個渲染引擎,與上代相比翻倍同時還增加了8個硬件的光追單元。 此外英特爾也從獨顯上移植了異步拷貝,亂序采樣等功能,以及對于DX12U的優化。 
通過上述種種努力,英特爾稱新一代核顯在性能上可以達到上代的兩倍,而在Blender等渲染軟件上,其成績也同樣可以翻倍,可以說生產力水平大幅提升。而在音視頻解碼上,全新的核顯也支持VP9、AVC、HEVC、AV1等新老格式,最高支持8K@60Hz 10bit HDR的解碼和8K@30Hz 10bit HDR的編碼,基本上可以滿足絕大部分視頻從事者的使用需求。而對外輸出上,支持HDMI 2.1、DP 2.1以及完整的eDP 1.4,包括8K@60Hz的HDR,亦或是4臺4K@60Hz顯示器的輸出。 總結:引領未來Intel設計方向 Meteor Lake的推出,改變了過去處理器的設計思路,從大的處理單元變成了去中心化的小型處理單元,同時借助先進的制程以及封裝工藝讓單元之間的傳輸仍然保持高速度和低延遲,這種設計也讓處理器的布局更加靈活與便捷。 
此外NPU的加入也讓AI真真實實地假如到了日常的運算之中,讓CPU的運算事半功倍,進而降低CPU的整體能耗,從而讓筆記本終端的續航以及發熱達到一個理想的程度。可以說Meteor Lake是近年來改變最大的一代產品,它將引領未來Intel處理器的設計與發展方向。 不過目前英特爾僅僅介紹了Meteor Lake處理器架構的優勢,并沒有公布Meteor Lake與上一代處理器之間的性能對比,具體Meteor Lake落地表現如何,軟件能否能夠完美配合Meteor Lake,還需要時間的考驗。另外全新的架構對于桌面用戶來說又是那么遙不可及,桌面用戶想要品嘗最新的制程架構,還需要再等等。 |