天天看點

華為最新的麒麟9010有多牛?大核IPC大幅提升,微架構超詳細解析

作者:真義科技

1,性能解析

華為最新的麒麟9010有多牛?大核IPC大幅提升,微架構超詳細解析

這次Pura70系列除了标準版之外,其它三款機型皆搭載了全新的處理器麒麟9010。單看處理器型号的話,結合以往麒麟處理器命名的規則,一般會認為這就是個麒麟9000S的超頻版。

結果處理器的CPU規格一出來,卻顯示大核主頻大幅降低了!至于中核與小核的主頻,則是略微提升了一點點,此外其也具備和麒麟9000S一樣的超線程設計。

GPU部分則依然是麒麟9000S所采用的那款 Maleoon 910,是以這代唯一的變化就是CPU部分。通過CPU性能的跑分可知(下圖所示),大核主頻雖然降低了,但性能卻上升了!

華為最新的麒麟9010有多牛?大核IPC大幅提升,微架構超詳細解析

很明顯這并非麒麟9000S的降頻版,而是CPU核心微架構得到更新的一款全新處理器!GB6跑分中CPU單核性能上升了8.4%,多核性能也同樣是提升了8.4%。

也就是說單看GB6跑分的話,麒麟9010的大核IPC是有23%之提升的,下面再看其大核的整數和浮點跑分之IPC有何變化。

如下圖所示,麒麟9010較麒麟9000S的大核整數性能,在相同功耗情況下有5.8%的優勢,換言之其能效更高些;若再結合兩者主頻的差別,就意味着其整數IPC進步了20%!

華為最新的麒麟9010有多牛?大核IPC大幅提升,微架構超詳細解析

下圖的大核浮點性能部分,麒麟9010較麒麟9000S具有7.25%的優勢,而且功耗表現也很一緻——能效方面提升明顯;結合兩者主頻的差別,其浮點IPC就進步了21.7%。

  • 總結就是,這次麒麟9010的CPU大核IPC性能,較麒麟9000S是有20%以上之大幅提升的。而且因為頻率定得比較低,是以其能效表現較麒麟9000S也有5%以上的提升。

從這也可以看出,在制程工藝受限制的情況下為了改善CPU能效表現,華為想出了微架構大幅更新但卻降低主頻的辦法,最終在相同功耗表現下做到了性能有所提升。

華為最新的麒麟9010有多牛?大核IPC大幅提升,微架構超詳細解析

2,微架構解析

之前麒麟9000S的CPU大核,在IPC性能方面整體是略弱于骁龍888的;而這次麒麟9010的CPU大核,其整數IPC與骁龍8+ Gen1一緻,而在浮點IPC上則實作了超越!

也就是說這次麒麟9010的CPU自研大核微架構,在性能設計方面是比較接近骁龍8+ Gen1之X2超大核微架構的,下面就從微架構方面去探究兩者有什麼相似性。

先從Cortex-X2架構入手,從下圖可知其前端為8發射寬度,亂序視窗的ROB深度為288,後端整型部分擁有4個整數執行單元,流水線管道從X1的11級減少到了10級。

華為最新的麒麟9010有多牛?大核IPC大幅提升,微架構超詳細解析

至于麒麟9010的大核微架構,從已知的資訊來看,其與X2微架構隻有8發射對得上;其它的諸如8解碼寬度、6個整數執行單元,都要大于X2的6解碼寬度和4整數執行單元。

另外在緩存系統方面麒麟9010和骁龍8+ Gen1也很像,兩者在前端L1指令緩存、後端L1資料緩存、L2緩存等方面皆保持一緻,但在L3緩存和SLC緩存等方面麒麟9010還沒有确切數值。

由于L3緩存和SLC緩存影響的主要是大核的能效表現,是以在緩存系統方面兩者算是把變量控制住了;也就是說,在前端和後端都更寬的情況下,麒麟隻有浮點IPC超越了X2。

華為最新的麒麟9010有多牛?大核IPC大幅提升,微架構超詳細解析

之是以會出現這種情況,其根因還是與制程工藝有關。另外,說到這就要将微架構的方向看到果子那邊了,因為華為在新麒麟的微架構設計路線上,與果芯路線不謀而合。

例如麒麟9010大核的8解碼8發射前端寬度,與蘋果A14的前端寬度一緻,同時兩者後端的整數單元數量也一樣為6個。但是,果子那邊緩存系統整體優勢極大,且ROB深度高達630!

最終,A14的大核整數IPC性能,比麒麟9010的大核高出了31%!是以,前端後端的寬度隻是一個前提,若要順利實作更好的指令級并行性,還得學果子将該堆的料全都堆上。

華為最新的麒麟9010有多牛?大核IPC大幅提升,微架構超詳細解析

3,工藝解析

最後,還得回到一切的症結所在:制程工藝受限制情況下,華為的微架構設計能力受到嚴重制約,為了在性能和能效之間保持一個平衡,最終才有了麒麟9010的CPU架構現狀。

例如,假如華為要學果子将緩存系統和ROB深度堆上去,那就要增加大量的半導體,但這樣做又會推高成本、增加功耗、降低良率。而解決方法隻有一個,那就是更新制程工藝。

之前在制程更新方面如下圖所示,從台積電7nm工藝更新到台積電5nm工藝,可以提高約1.84倍的邏輯密度和1.35倍的SRAM密度,同時還能降低30%的同頻功耗,收益極其顯著。

華為最新的麒麟9010有多牛?大核IPC大幅提升,微架構超詳細解析

其中,提升幅度最大的邏輯密度,可以将SoC内各個功能子產品的電路尺寸大幅壓縮,這就意味着在相同面積内可以堆更多半導體,或者在相同半導體數量下大幅壓縮晶片面積。

而SRAM密度則與各級緩存相關,可以在之前同樣面積下塞入更大容量的高速緩存;又由于緩存系統與能效表現息息相關,是以這方面堆到位情況下性能設計的餘裕空間就很大了。

總的來說這兩方面密度大幅提升的結果就是:微架構IPC性能提升的空間極大,因為能夠在晶片面積不變或者變小的情況下塞進更多半導體,其中既有提高性能的也有改善能效的。

華為最新的麒麟9010有多牛?大核IPC大幅提升,微架構超詳細解析

解析到這裡,麒麟9010大核背靠全新微架構,主頻卻還是降低至2.3GHz的原因已基本明了,本質上就是制程工藝限制了微架構的設計空間——性能大幅提升與能效表現不可兼得。

假如能有對應的工藝條件,那麼麒麟9010的大核微架構就可以像基于台積電5nm工藝打造的蘋果A14一樣,添加足夠的半導體去堆緩存和ROB,這樣便能縮小兩者IPC性能的差距。

最後的問題就是,華為和蘋果的CPU微架構路線,怎麼會不謀而合呢?這其實也挺巧的,華為是迫不得已将電腦端的鲲鵬自研核心延伸至麒麟,而蘋果則是從A系列順延至M系列。

華為最新的麒麟9010有多牛?大核IPC大幅提升,微架構超詳細解析

拓展閱讀:

麒麟9000S真的不如麒麟9000嗎?華為的“争氣機”已然給出了答案

蘋果造芯全史|始于1986年,興于2010年,盛于2020年

END

緻力于手機知識的探索和整理