不得不說,手機產業從幾年前的電子奢侈品已經完全轉變為電子消費品。而曾經的黑箱交易也變得越來越透明。透明不僅僅局限于手機硬件利潤的下降,更體現在時下市場的理性。記得幾年前屏大、高主頻CPU就是高價手機的代名詞,而隨著消費者越來越理性,手機產業鏈的各個硬件產業也紛紛走上正軌。例如屏幕向著窄邊框發展、電池向著高能量密度/快速充電方向發展、拍照朝著高低光靈敏度發展等等.而作為智能手機硬件最重要的一環,CPU未來的發展方向是什么?對于這個問題大家眾說紛紜。
但必須要說的是,之前拼最高主頻、最高性能那條老路在16年已經行不通了。從高通、三星、海思等最新產品上我們也可以看出在未來的一段時間內主流CPU廠商已經朝著比拼單位性能方向發展。舉個簡單的例子:如何提升單位主頻下的運算性能、如何能在超低功耗下提升性能是體現各大廠商研發實力的關鍵。今天我們就來總結下各大廠商為了能夠提升單位性能在哪些方面做出了努力。
全面升級架構
提升CPU性能的最主要的方法就是更新架構。近年來ARM高性能架構從Cortex-A8/A9到Cortex-A15/A17,再到去年紅極一時的Cortex-A57,而今年包括高通、海思都升級至Cortex-A72架構。對于性能方面,ARM官方宣稱A72架構核心性能達到A15架構的3.5倍(數據基于16nm FinFET工藝A72對28nm傳統工藝A15),之前A57相比A15架構性能提升1.9倍(數據基于20nm傳統工藝A57對28nm傳統工藝A15),所以大致可以看出同頻率同工藝的A72核心性能相比A57架構性能應該有大致25%到35%左右的提升。
A72架構除了CPU性能提升、功耗下降之外,還有兩大其他特性。其中就有Corelink CCI-500的加入。Corelink CCI-500最大的變化就是增加了一個“探聽過濾器”(Snoop Filter),從而使探聽控制不再局限于單個簇內部的CPU之間,可以擴展到整個處理器的所有核心。之前這一特性僅在高通驍龍805及其后續旗艦SoC芯片中有所體現(高通不采用ARM公版的CCI,而采用自主研發CCI)。總體而言,CCI-500的加入能夠提升30%的內存性能,讓很多需要大內存吞吐的場景例如4K視頻等場景體驗更好,也能夠進一步解放多核心性能。由此我們也可以看出A72是現有高性能架構中單位主頻性能最強的架構,這一點毋庸置疑。同時相比于A57來說,單位主頻下功耗也有大幅度下降,這不僅得益于A72架構的分支預測運算能力提升,更重要的是FinFET工藝的加入。
采用全新工藝制程
如果說15年三星Exynos7420系列是FinFET工藝嶄露頭角的話,那么16年就是FinFET工藝大放異彩挑大梁的一年。FinFET工藝誕生于上世紀90年代,當時美國政府認為有必要進行25nm以下工藝制程的研究。因當進入25nm以下會出現傳統工藝柵欄無法有效控制漏電率的問題,此時美籍華人胡正明提出了FinFET技術和FD-SOI技術來解決漏電率的問題。其中FinFET工藝則是通過改造刪欄形態來控制漏電。其實芯片的總功耗P=Pswitch(電路聯通時功耗)+Pshort(刪開關的功耗)+Pleak(漏電功耗)。
之所以高通驍龍810會出現運行過程中降頻甚至關閉核心的問題,很大程度上就是因為漏電功耗居高不下,導致整體功耗過高。甚至整機功耗超過4W也是時有發生的事。所以有很多人認為驍龍810降頻是為了降溫,其實根本的問題是20nm傳統工藝無法已經無法控制A57架構漏電所帶來的超高功耗。所以在新一代的SOC芯片中,高通也采用了FinFET工藝。想要了解更多關于FinFET的故事,大家可以點擊上方麒麟團隊為胡正明教授拍攝的宣傳片。(PS.胡正明教授也在很長一段時間內任職臺積電CTO)。總體而言,ARM官方宣稱基于16nm FinFET工藝的A72核心相比28nm A15下降75%,相比20nm A57也有50%的下降。并且采用big.liTTLE大小核架構會更加省電。這一切的功勞很大程度上都得益于FinFET工藝的成熟。
協處理器性能迅速提升
超低功耗下性能提升也是目前各大CPU廠商重點攻堅的對象。其實手機CPU和PC處理器相同,從誕生之日起就對于不同使用場景進行針對性的調節。例如以全球首款1GHz主頻商用智能手機CPU——高通MSM8250為例。雖然其最高主頻為1GHz,但也針對不同使用場景進行了最低192MHz的設定。但手機處理器由于其工作原理的限制,不能做到類似“無級變速”的最小單位為1MHz的動態調節,所以在使用過程中會出現使用最低主頻運行仍然性能過剩的情況。為了解決這一問題,協處理孕育而生。而ARM在去年發布了最新的針對物聯網、智能家居的嵌入式架構Cortex-M7則是目前最炙手可熱的協處理器架構。
相比于Cortex-M3架構,最新的Cortex-M7性能提升4倍。在40nm LP工藝與400MHz主頻下,Cortex-M7處理器能夠達到2000 Coremarks的性能,基本比肩了Cortex-A架構的性能。具備FPU和Cache,最重要的一點能夠將待機功耗從之前的90mA下降至6.5mA。舉個簡單的例子,一塊1080P屏幕最低亮度待機時功耗基本在90mA左右。而6.5mA的待機功耗可供3500mAh電池運行500小時。同時高性能的Cortex-M7也充當了Sensor Hub的功能,能夠實時的處理各個傳感器的信息,再舉個例子:6.5mA功耗能將你一天的路線圖在不知不覺當中記錄下來,能夠監測你步行的速度等等,為智能健康提供了更多更精準的數據。
自主架構的研發
自研架構相比于公版ARM授權架構(例如我們常說的Cortex-A53/A57等)有個不形象卻通俗易懂的比喻——“站在巨人的肩膀上”。大體來說就是Qualcomm獲得ARM公版授權后在已經較為成熟的公版設計上在做修改,例如公版設計上三行代碼解決一個問題,Qualcomm精簡為一行, 當然更重要的是加入一些全新的特性例如更新的內存控制機制等等,最終得到一個更高效率的自研架構。這也是Qualcomm一直以來有別于其他家廠商的差異化競爭力之一。Qualcomm之所以能夠霸占旗艦手機市場大部分份額多年,其自研架構的戰略也起了很重要的作用。
以采用自主架構的驍龍820為例子,此次采用Kryo架構的驍龍820采用四核心設計,時鐘頻率達到2.2GHz,但有一點值得我們注意,相比于APQ8064、驍龍800、驍龍801不同,此次驍龍820采用了2*2.2GHz+2*1.5GHz的不同時鐘頻率的四顆核心設計。同時,之前驍龍800采用了4aSMP,也就是四個異步對稱式核心,每科核心均能夠單獨控制,每顆核心的頻率也不存在差異。而此次驍龍820采用兩簇核心管控2aSMP,也就是2+2的異步對稱式核心,換句話說2顆1.5GHz核心是同步同頻的,而兩顆2.2GHz也是同步同頻的,但在這兩簇核心組之間采用了異步對稱式的設計。講到這里大家可能認為驍龍820也采用了類似big.liTTLE的設計,但通過Qualcomm官方的講解其實并不是這樣,兩簇核心組僅是時鐘頻率上有所差異,但仍采用相同的Kryo架構。關于自研架構我們上面已經簡單的解釋一下Kryo架構,順便提一句多渠道信息表明,包括三星、LG在內的多家廠商也開始走自研芯片的道路。