×
×

深度揭秘:"萬物GPU"(The GPU of Everything)

2020-04-27 13:15:46 來源:EETOP

幾個月前,Imagination在其“Inspire年度技術大會”上發布了全新的第十代PowerVR圖形處理架構IMG A系列(IMG A-Series)。作為Imagination有史以來性能最強大的圖形處理器GPU半導體知識產權(IP)產品,IMG A系列GPU具有多維度的可擴展性、低功耗圖形處理和計算性能,是一系列垂直應用領域的理想解決方案,可支持手機、平板電腦、游戲、汽車、機頂盒、8K超高清電視、桌面處理器、服務器等應用,因此Imagination稱其為“萬物GPU”(The GPU of Everything)。

IMG A系列是Imagination有史以來性能最強大的GPU

IMG A系列是GPU技術的一次重大飛躍,在每一個維度上都提供了顯著的改進。相比Imagination的第九代PowerVR GPU,比如聯發科(MediaTek)的Helio P95 SoC所采用的PowerVR GM9446 GPU,在相同的時鐘和半導體工藝上,IMG A系列的圖形處理性能提高了2.5倍,人工智能AI)處理速度提高了8倍,同時功耗降低了60%,這些特性著實讓人印象深刻。

與當前其他可用的GPU IP解決方案相比,IMG A系列具有更佳的PPA(性能、功耗、面積)指標,可提供更高的性能、更低的功耗(與采用相同時鐘和半導體工藝的競品相比)和更低的帶寬(與競爭對手使用相同的緩存大?。?,并且所有產品均占用更小的芯片面積。在所有應用領域中,IMG A系列GPU都能夠在更長的運行時間里以極低的功耗預算提供最佳性能,因此它確實是可應用于一切設備的“萬物GPU”。

IMG A系列在性能、AI處理速度和功耗等方面均實現了顯著改進

IMG A系列的增強性能

相比Imagination現在提供的GPU產品,IMG A系列實現了顯著的性能提升,你可能會好奇他們是如何一步到位做到這一點的,其實這些改進源于各方面的性能增強,下面來具體看看他們通過哪些技術手段實現了這些性能增強。

超寬的ALU單元

帶來顯著性能加速的原因是ALU單元的變化。ALU單元的全稱是算術邏輯單元,它是圖形處理單元的基本部分,可以為圖形處理和計算任務提供強大的計算性能。對于IMG A系列而言,Imagination從雙MAD x32寬度的ALU改為了單MAD 128線程寬度的ALU。通過轉換為128線程寬的單元,IMG A系列能夠在每個時鐘周期內執行更多的操作指令,從而為提升功耗效率奠定了基礎。當然,保證ALU單元有足夠的數據也很關鍵,Imagination通過幾個機制確保了這一點,其結果就是性能顯著提升,功耗明顯降低。

IMG A系列采用了128線程寬的ALU單元

HyperLane(超線程)技術

現代的GPU都需要支持多任務處理,為了能夠高效且安全地實現這一點,Imagination開發了HyperLane技術,并將其用于IMG A系列。從最低性能到最高性能的每款A系列GPU,都擁有8個獨立的硬件控制通道。這些通道在內存中是相互隔離的,意味著可以有8個完全不同的工作負載同時運行。這樣,不同的任務便可以同時交由GPU處理,從而實現了完全安全的GPU多任務處理。這一功能在目前的市場上是獨一無二的。

HyperLane技術還有一個特性稱為動態性能控制,它可以確保GPU將性能合理地分配給多個圖形處理或計算任務,以實現GPU利用率的最大化,從而提升實際性能。例如,你可以在使用信息娛樂系統的同時在GPU上運行儀表盤,而不必擔心至關重要的儀表盤性能受到影響。關于動態性能控制,Imagination在桌面處理器領域也進行了很好的探索,一個物理內核作為多個邏輯內核出現,支持多任務同時處理,從而提升硬件資源利用率和多任務處理性能。

HyperLane技術也可以在安全方面為諸多應用提供支持,例如數字電視、安防監控等。對于數字電視的內容提供商而言,一個關鍵的問題是通過數字版權管理來確保他們的內容IP(無論是視頻還是音頻)安全。雖然有些競爭廠商的GPU提供了“TrustZone(信任區)”特性,但這是一種“把所有雞蛋放進一個籃子里”的做法,即所有應用程序都部署在一個安全內存中。而HyperLane技術的內存隔離功能是將每個服務或應用程序放在完全獨立的安全內存中,因此即使一個應用程序受到黑客攻擊也不會暴露其他應用程序的內容。

每款IMG A系列GPU都擁有8個獨立的硬件控制通道

AI協同功能

IMG A系列GPU還支持一項新功能——AI協同(AI Synergy),該功能可支持SoC設計人員利用IMG A系列令人難以置信的計算能力來加速其AI工作負載。通過AI協同功能,GPU可以在提供圖形處理能力的同時,使用其備用資源支持可編程AI,同時固定功能的AI運算則可以放在專用的神經網絡加速器(例如Imagination的PowerVR 3NX NNA)上執行,從而實現更高的AI性能。AI 協同功能可在最小的芯片面積上支持可編程AI,而統一的軟件棧則可實現靈活性和出色的性能。

AI協同功能使IMG A系列GPU可同時支持圖形處理和可編程AI

配置緩存空間

IMG A系列產品的另一項新特性是緩存大小可以根據自己的需要進行配置,從而支持用戶大幅度降低GPU的帶寬需求。用戶可以減少更多的系統級緩存,以減少使用系統內存的需求,或者使用性價比高的外部RAM來降低功耗、發熱量和系統成本。

“完美像素”特性

“完美像素”特性可以歸結為在不犧牲圖像質量的情況下提供出色性能的一系列技術。Imagination為了實現“完美像素”,在IMG A系列GPU中應用了許多新技術和成熟技術。例如,Imagination獨有的PVRIC4圖像壓縮技術,可以實現無損壓縮或高度優化的有損壓縮,從而確保至少減少50%的帶寬并節省50%的內存占用。IMG A系列中還加入了新的細節等級算法和各向異性濾波算法,這兩種算法都能夠顯著提高圖像質量。

IMG A系列支持各類應用場景

之所以將IMG A系列GPU稱為“萬物GPU”,是因為它可以為各類應用場景提供理想解決方案,包括移動設備、游戲、汽車、數據中心/服務器、數字電視/機頂盒、安防監控、桌面處理器、人工智能物聯網AIoT)等應用。下面列舉了一些IMG A系列可以提供支持的應用案例。

游戲

由于散熱條件限制,大多數移動GPU都很難提供持續一致的游戲體驗,即它們在短時間內可快速運行,然后隨著芯片發熱,性能會下降到不可接受的水平,最后再也無法恢復,從而導致令人失望的用戶體驗。

IMG A系列GPU可以通過提供持續穩定的幀速來消除因芯片過熱導致的時鐘降頻甚至故障等情況,從而為游戲用戶提供最佳的體驗。Imagination通過多種技術來確保實現這一點:基于分塊延遲渲染(TBDR)技術,IMG A系列GPU只需繪制屏幕上可見的內容,這使它具有與生俱來的帶寬和功耗優勢;使用了主動動態電壓與頻率調節(DVFS)及時限調度(Deadline Scheduling)算法的先進功耗控制技術,可提供具有超低響應延遲的快速功耗控制能力;如果GPU的某些部分沒有得到充分利用或沒用于處理工作,它們就會被立即降頻甚至進入睡眠狀態,以確保最佳的功耗效率。

此外,Imagination對“完美像素”的強烈專注也使得IMG A系列GPU可以為游戲用戶提供完美的圖像質量。這體現在很多技術細節上,包括行業領先的視覺無損PVRIC壓縮技術、完全重新設計的各向異性濾波算法,以及其他一些全新設計的算法實現。

IMG A系列GPU可以為游戲用戶提供完美的圖像質量

汽車

在現代化汽車中,數字儀表盤顯示的信息對駕駛員至關重要,因此要求GPU為其提供充分的性能支持。同時,諸如信息娛樂系統、衛星導航等其他功能也需要GPU的支持。所有這些功能可以由單個高性能IMG A系列GPU來驅動。通過將Imagination的硬件虛擬化技術與HyperLane技術結合在一起,可以提供優先級技術和完美的內存隔離機制,從而使IMG A系列GPU在運行上述所有功能的同時,可以確保主要任務的運行效率并滿足用戶對其他功能的體驗需求。這意味著,其他工作負載的運行不會影響儀表盤的使用,同時當其他工作負載出現問題時也可以保護儀表盤的數據不受影響。

數據中心

GPU作為高度并行的計算協處理器,其擁有的能力使其非常適合于加速包括3D圖形在內的多種任務。IMG A系列GPU的設計可以滿足云端的圖形處理和計算需求,其將會推動基于云的AI訓練和推理以及未來云游戲體驗的發展。此外,數據中心對于能效是非常敏感的,而IMG A系列的低功耗設計使其非常適合數據中心對能效的需求,比如HyperLane技術可以最大化GPU的資源利用率,從而可有效地提升能效。

IMG A系列IP內核

IMG A系列GPU從多個維度實現了性能可擴展性,從面向入門級市場的每時鐘周期處理1個像素(1 PPC)的組件,一直到用于高性能設備的速度高達每秒2萬億次浮點運算(2 TFLOPS)的內核,甚至到針對云應用的、速度超越2 TFLOPS的多核解決方案,IMG A系列可以面向各種性能需求提供支持。

Imagination最新發布的IMG A系列GPU涵蓋AXT、AXM、AXE三類產品,共七款內核,其中包括四款高性能內核,一款面向中端設備的內核,以及兩款可為更低成本的細分市場提供最佳PPA指標的內核:

  • IMG AXT-64-2048旗艦版:擁有2 TFLOPS、64 Gpixels的性能,以及8 TOPS的AI性能。
  • IMG AXT-48-1536:面向高端手機,性能為1.5 TFLOPS、48 Gpixels和6 TOPS。
  • IMG AXT-32-1024:面向高性能移動設備和汽車應用,性能為1TFLOPS、32 Gpixels和4TOPS。
  • IMG AXT-16-512:面向中高性能移動設備和汽車應用,性能為0.5 TFLOPS、16 Gpixels和2 TOPS。
  • IMG AXM-8-256:面向中端移動設備,性能為 0.25 TFLOPS、8 Gpixels和1 TOPS。
  • IMG AXE-2-16:面向高端物聯網、入門級數字電視/機頂盒(DTV/STB)、顯示和其他需要高填充率的應用,性能為16 GFLOPS和2 Gpixels。
  • IMG AXE-1-16:面向入門級移動設備和物聯網,為同類產品中速度最快的支持Vulkan功能的GPU,性能為 16 GFLOPS和1 Gpixels。

IMG A系列實現了2.5倍的性能提升

面向未來

目前,Imagination已經將IMG A系列GPU在多個市場中授權給了客戶,首批搭載該IP的SoC器件將在今年供貨。

本文介紹的只是IMG A系列 GPU的一部分功能特性和應用場景,如果你想了解“萬物GPU”的更多信息,歡迎點擊“閱讀原文”訪問Imagination官網頁面。

更重要的是,IMG A系列GPU只是Imagination一個新的起點,他們制定了一個從IMG A系列開始的產品開發路線圖,在未來幾個月至幾年內,他們將帶來更多的產品設計。當然,如果你正在為產品設計尋找GPU IP,那么IMG A系列無疑是你當前最好的選擇。

  1. EETOP 官方微信

  2. 創芯大講堂 在線教育

  3. 創芯老字號 半導體快訊

相關文章

全部評論

  • 最新資訊
  • 最熱資訊
车险商城怎么赚钱 重庆快乐十分开什么 贵州11选5开奖结果全部 pk10注册 福律体彩36选7走势图 中国目前最赚钱行业 十五选五开奖结果 快乐12彩票电视走势图 王中王最快开奖直播 重庆幸运农场有技巧吗 广西快3遗漏查询