新RX400 Polaris家族登場 適時引爆Async革命
▼接著由AMD大中華區通路業務經理Mr. Parker Kao來介紹北極星家族的特點.
“Uprising”口號在中文裡代表的意思是”起義”
雖然最新產業數據顯示, 目前全球所有PC裡只有1%跑得動VR, 但估計往後數年內會有指數型的大幅成長. AMD這次的任務就是加速普及, 讓更多的玩家可以早日踏進VR的領域.
起義的另個涵義, 是要打破目前顯卡市場上, 大者恆大一面倒的現象
綜觀對手綠營這幾年的作為, 從上一代970的3.5G內存門事件, 直到這代1070才剛出兩個月, 在中國市場就已傳出個案多到不尋常BOOM的災情, 眾虔誠信徒能夠討回的公道都不算多. 原因是什麼? 基本上可以歸咎於綠營憑著大幅市占率優勢, 大到他根本懶得鳥, 對信徒們的雜音抱著老神在在有恃無恐的輕忽態度.
紅隊相信市場上若能維持幾個給力的良性競爭者, 而非單個800磅大猩猩壟斷一切, 對維護整體消費者權益的出發點來說, 肯定是較為有利的.
▼另個正在進行式的改變就是DX12的到來.
DX11到12的世代過渡算是比之前版本來的久許多, 不過有別於一直到11為止所注重的單純三角圖形處理運算提升, 12在底層架構理念上有了顛覆性變革.
除了在傳統的著色器方面導入了非同步模式, 有別於以往一昧在處理圖形工法上持續不懈地追求超過肉眼所能及的吹毛求疵, 現在更多資源轉向到與主CPU越來越多核心之間的通用運算任務(GPGPU)和輔助分工能力.
而在這點上, 平行(Parallelism)和異步(Asynchronous Computing)兩大運算概念的能力是非常關鍵的. 這也意味著紅隊和綠營在DX12新API世代的效能差距, 本著多年前即已確立的架構設計理念差異性, 即將上演大逆轉, 以後來居上之勢形成黃金交叉.
▼RX480在DX12上, 以原生的Async底層架構達到優於對手的表現, 未來無論在CONSOLE或PC上, 都將佔可觀優勢.
依照遊戲大廠暴雪的預估, DX12的華麗登場即將全面到來; 明年中將會有近40款發行.
而在VR端, 至今年所有VR裝置之中, 有83%使用到AMD的方案. 其中PSVR會佔很大一塊, 因為PS4主機和頭盔加起來的價位相對親民很多, 幾乎只有PC上單個頭盔的一半.
目前兩大家用主機PS4和XBOX One世代預計要賣到2018-19, 但為了更好支援DX12和VR的硬體需求, 此時到了周期中段, 需要補強性能的時機. 現有平台將以半升級的方式以達到延長銷售和市場壽命的目的.
而Neo和Scorpion都將延續A社x64+GCN的整體架構. 這也意味著考量到開發成本和平台移植的輕便性, 目前多半遊戲大廠都把開發奠定在家用主機平台為主, 後期再相對較省力地移轉到同為x64的PC. 正因如此, 跨平台大作的GPU優化在可見的未來也必定會開始顯著地傾向紅隊GCN/Polaris這邊來.
▼RX480核心架構的幾大特色.
- 先進GloFo/Samsung 14奈米 FinFET/3D晶體工藝
- 更好的用電效率 功能提升2X 瓦特數降低50%
- 充分的DX12原生支援 高度優化的LiquidVR中介層
- 造就北極星能在DX12和VR端發揮優異功能的核心技術 就是以”異步運算”為設計基礎的第四代GCN架構
▼在新的螢幕輸出端技術上, 支援數個最新規格.
- DisplayPort 1.3/HDMI 2.0b – 最高4K UHD@60fps/120Hz
- FreeSync 2.0 – 開源免授權金的顯示器同步技術, 大幅減少遊戲中畫面撕裂現象.
- HDR 1.4 – 從最亮和最暗的同一圖像擷取樣本,以取得比以往壓縮SDR更逼真的高度動態範圍畫質.
回顧一下我們之前提到的黃金交叉話題. 綠營近年來甚至到6月出的新品上, 之所以都能夠在大部份已發行舊遊戲的幀數(FPS)表現上保持相對的優勢, 是因為NV在幾代以來的CUDA架構上, 都以衝高工作頻率, 鎖定運算模式之下的三角圖形繪製能力, 和暴力浮點運算做為設計主軸; 而DX11的主打功能Tesselation(曲面細分)又剛好專吃這套.
不過到了DX12主打將會是Async. 在這點上NV架構在計算模式轉換的靈活度反而就相對沒那麼高, 實際所依賴的是一種半軟體實現叫做Warp的模擬方案來達到圖案/通用運算模式的即時切換. 所以在真正意義上來講, 1000系列能展現的其實是一種靠著驅動軟體轉譯/把長長的串行數據(queues)事先嘗試做好排程/折衷且虛擬的半套Async.
而要強調的是當代的GPU除了純三角圖型以外, 還要同時負責其他很多任務, 譬如: 物理行為, 光影反射, 貼圖壓縮, 記憶體取存, 等等等. 尤其到了DX12, 這些通用運算都需要透過實際硬體裡建置的’單指令多數據’並行多線程核心(SIMD) 以及’不同入點/多元模式’的多重管線(Wavefront), 硬體層跟硬體層之間才能更近距離/更直接的溝通, 進而達到更佳的交通指揮, 數據優先化, 以及降低閒置空等延遲, 如此才能真正發揮DX12的最大效能. 而這些正是Polaris/GCN4從多年前企劃階段起就具備的.
英文有句話說: “When the going gets tough, the tough gets going.” 依照Parker的說法, “我們來硬的.”
▼8GB超大量顯存.
別以為只有1440p和4K才吃得到那麼多的VRAM. 古墓奇兵崛起的RAW貼圖量最高就可以有效衝到7.5GB. 或許有人會說更高階還有GDDR5X和HBM, 但經驗法則告訴我們考量到若干年後VRAM的需求, 到時必定是先求量其次才求速.
▼480在當今一些大作, 與1060的對決.
下圖中比較值得一提的是TimeSpy(第一個, 慢-2%), 和奇點灰燼(第三個, 僅快+0.5%)
先前提到了一些市場被壟斷的亂象. 3DMark的新TimeSpy測試剛剛問世, 號稱是針對DX12而來. 但儘管如此, 因為來自某某廠商的壓力, 此一Bench現階段在Async方面上也只有發揮到20%的潛能. 另一款DX12遊戲的鼻祖 ’奇點灰燼‘, 其開發商更是大膽公開爆料, 綠營竟對他們施壓, 要求把遊戲引擎中異步渲染的功能強制關閉, 以遮掩該社架構因先天上的不足, 導致麥斯威爾卡在此遊戲中非同步渲染開啟狀況下的跑分窘境.
▼組雙卡終於效能可以接近1+1=200%
另個例子則是多顯卡. 綠營因為怕玩家買兩張經濟型1060組雙卡, 同類相食殘殺到自家高端的1080, 商業策略考量之下刻意手工閹割掉了1060的SLI金手指.
紅隊在這點上則大氣多了, 歡迎有預算和有需求的玩家們拿兩張480組CF. 不但效能超越1080, 成本更只要單張x80的2/3. 現時還沒打算直接上雙卡的玩家也沒關係, 過段時間可以考慮是否再添. 北極星本著在底層硬體上的高度原生支援, 在往後DX12週期內應能夠保持不錯的續航力. 再者到了第四代GCN, 交火效率已經變得大幅精進. 有效利用PCIE3 BUS大頻寬, 免了有人拿來賣很貴的橋接器. 也排除了過往1+1不等於2的耗損, 實際加乘的效能更逼近完整200%.
▼只要API不被政治黑箱打壓, 順應主流趨勢, 越充分利用Async, 北極星的爆發力就越驚人.
理想世界中, 若能摒除商業策略的脅迫和勾結, 我們確實能夠期待看見一副對消費者更有利的景象. 目前市面上還有新出一款跨平台, 且比DX12更全面利用Async的圖形API, 那就是OpenGL的繼承者Vulkan. 雖然目前使用Vulkan的遊戲只有兩款(DOOM和DOTA2), 但從下圖所示的DOOM效能測試, 我們可以看見Polaris架構在跑Vulkan時, 所釋放出的驚人優勢.
▼RX470是基於與480同款的Polaris 10核心.
時脈和核心配置稍微調鬆了一些, 效能差個10-15%左右. 主要針對純粹FHD 1080P玩家的需求. 顯存跟480一樣, 最高有到8GB, 對於未來幾年內大貼圖例如看門狗2的遊戲, 達到60 FPS+應是綽綽有餘.
▼RX470對決960的單機大作表現, 紅色為470勝出的幅度.
▼北極星家族的小弟RX460, 則是以採用另款較為精簡的Polaris 11核心.
此款強調比對手低許多的耗電量(全機滿載時140W上下), 就可暢快執行市面上主流網路遊戲 如WOW和Overwatch, 並且高畫質設定之下達到90 FPS左右.
▼RX460對決750Ti在主流網路多人連線遊戲上的表現, 同樣紅色為460勝出部分.
▼最後是Q&A時間: 這裡Parker回覆了數個在場玩家們關心的問題, 包括關於於市場上目前供貨吃緊(被礦工搶光?), 和前些日子PCIE用電超抽>75W官方目前致力解決的進度(新驅動已有效改善, 並且目前未接到任何燒主板危機處理通報, 不像1070直接BOOM).
段落總結:
其實在DX12和Vulkan規範制定之前, 它們的前身都正是AMD自家的Mantle. AMD不僅讓微軟和Khronos/OGL公會都整碗無償端去用, 且還在其基礎之上建構了各自完整分叉出去的規格. 就連以獨家封閉著稱的蘋果, 都拿去延伸出了Mac上的Metal. 由此可見, 起義不是空談; 更開放和良性的均衡競爭, 確實會對整個市場生態更好.
|