找回密碼註冊
作者: sxs112.tw
查看: 9541
回復: 0

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    Micron Crucial T710 SSD 玩家開箱體驗分享

    進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

    COUGAR ULTIMUS PRO玩家開箱體驗分享活動

    ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

    COUGAR AIRFACE 180 玩家開箱體驗分享活動

    AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

    COUGAR GR 750/GR 850 玩家開箱體驗分享活

    ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

    打印 上一主題 下一主題

    [顯示卡器] AMD Next Horizo​​n:AMD RDNA全新GPU架構探秘:三管齊下迎接光線追蹤

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    sxs112.tw 發表於 2019-6-11 15:11:21 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
    AMD發布的新一代RX 5700系列顯示卡是採用7nm新製程和Navi新核心,而在底層是全新的RDNA架構,已經走過七年半的GCN架構就此揮手作別。
    Desktop-Screenshot-2019.06.10-17.31.08.37.png

    這些年來很多用戶玩家尤其是AMD Fans一直期待一個全新的GPU架構,但這種事的難度遠超一般人想像,某種程度上設計一個新的GPU架構甚至要比設計一個新的CPU架構還要難。RDNA架構就花費了AMD研發團隊長達四年的時間,凝聚了無數人的心血,也開啟了AMD顯示卡歷史上第五代重大架構的新時代。
    18.jpeg

    2000年前R100核心是A卡的第一代架構,用的還是固定單元設計,3D幾何轉換和光照效果如今看起來都極為原始。

    2001-2007年的R200-R500是第二代架構,簡單的VS紋理著色器、PS畫素著色器分離式設計,不同的只是比例不同,整個渲染匯流排就像一個單通道的單行道。

    2008-2011年的第三代TeraScale架構(代表核心R600)實現了一個飛躍,VS、PS融合為統一著色器,也就是我們常說的串流處理器,支援VLIW(超長指令字),然後就是2011-2019年的GCN架構(代表核心Southern Islands),統一著色器加獨立的標量、矢量單元,二者比例為1:4。

    如今我們迎來了全新的RDNA(Radeon DNA),還是統一著色器,但標量和矢量單元走向融合,支援SIMT(單指令多線程) ILP(指令集並行),類似CPU處理器的SIMD(單指令多數據流),單線程性能和指令集執行效率大大提升。

    需要強調的是RDNA是一個全方位重新設計的架構,並不是GCN的又一個升級版,也不是與GCN的混合體,只是整合了GCN架構的指令以保持向下相容,現有技術仍然可以在RDNA架構上得到支援。

    14.jpeg

    RDNA架構將是AMD GPU顯示卡未來多年的基礎,接下來我們將看到採用7nm+製程的第二代版本RDNA 2,看路線圖有望明年初和我們見面。除了RDNA新架構,Navi核心還有7nm製程、GDDR6顯示記憶體、PCIe 4.0匯流排、Radeon媒體引擎、Radeon顯示引擎等諸多全新特性。

    11.jpeg

    Navi 10核心整合了103億個電晶體管,相比Vega 64 125億個少了大約18%,而核心面積只有251平方mm,相比Vega 64 495mm更是小了足足一半,因此單位面積性能提升了足足1.3倍。儘管電晶體管更少、面積更小,Navi 10核心的性能相比於Vega 64卻提升了14%,同時功耗降低了23%,能效比因此大漲50%。


    13.jpeg

    純架構性能上,Navi相比於Vega在同等功耗、同等配置下提升多達50%,反應到實際產品上,這貢獻了產品性能提升的60%左右,另外有大約25%來自7nm新製程的加持,還有約15%來自頻率以及功耗的改進。

    AMD表示RDNA架構的設計理念主要有四個方面,性能上要滿足在現代遊戲負載需求,能效上要充分優化功耗和頻寬利用率,功能上要壯大生態,擴展性上要從行動到桌上型和雲端通吃。為實現上述目標,RDNA架構主要從三大方面進行了變革,包括CU計算單元、快取、匯流排。

    16.jpeg

    新的計算單元設計一共分為40組,每組2個標量處理器、64個串流處理器、4個64位元雙線性過濾單元,總計80個、2560個、160個,執行延遲更低,單線程性能更強,快取效率更高,整體計算能效比GCN架構有著巨大的提升,而且可對應從遊戲到計算各種負載。多級快取一致性可以帶來更低的延遲、更高的頻寬、更低的功耗,包括各處L0、512KB L1 、4MB L2。整個圖形引擎也做了重新調整,更加順暢高效,包括幾何引擎、64個紋理單元、4個異步計算引擎(ACE),負載分配更加均衡,可以在更低的功耗下達成更高的頻率,能效更高。

    27.jpeg


    17.jpeg


    19.jpeg


    20.jpeg


    21.jpeg


    22.jpeg


    23.jpeg


    24.jpeg


    25.jpeg


    26.jpeg


    28.jpeg


    CU計算單元方面,雖然看起來每一組還是64個串流處理器,數量沒變,但這個數字是AMD反復設計後與處理資源最為平衡的的組合,同時整個計算單元的結構進行了徹底重組,和GCN時代完全不一樣了。RDNA架構下每個CU計算單元的標量解碼和發射單元、矢量解碼和發射單元、調度器的數量都增加了一倍來到兩個,指令處理率因此也提升一倍。

    同時四個SIM16矢量單元、四個SIMD4特殊功能單元變為兩個SIMD32、兩個SIMD8,比如64個線程可組合為兩個Wave32,然後由兩個SIMD32執行兩個Wave32,實現單時脈週期指令發射(之前需要四個),SIMD ALU單元的利用率也從25%來到了100%,而且支援Wave32、Wave64兩種執行模式,以應對不同負載需求。

    此外為了強化資源調度和利用的效率,RDNA架構還將每兩個CU計算單元緊密地捆綁在了一起,組成一個工作組處理器(Work Group Processor),使得可用ALU單元、寄存器數量翻倍,快取頻寬更是之前的四倍。

    29.jpeg


    30.jpeg


    31.jpeg


    32.jpeg


    快取方面RDNA架構設計了一套多級一致性結構,每個雙CU組合內都有自己的L0快取,與ALU單元的載入頻寬翻倍,增加了四組新的L1快取(都是16-way 128KB),降低了L2快取(16-way 4MB)的擁堵,整體延遲和功耗大大減低。按照AMD的說法,L0的延遲降低了21%,L1和l2快取降低24%,記憶體延遲也低了7%。另外在一致性多級快取下,到處都支援Delta數據壓縮 (DCC/圖中箭頭黃色部分),提高傳輸率,同時還改進了色彩壓縮算法,可供顯示引擎讀取,著色器也能同時讀寫壓縮的色彩數據。

    33.jpeg


    34.jpeg

    圖形引擎匯流排方面進行了大刀闊斧的重組,包括四個增強的ACE異步計算引擎,地位更加中心化的結合處理器(包含四個原語單元),64個畫素單元。異步計算一直是A卡的獨門絕技,也是起在DX12、Vulkan API下表現更好的關鍵,如今得到增強後,可以更精準地實時控制其他模組。

    35.jpeg

    有趣的是RDNA GPU架構設計也藉鑑了Zen CPU架構設計的一些先進理念,尤其是在時脈控制方面,效率和能效極高,同時還減少了達到更高頻率所需要的邏輯層級。

    8.jpeg

    Radeon顯示引擎也大幅躍進支援FreeSync 2 HDR、HDMI 2.0/DisplayPort 1.4 HDR,針對高解析度HR顯示器優化,可輸出4K/240Hz、8K/60Hz,而且都只需一根數據線即可達成,同時還優化了VR頭顯顯示。

    9.jpeg

    Radeon多媒體引擎則大大改進了影片編解碼,增加了新的H.265 HDR/WCG編碼器,全面支援H.264 1080p600、4K150、8K30解碼和1080p360、4K90編碼,H.265 1080p360、4K90、8K24解碼和1080p360、4K60編碼,VP9 4K90、8K24解碼,整體編碼速度加快40%。

    12.jpeg

    對於大家非常關注的光線追踪支援,GCN、RDNA架構都沒有專門的硬體單元加速,不過事實上AMD ProRender、Radeon Rays都早就支援了光線追踪,分別針對內容創作渲染和遊戲開發。在下一代RDNA架構上AMD會通過硬體單元,支援特定的光線追踪效果在遊戲中即時渲染,而即便到了更遙遠的未來,AMD也不會將光線追踪全部一股腦扔給硬體來本地處理,否則效率會非常低下,而是將藉助雲端計算,實現全場景的光線追踪,保證畫面效果的同時,不會給本地硬體太大的壓力。

    消息來源

    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2025-12-25 06:53 , Processed in 0.206538 second(s), 34 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表