找回密碼註冊
作者: sxs112.tw
查看: 5998
回復: 0

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    Micron Crucial T710 SSD 玩家開箱體驗分享

    進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

    COUGAR ULTIMUS PRO玩家開箱體驗分享活動

    ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

    COUGAR AIRFACE 180 玩家開箱體驗分享活動

    AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

    COUGAR GR 750/GR 850 玩家開箱體驗分享活

    ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

    打印 上一主題 下一主題

    [軟體遊戲] 提速3.8倍! AMD GPU終於優化Stable Diffusion

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    sxs112.tw 發表於 2025-4-18 15:38:27 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
    NVIDIA AI之強大,不僅在於硬體效能好,更離不開生態優化對應,可以發揮最佳效率,AMD相較之下就差了很多,但也在努力追趕。

    現在Stability AI發表了ONNX框架優化的Stable Diffusion模型,在相容的AMD Radeon顯示卡、銳龍集顯上最多可以提速達3.8倍。AMD表示過去一年來一直在與OSV、OEM、ISV廠商合作,優化AMD硬體上的AI應用,包括硬體設計、驅動程式、編譯器、機器學習模型等等。
    af57cc8247f44309ab21bc50de16b85c.png

    根據官方公佈的數據,經過優化之後,SDXL 1.0、SDXL Turbo在AMD硬體上的推理性能,對比基礎的PyTroch模型最高提升3.8倍,SD3.5則可提升最多2.6倍。
    e96d7f44da9c446390facada13791979.png

    實際圖片、影片產生應用中,SDXL 1.0、SDXL Turbo、SD3.5 Large、SD3.5 Large Turbo在RX 9070 XT顯示卡上的效率分別提升了3.1倍、1.5倍、3.3倍、2.1倍。SDXL 1.0、SD3.5 Large、SD3.5 Large Turbo在銳龍AI MAX+ 395上的效率,則分別提升了1.4倍、3.3倍、3.0倍。

    AMD硬體優化版的Stable Diffusion模型有一個特殊的_amdgpu後綴標記(例如stable-diffusion-3.5-large_amdgpu),現在已經可以在Stability AI或Hugging Face上下載了。你也可以使用AMD、TensorStack AI聯合打造的最新版Amuse 3.0。

    注意AMD GPU驅動版本不要低於24.30.31.05預覽版,或等待即將發布的25.​​4.1正式版。

    消息來源
    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2025-12-8 10:03 , Processed in 0.103320 second(s), 33 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表