找回密碼註冊
作者: sxs112.tw
查看: 4377
回復: 1

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    Micron Crucial T710 SSD 玩家開箱體驗分享

    進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

    COUGAR ULTIMUS PRO玩家開箱體驗分享活動

    ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

    COUGAR AIRFACE 180 玩家開箱體驗分享活動

    AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

    COUGAR GR 750/GR 850 玩家開箱體驗分享活

    ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

    打印 上一主題 下一主題

    [軟體遊戲] AMD確認AI軟體將有3倍效能提升:CUDA之敵

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    sxs112.tw 發表於 2025-8-10 19:33:50 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
    在AI市場上NVIDIA佔據了95%的市佔率,這不僅是他們的AI顯卡硬體性能強大,還得益於CUDA的軟體生態更完善,畢竟16年來積累了400多萬開發者,這是NVIDIA最大的護城河。AMD想在AI市場上搶佔更多市佔率,除了明年推出效能40PFlops的MI400加速卡之外,還要在軟體生態上取得突破,這方面就得靠AMD的ROCm軟體了,而且還是開源開放的生態。
    67b0ef12-ca6d-46f5-ade2-04f3539b.jpg

    今年6月AMD官宣了最新的ROCm 7軟體,專為效能、相容性和靈活性而設計,在推理和訓練方面提供了重大增強,支援許多開箱即用的最新AI模型,並將AMD開放生態系統從雲端擴展到邊緣。在日前的財報會議上CEO蘇姿豐也提到了ROCm 7的許多優點,強調在這一財季中AMD取得了重大進展,提高了ROCm7的性能、易用性並擴大了其採用範圍。

    蘇姿豐表示我們發布了ROCm7,對整個軟體的每一層都進行了重大升級,與上一代相比,推理和訓練效能提升了3倍以上,並增加了對大規模訓練、分散式推理和低精度資料類型的支援。

    為了加強與開發者的合作,AMD推出了ROCm夜間建置版本,並擴大了即時運算基礎設施的存取範圍,包括推出了AMD首個開發者雲端,該雲端提供預先配置的容器,可即時存取AMD GPU。

    在先前的發表會上,AMD也提供了ROCm7的實測結果,在Llama 3.1 70B車型上效能提升3.2倍,Qwen2-72B上效能提升3.4倍,而DeepSeek R1效能提升3.8倍。在訓練任務上,Llama 2 70B、Llama 3.1 8B、Qwen 1.5 7B模型上平均表現提升3倍。

    今年內ROCm7還會持續提升生態支持,加入對Ryzen平台筆記型/工作站的支援,完整支援Linux系統,還會正式加入對Windows系統的支援,可以說之前備受開發者吐槽的問題正在逐步解決。

    消息來源

    2#
    clouse 發表於 2025-8-11 22:48:10 | 只看該作者
    CUDA老舊必需死才會進步
    回復 支持 1 反對 0

    使用道具 舉報

    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2025-12-22 00:39 , Processed in 0.111816 second(s), 32 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表