找回密碼註冊
作者: sxs112.tw
查看: 2891
回復: 0

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    Micron Crucial T710 SSD 玩家開箱體驗分享

    進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

    COUGAR ULTIMUS PRO玩家開箱體驗分享活動

    ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

    COUGAR AIRFACE 180 玩家開箱體驗分享活動

    AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

    COUGAR GR 750/GR 850 玩家開箱體驗分享活

    ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

    打印 上一主題 下一主題

    [軟體遊戲] NVIDIA的GeForce RTX 5090和RTX PRO 6000 GPU受到虛擬化漏洞的影響,需要完全重新啟動系統才能恢復

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    NVIDIA的旗艦GPU GeForce RTX 5090和RTX PRO 6000似乎遇到了一個新的錯誤,導致虛擬化下無回應。

    CloudRift是一家開發者的GPU雲端服務,該公司率先報告了NVIDIA高階GPU的崩潰問題。據他們稱這些產品在虛擬機器上運行了幾天後,就開始完全失去回應。有趣的是除非重新啟動節點系統,否則無法再存取GPU。據稱該問題僅針對RTX 5090和RTX PRO 6000,RTX 4090、Hopper H100和採用Blackwell的B200等型號目前不受影響。
    image-8.png

    這個問題尤其出現在使用裝置驅動程式VFIO將GPU分配給虛擬機器環境時,如果在功能級重置 (FLR) 之後GPU完全沒有回應。這種無回應會導致核心軟鎖,使主機和客戶端環境陷入死鎖。為了擺脫這種死鎖,必須重新啟動主機,考慮到CloudRift的客戶機數量,這對CloudRift來說是一個困難的過程。

    此問題並非僅限於CloudRift。 Proxmox的一位用戶也報告了類似的問題,他在關閉Windows用戶端後發現主機完全崩潰。有趣的是他表示NVIDIA已對此問題做出回應,聲稱該公司已成功重現該問題並正在努力修復。我們正在等待NVIDIA的官方確認,但問題似乎僅存在於採用Blackwell的GPU上。

    有趣的是CloudRift為那些能夠修復或緩解問題的人提供了1,000美元的漏洞賞金,考慮到該問題正在影響關鍵的AI工作負載,我們預計NVIDIA將很快發布修復。

    消息來源
    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2025-12-13 13:49 , Processed in 0.081361 second(s), 33 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表