得 VRAM 得天下有 TOKEN 能獲利!你能說這世界還不瘋狂嗎?隨著有用 AI 陸續改變各行各業,小至搜詢問 AI、生成創意用 AI、大至企業打造 AI 工廠,這需要源源不絕的 TOKEN 輸出,意味著需要更多 VRAM 貢獻效能。NVIDIA 為開發者、工程師與設計師帶來更高 72GB VRAM 容量的 NVIDIA RTX PRO™ 5000 72GB Blackwell 工作站 GPU,讓專業用戶可依據需求與規模來選擇適合的 GPU 產品。
NVIDIA Blackwell 架構:NVIDIA RTX PRO 5000 72GB Blackwell 工作站 GPU
NVIDIA RTX PRO™ 系列專業工作站 GPU,針對不同工作站、伺服器推出多款不同尺寸、散熱形式、功耗與記憶體容量的工作站 GPU。本次開箱的 NVIDIA RTX PRO 5000 Blackwell 工作站 GPU,起初只有提供 48GB GDDR7 記憶體的規格,而在後續因應各種不同需求因此追加 72GB 容量的規格。
AI 如今不斷進化,從生成式 AI 演進為更複雜的多模態代理型 AI,對於開發與部署新一代技術的硬體門檻也跟著提高,尤其在執行尖端的 AI 工作流程時,特別是涉及大型語言模型(LLM)與 AI 代理的情境,會對 GPU 記憶體造成顯著壓力。
![]()
↑ NVIDIA RTX PRO 5000 72GB Blackwell 外包裝。
![]()
↑ 由合作夥伴麗臺販售,由購買發票日起三年保固,註冊 QR-Code。
NVIDIA RTX PRO 5000 72GB Blackwell 工作站 GPU,採用 NVIDIA Blackwell 架構核心,擁有 14080 個全新串流多處理器核心、440 個第五代 Tensor 核心與 110 個第四代 RT 核心。新一代 Tensor 核心加速了神經網路訓練與推論所需的深度學習矩陣運算,並新增 FP4 精度同時支援 TF32、BF16、FP16、FP8 及 FP6 等數據類型,可提供高達 2,142 TOPS 的 AI 推論效能。
另一方面 RTX PRO 5000 72GB Blackwell 工作站 GPU,搭配 72GB GDDR7 ECC 記憶體容量;針對影音編碼處理,也具備 3 組第九代 NVENC 編碼器 3 組第六代 NVDEC 解碼器,可原生支援 4:2:2 編碼,加速主流影音數位內容創作工作流。
![]()
↑ 內部包裝。
RTX PRO 5000 72GB Blackwell 工作站 GPU 採用標準的高 4.4” x 長 10.5”、佔用 2-Slot 雙插槽的設計,並符合工作站、伺服器的散熱氣流,以主動鼓風扇吸入空氣的前進後出散熱。簡約的造型設計與金屬機身,再加上 Blackwell 系列的格柵金色紋路的點綴。
![]()
↑ 符合工作站、伺服器設計的 RTX PRO 5000 72GB Blackwell 工作站 GPU。
![]()
↑ RTX PRO 5000 72GB Blackwell 工作站 GPU 背面的簡約造型。
![]()
↑ 在 GPU 前方有著 12V-2x6 供電接頭,GPU TBP 300W。
而在顯卡側面有著 RTX PRO 5000 金色字樣,以及 RTX PRO Sync 介面,能夠驅動數位顯示看板、大規模沉浸式顯示系統,或者是互動式 3D 圖形等專業影像工作。RTX PRO 5000 72GB Blackwell 採用 PCIe 5.0 x16 介面連接。
![]()
↑ RTX PRO 5000 金色字樣。
![]()
↑ RTX PRO Sync 介面。
![]()
↑ PCIe 5.0 x16 金手指。
顯示輸出則提供 4 個 DisplayPort 2.1b,可支援 4 個 4K@120Hz 或 5K@60Hz 解析度,也能支援 2 個 8K@60Hz 輸出。同時具備 3 組 NVENC (ninth gen) 與 3 組 NVDEC (sixth gen) 影音編解碼器與 MIG 功能。
![]()
↑ 顯示輸出。
![]()
↑ GPU 配件。
![]()
↑ 提供 12V-2x6 轉 2 個 PCIe 8pin 供電。
RTX PRO 5000 72GB Blackwell 工作站 GPU - LLM 推論效能
測試系統使用 RTX PRO 5000 72GB Blackwell 工作站 GPU,以及 AMD Ryzen 7 9850X3D 處理器、2x16GB DDR5-6000 記憶體。GPU-Z 檢視 NVIDIA RTX PRO 5000 Blackwell 工作站 GPU 資訊,採用 5nm 製程、NVIDIA Blackwell 架構 GB202 核心,使用 PCIe 5.0 x16 介面,有著 14080 個 CUDA 核心、73728 MB GDDR7 記憶體支援 ECC 功能,GPU 預設時脈 1740 MHz、Boost 時脈 2377 MHz,預設 BIOS 最高 350W 功耗限制。
![]()
↑ GPU-Z 資訊。
有趣的是 RTX PRO 5000 72GB Blackwell 可輕鬆執行,nemotron3:33b 與 qwen3.6:35b 的語言模型,但若想挑戰 gpt-oss:120b 或者是 nemotron-3-super:120b 模型時,就會剛剛好觸及 VRAM 上限。由此可見,NVIDIA 替 RTX PRO 5000 升級至 72GB VRAM 容量時,已針對主流的模型參數量劃分 VRAM 分水嶺,想要跑更大模型則需要 NVIDIA RTX PRO™ 6000 Blackwell Workstation Edition 才能辦到。
當然 RTX PRO 5000 72GB Blackwell,在運行 nemotron3:33b 或 qwen3.6:35b 時還有足夠的 VRAM,可以容納代理 AI、生成式 AI 等多模型的應用。實際測試,運行 nemotron3:33b 約佔用 28GB 記憶體容量,測試使用 Prompt:說明 AI 如何改變世界。通過 RTX PRO 5000 72GB Blackwell 工作站 GPU 推論,最終模型通過推理後最終給出答案,僅花費 6.9 秒完成推論與輸出,推論效能約每秒 255.54 tokens。
![]()
↑ 執行 nemotron3:33b 模型,RTX PRO 5000 72GB Blackwell GPU 輸出效能。
RTX PRO 5000 72GB Blackwell 工作站 GPU – ComfyUI 生成效能測試
ComfyUI 強大的開源、節點式 AI 生成工具,通過 RTX PRO 5000 72GB Blackwell GPU 加速,在運行 LTX-2.3 影像生成影片功能,僅需 33-34 秒即可完成輸出,而這模型運行時約需要佔用 36GB 左右的 VRAM 容量。
![]()
↑ 執行 LTX-2.3 影像生成影片功能。
影像生成使用 Flux.2 Dev 模型,輸入參考圖片與說明主體後,通過 RTX PRO 5000 72GB Blackwell 工作站 GPU 推論,視訊記憶體佔用約 69GB 左右,生成一張圖片約需要 47s 秒左右的時間。
![]()
↑ ComfyUI 執行 Flux.2 Dev 模型。
代理 AI 方面可快速的利用 NVIDIA NemoClaw™ 在 Windows 環境中利用 WSL 與 Docker 容器,快速部署更安全的 OpenClaw 與 Hermes 代理。而 AI 代理可提供相當多的工具與功能,因此也需要更多的 VRAM 容納這些 AI 模型。
![]()
↑ NVIDIA NemoClaw Hermes。
RTX PRO 5000 72GB Blackwell 工作站 GPU - 生成式 AI 測試
UL Procyon AI Image GenerationBenchmark 採用 Stable Diffusion XL (FP16) 與 Stable Diffusion 1.5 (FP16) 兩種模型,並支援 ONNX runtime with DirectML、NVIDIA TensorRT™ 與 Intel OpenVINO 的推論引擎,可用來測試裝置的 AI 文生圖效能。
RTX PRO 5000 72GB Blackwell 工作站 GPU 採用 TensorRT 推論引擎,在 Stable Diffusion 1.5 標準模型,獲得 5338 分成績總花費 18.7 秒完成 16 張照片生成、生成一張照片僅 1.17 秒。換成 Stable Diffusion 1.5 XL 模型,獲得 4276 分成績總花費來到 140.2 秒、生成一張照片 8.7 秒。
![]()
↑ UL Procyon AI Image Generation,Stable Diffusion (FP16)。
![]()
↑ UL Procyon AI Image Generation,Stable Diffusion XL (FP16)。
UL Procyon AI Text Generation Benchmark 採用 Phi-3.5-mini、Llama-3.1-8B、Mistral-7B 與 Llama-2-13B 等 4 個 LLM 模型、ONNX 引擎測試,每個模型測試 7 個 Prompts 包含 RAG 與非 RAG 的查詢,通過權重後的總分與平均 Time To First Token(TTFT)、平均 Output Token Speed(OTS)提供專業用戶橫量電腦的 AI LLM 推論效能。
RTX PRO 5000 72GB Blackwell 工作站 GPU 採用 ONNX DirectML 推論引擎,在 PHI 3.5 模型達到 5719 分、TTFT 0.19s、OTS 245.8 tokens/s;MISTRAL 7B 模型 6017 分、TTFT 0.25s、OTS 196.6 tokens/s;LLAMA 3.1 獲得 5095 分、TTFT 0.26s、OTS 167 tokens/s;LLAMA 2 獲得 5992 分、TTFT 0.36s、OTS 95.7 tokens/s。
![]()
↑ UL Procyon AI Text Generation Benchmark。
RTX PRO 5000 72GB Blackwell 工作站 GPU–創作影音輸出、GPU 渲染測試
PugetBench for DaVinci Resolve 測試,分別針對影片的編碼輸出效能、處理不同片源的效能、Fusion 運用 VFX 繪圖效果測試,以及利用 GPU 加速的 OpenFX 特效等測試。測試影像包含 4K、8K 的影像,以及各種常見的媒體格式,4K H.264 150mbps 8-bit、4K ProRes 422、4K RED、8K H.265 100mbps、8K RED 等媒體。
RTX PRO 5000 72GB Blackwell 工作站 GPU 獲得基本 154992、標準 136435 分、延伸 101423 分的總成績。
![]()
↑ PugetBench for DaVinci Resolve。
SPECviewperf 15 基準測試,則是更符合現代的專業應用程式圖形效能的工具,保有 OpenGL、DirectX 與 Vulkan 等 API 支援,新加入 blender、unreal_engine、Enscape 等應用測試,以及更新既有的應用測試情境。
RTX PRO 5000 72GB Blackwell 工作站 GPU 在 4K 解析度,有著相當出色的效能表現,在各種專業應用中都能順暢運行。
![]()
↑ SPECviewperf 15。
KeyShot 是由 Luxion 所開發的 3D 渲染軟體,能夠快速的建立逼真的 3D 模型影像,並以直覺的介面與即時渲染而出名。KeyShot 預設使用 CPU 進行渲染並支援 GPU 加速渲染等功能,在 KeyShot Viewer 當中提供 Benchmark 功能。KeyShot Benchmark 基準分為 1,測試分數越高代表性能越好。
KeyShot CPU 測試獲得 3.2 分,而 RTX PRO 5000 72GB Blackwell 工作站 GPU 獲得 166.29 分的成績,大幅加速影像渲染的速度。
![]()
↑ KeyShot。
V-Ray Benchmark 是由 Chaos Group 所開發,V-Ray 是基於物理法則所設計的光線渲染軟體,而此工具可針對 CPU 進行光線追蹤的渲染圖像的運算效能測試,CPU 評分以 vsamples 每秒計算數為單位。
RTX PRO 5000 72GB Blackwell 工作站 GPU 在 V-Ray RTX 測試中,在 1 分鐘的時間能有著 12377 vpaths 的光線運算量。
![]()
↑ V-Ray Benchmark。
3DMark Speed Way 測試,採用新一代 DirectX 12 Ultimate API 所開發,包含著 DirectX Raytracing tier 1.1 的即時光追全域照明、光線追蹤反射、Mesh Shader 等新一代繪圖技術。測試以 2K 解析度、無使用 SR 或 FG 加速技術,純粹展現 GPU 在光線追蹤渲染下的效能。
RTX PRO 5000 72GB Blackwell 工作站 GPU,可達到 9420 分的成績,也就是平均 94.2 FPS 的影像順暢度。
![]()
↑ 3DMark Speed Way。
3DMark DLSS 4 功能測試,採用光線追蹤的 Port Royal 場景測試,分別比較 DLSS 4 開啟前後的效能差距。新版本支援 DLSS 4 SR 超解析度,以及 DLSS 4 多畫格生成功能,最高支援 FG 4x 的畫格生成。
RTX PRO 5000 72GB Blackwell 工作站 GPU,未開啟 DLSS 時原生渲染 43.7 FPS,開啟 DLSS 4 加速後可達到 311.5 FPS 的效能提升,約達到 7.1x 倍的效能升級。
![]()
↑ 3DMark DLSS 4 功能測試。
RTX PRO 5000 72GB Blackwell 工作站 GPU 功耗與溫度測量
溫度測試,則使用 3DMark Speed Way Stress test(GPU)壓力測試,以及 V-Ray GPU RTX 10min 與 ComfyUI Flux.2 Dev 影像生成測試,並利用 HWINFO 軟體紀錄 GPU 溫度與 TBP 功耗。
RTX PRO 5000 72GB Blackwell 工作站 GPU,待機時溫度僅 34.4°C,通過 Speed Way 壓力測試時 GPU 溫度 83.8°C / 記憶體 92°C、V-Ray GPU RTX 測試溫度 82.9°C / 記憶體 92°C、ComfyUI Flux.2 Dev 測試溫度 84.7°C / 記憶體 86°C。
功耗方面 RTX PRO 5000 72GB Blackwell 工作站 GPU,在三項測試中穩穩的維持在 300W 的功耗表現。讓工作站與伺服器,可藉由多卡方式擴充 VRAM 容量與推論效能的同時,又不需替換更高瓦數的電源供應器。
![]()
↑ RTX PRO 5000 72GB Blackwell 工作站 GPU 溫度測試。
![]()
↑ RTX PRO 5000 72GB Blackwell 工作站 GPU 功耗測試。
總結
NVIDIA RTX PRO 5000 72GB Blackwell 工作站 GPU,藉由升級 72GB VRAM 容量,提供高達 2,142 TOPS 的 AI 推論效能。並為工作站與伺服器所打造的標準長、2-Slot 厚度與鼓風扇散熱器,能夠為用戶帶來可觀的記憶體容量提升,以及僅 300W 的功耗讓多 GPU 擴充更有彈性。
![]()
為代理型 AI、大型語言模型(LLM)與生成式 AI 注入所需的效能,並緩解多模型對記憶體的需求量;同時在創意工作流中 Chaos V-Ray、Blender 等渲染引擎有著更出色的效能,並具備 3 組第九代 NVENC 編碼器 3 組第六代 NVDEC 解碼器,支援 4:2:2 H.264 與 HEVC 編解碼,可大幅提升數位內容創作工作流的即時效能。
最後,NVIDIA 的專業繪圖卡產品,由捷元代理的麗臺科技NVIDIA專業繪圖卡產品提供完善的售後服務,不僅享有 3 年到府收送的保固服務,以及免付費的客服專線「0800-600-206」,提供各領域的專業用戶最安心、穩定的創作、運算體驗。
關於捷元
捷元股份有限公司成立於 1988 年,是台灣領先的資訊與通信技術通路商,代理超過 60 個國內外知名品牌。作為亞太第一半導體零組件通路商-大聯大集團旗下鑫聯大投控(3709)成員,捷元37年來在全台深耕,佈建了完善的營運網絡,包括三大發貨、服務運籌中心、七個營業據點及超過 10,000 家以上服務經銷夥伴。
捷元致力於成為高價值平台服務公司為目標,創造多元服務商機,在多年通路經營的深厚底蘊下,提供即時、多樣及專業技術支援及多元化解決方案,搭配快速物流與顧客導向的服務,透過捷元B2B 採購平台與經銷夥伴緊密連結,建構多元化行銷平台及完整銷售生態圈,協助合作夥伴提升競爭力,同時推動永續經營發展。
歡迎您於此連結留下相關聯絡資訊:https://forms.gle/b8xgTTnUNLkzvunRA
更多關於NVIDIA 將由專屬代理商-捷元與您介紹與聯繫,亦可搶先收到最新產品與優惠訊息。 |