找回密碼註冊
作者: sxs112.tw
查看: 3951
回復: 1

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

Micron Crucial T710 SSD 玩家開箱體驗分享

進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

COUGAR ULTIMUS PRO玩家開箱體驗分享活動

ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

COUGAR AIRFACE 180 玩家開箱體驗分享活動

AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

COUGAR GR 750/GR 850 玩家開箱體驗分享活

ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

打印 上一主題 下一主題

[軟體遊戲] Intel針對Arc Pro GPU的Battlematrix專案獲得首次重大軟體更新:LLM Scaler v1.0效能提升高達80%

[複製鏈接]| 回復
跳轉到指定樓層
1#
sxs112.tw 發表於 2025-8-12 10:28:35 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
Intel發布了其Arc Pro Project Battlematrix解決方案的首款主要軟體LLM Scaler v1.0,並進行了大規模改進。

在2025年台北國際電腦展 (Computex) 期間,Intel發布了Battlematrix專案及其Arc Pro GPU。 Battlematrix旨在為運行多個Arc Pro GPU的推理工作站平台提供一站式解決方案。該公司在其路線圖中承諾將在第三季以推理優化容器的形式提供首個容器使用,以及vLLM暫存和基本遙測支援,而如今LLM Scaler v1.0終於問世了。
2025-05-19_0-23-51.jpg

以下是LLM Scaler容器v1.0包含的功能和最佳化的完整清單:

vLLM:
  • 針對長輸入長度(>4K)的TPOP效能最佳化:在32B KPI模型上,40K序列長度的效能提升高達1.8倍;在70B KPI模型上,40K序列長度的效能提升高達4.2倍
  • 與上一次相比,8B-32B KPI模型的效能最佳化使輸出吞吐量提高了約10%
  • 逐層線上量化,減少所需GPU記憶體
  • vLLM中的PP(管線並行)支援(實驗性)
  • torch.compile(實驗性的)
  • 推測解碼(實驗)
  • 支援嵌入、重新排序模型
  • 增強的多模態模型支援
  • 最大長度自動檢測
  • 數據並行支援
  • OneCCL測試工具支援
  • XPU管理器:
  • GPU功率
  • GPU韌體更新
  • GPU診斷
  • GPU記憶體頻寬

據Intel稱新的軟體在打造時充分考慮了易用性和行業標準。新的容器在設計時充分考慮了Linux系統,並進行了最佳化,透過多GPU擴充和PCIe P2P資料傳輸,可將效能提升高達80%。它還具備企業級可靠性和可管理性功能,例如ECC、SRIOV、遙測和遠端韌體更新。
2025-05-19_0-23-54.jpg

根據先前的路線圖,此次更新後,Intel將在同一季發布更強化的容器版本,提供更強大的性能和vLLM服務。最終Intel將在第四季發布有完整的功能集版本。
2025-05-19_0-23-52.jpg


消息來源
2#
clouse 發表於 2025-8-12 23:51:31 | 只看該作者
愛台pass
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2026-1-1 22:30 , Processed in 0.309230 second(s), 32 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表