AMD現在計劃讓機架規模的AI集群更加節能,因為AMD打算在2030年之前將效率提高20倍,從而使運算更具可擴展性。
[新聞稿]:在AMD,能源效率一直是我們產品路線圖和產品策略的核心指導原則。十多年來我們一直公開設定有時限的目標,以大幅提升產品的能效,並且始終如一地達到並超越了這些目標。今天我很自豪地告訴大家,我們再次實現了這個目標,並正在製定下一個五年節能設計願景。
今天在Advancing AI大會上,我們宣布AMD已經超額完成了我們在2021年設定的30x25目標,即在2020年至2025年期間將AI訓練和高效能運算 (HPC) 節點的能源效率提高30倍。這是一個雄心勃勃的目標,我們很自豪能夠超額完成這一目標,但我們不會止步於此。
隨著人工智慧規模的不斷擴大,以及我們邁向真正點到點的全人工智慧系統設計,我們比以往任何時候都更需要繼續保持我們在節能設計領域的領先地位。正因如此我們今天設定了一個大膽的新目標:到2030年,將用於人工智慧訓練和推理的機架級能效提升20倍(以2024年為基準)。
隨著工作負載規模和需求的持續成長,節點級效率提升將無法跟上。最顯著的效率提升可以在系統層級實現,而這正是我們2030年目標的重點。
我們相信從2024年到2030年,我們可以將AI訓練和推理的機架級能源效率提升20倍,AMD估計這將比2018年至2025年的行業改進趨勢高出近3倍。根據我們最新的設計和路線圖預測,這反應了整個機架(包括CPU、GPU、記憶體、網路、儲存和軟硬體協同設計)的每W效能提升。這種從節點到機架的轉變得益於我們快速發展的點到點AI策略,也是以更永續的方式擴展資料中心AI的關鍵。
這在實踐中意味著什麼
機架級效率提升20倍,幾乎是先前業界水準的3倍,意義重大。以2025年典型AI模型的訓練為基準,這些提升可實現
- 將機架從275個以上機架整合到充分利用的機架以下
- 營運用電量減少95%以上
- 模型訓練產生的碳排放量從約3,000噸二氧化碳減少至100噸二氧化碳
我們熱衷於不斷突破極限,不僅在性能方面,更在效率引領下探索無限可能。隨著目標的推進,我們將繼續分享進展,以及這些成果對整個生態系統的影響。
消息來源 |