據報導DeepSeek的人工智慧模型在華為最新的Ascend 910C晶片上運行推理工作負載,展示了中國人工智慧產業在過去幾個月的發展。
中國人工智慧公司DeepSeek在過去幾天裡無疑已經擾亂了全球人工智慧市場,他們最近宣布的R1 LLM模型成功地從美國股市蒸發了2兆美元,因為它在投資者中引起了恐慌。雖然有關DeepSeek用於訓練R1模型的計算能力的說法頗有爭議,但華為似乎在其中發揮了重要作用,根據@dorialexander的說法DeepSeek R1正在Ascend 910C晶片上運行推理。
據稱華為的Ascend 910C AI晶片是NVIDIA Hopper H100 AI加速器的直接競爭對手,雖然目前還不清楚華為晶片的具體細節,但據稱該公司計劃在第一季開始量產。中國主流人工智慧公司對此感興趣。華為的AI晶片在中國被認為是NVIDIA硬體的頂級替代品,並且已經佔據了巨大的市佔率,因此看起來它們會變得更受歡迎。
目前DeepSeek的R1 AI模型所使用的運算資源並不具體,媒體對此有許多誤解。首先500萬美元這個數字並不是總訓練成本,而是運行最終模型的費用,其次據稱 DeepSeek可以訪問超過50,000個NVIDIA的H100,這意味著該公司確實需要與其他對應的人工智慧模型類似的資源。
利用華為的晶片進行推理仍然很有趣,因為它們不僅可以為中國公司提供充足的數量,而且與NVIDIA的精簡版版本甚至透過非法來源獲得的加速器相比,定價相當不錯。據稱華為正在開發下一代Ascend AI晶片,據稱該晶片將與NVIDIA的Blackwell AI產品相媲美,無疑將加劇全球競爭。
消息來源 |