找回密碼註冊
作者: sxs112.tw
查看: 4669
回復: 0

文章分享:

+ MORE精選文章:

    + MORE活動推薦:

    Micron Crucial T710 SSD 玩家開箱體驗分享

    進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

    COUGAR ULTIMUS PRO玩家開箱體驗分享活動

    ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

    COUGAR AIRFACE 180 玩家開箱體驗分享活動

    AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

    COUGAR GR 750/GR 850 玩家開箱體驗分享活

    ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

    打印 上一主題 下一主題

    [軟體遊戲] xAI稱Grok 3是世界上最聰明的AI,但專家們仍存在分歧

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    sxs112.tw 發表於 2025-2-19 09:25:48 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
    經過幾天的炒作,xAI於週一在馬斯克親自主持的直播中正式發布了其Grok 3 LLM。儘管這家人工智慧公司繼續吹捧新LLM的功能是同類產品中最好的,但一些專家指出了發布的測試中存在嚴重缺陷。也就是說根據xAI在X上的文章,Grok 3 LLM是世界上最聰明的人工智慧。
    xAI-Grok-3.jpeg

    xAI不遺餘力地指出,Grok 3 LLM在數學、科學和編碼測試中擊敗了所有其他基礎模型的公開發布版本,包括DeepSeek-V3和GPT-4o。此外該LLM在Arena上取得了前所未有的1,402分。

    同時Manifold Markets對Grok 3將成為世界上最強大的人工智慧的押注合約現在預計將以是的答案結束。然而我們注意到贊成派獲勝的機率已從週一深夜的 91%下降到撰寫本文時的78%。我們可以推測圍繞 xAI的Grok 3的批評性評論雖然很少,但很可能在這一發展中發揮了作用。

    例如曾在DeepSeek工作過的Zihan Wang向Grok 3展示了一張圖片,圖片中兩個大小不一的鐵球懸掛在不同高度的比薩斜塔上,然後詢問哪個球會先落地。合理的答案只能是球A,因為它更重並且更靠近地面。然而LLM回答兩球會同時落地。

    更重要的是許多人質疑為什麼xAI沒有發布Grok 3在FrontierMath、Arc-AGI或HLE測試中的分數。當然我們指出這些缺點並不是為了貶低Grok 3,我們確信它是一種非常強大的AI模型,而是為了質疑xAI聲明的真實性。

    在其他新聞中,彭博社最近報導稱xAI正在與現有投資者進行談判,以在新一輪融資中籌集高達100億美元,這將使該新創公司的估值達到750億美元。在上一輪融資中xAI以400億美元的估值籌集了60億美元。

    消息來源
    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2025-12-25 01:32 , Processed in 0.128244 second(s), 33 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表