找回密碼註冊
作者: Kimi
查看: 4022
回復: 0

文章分享:

+ MORE精選文章:

    相關帖子

    + MORE活動推薦:

    Micron Crucial T710 SSD 玩家開箱體驗分享

    進入疾速前進! 快速邁向終局勝利 使用 Crucial® T710 Gen5 NVMe® ...

    COUGAR ULTIMUS PRO玩家開箱體驗分享活動

    ULTIMUS PRO 終極功能,無限連接 Ultimus Pro 採用簡潔的 98% 鍵盤佈 ...

    COUGAR AIRFACE 180 玩家開箱體驗分享活動

    AIRFACE 180 180mm 風扇,威力加倍 Airface 180 預裝兩顆 180mm PWM ...

    COUGAR GR 750/GR 850 玩家開箱體驗分享活

    ATX 3.1 兼容,穩定供電無憂 COUGAR GR 系列通過 80 PLUS 金牌認證 ...

    打印 上一主題 下一主題

    [業界新聞] OpenAI推出gpt-oss-20b,首款可運行於Snapdragon裝置上的開源推理模型

    [複製鏈接]| 回復
    跳轉到指定樓層
    1#
    Kimi 發表於 2025-8-13 17:28:17 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式


    openai-model-on-device-snapdragon.png


    在 Qualcomm Technologies,我們一直相信人工智慧助理將無所不在、個人化且安裝在裝置上。

    今天,我們很高興地與大家分享這一歷程中的一個重要里程碑:OpenAI 開源了其首個推理模型 GPT-OSS-20B,這是一個思維鏈推理模型,可直接在搭載旗艦 Snapdragon 處理器的設備上運行。 OpenAI 的複雜模型先前一直局限於雲端,而今天,OpenAI 首次將其模型開放用於設備端推理。

    透過對模型的早期訪問以及與我們的 Qualcomm AI Engine 和 Qualcomm AI Stack 的整合測試,我們已經看到這個 20B 參數模型是一個令人難以置信的令人印象深刻的模型,它能夠完全在設備上實現思維鏈推理。

    我們將此視為一個轉折點:讓我們一窺人工智慧的未來,即使是功能豐富的助手式推理也將在本地實現。
    這也體現了人工智慧生態系統的成熟,合作夥伴和開發者可以利用驍龍處理器即時利用 OpenAI 等領先企業的開源創新。 OpenAI 的 gpt-oss-20b 將使設備能夠利用設備端推理,在隱私和延遲方面帶來優勢,同時透過 AI 代理補充雲端解決方案。

    透過對 gpt-oss-20b 的搶先體驗以及與 Qualcomm AI Stack 的整合測試,我們親眼見證了該模型的卓越性能,它能夠完全在設備上進行複雜的推理。開發者將能夠透過 Hugging Face 和 Ollama 等熱門平台在搭載驍龍的裝置上存取該車型並充分發揮其功能。更多部署細節即將在 Qualcomm AI Hub 上發布。

    透過將 Ollama 輕量級的開源 LLM 服務框架與強大的驍龍平台結合,開發者和企業可以直接在搭載驍龍運算平台的裝置上執行 gpt-oss-20b,並執行網頁搜尋和其他一些預設的開箱即用功能。使用者還可以探索 Ollama 的 Turbo 模式,探索該模型的更多功能。

    在接下來的幾年裡,隨著行動記憶體佔用的不斷增長和軟體堆疊變得更加高效,我們相信設備上的人工智慧能力將迅速提升,為私人、低延遲、個性化的代理體驗打開大門。

    原文連結


    您需要登錄後才可以回帖 登錄 | 註冊 |

    本版積分規則

    小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

    GMT+8, 2025-12-25 00:59 , Processed in 0.282998 second(s), 56 queries .

    專業網站主機規劃 威利 100HUB.COM

    © 2001-2018

    快速回復 返回頂部 返回列表