阿里推新AI模型「QwQ-32B」。

【橙訊】人工智能(AI)市場競爭激烈,一代勝過一代。阿里巴巴(09988)旗下通義千問Qwen團隊推出QwQ-32B大語言模型,其有320億參數量,性能卻媲美擁有6,710億參數的DeepSeek-R1(370億被激活),在一些測試中超越了對方。受消息影響,阿里股價升7.24%至139.3元。

內媒引述Qwen團隊指,QwQ-32B透過大規模強化學習(Reinforcement learning),在數學、代碼及通用能力上取得實現「質的飛躍」,整體性能表現比肩DeepSeek-R1,而且在維持強勁效能的同時,大幅降低部署使用成本,在消費級顯示卡上也能部署。

在測試數學能力的AIME24評測集上,以及在評估代碼能力的LiveCodeBench中,QwQ-32B表現與DeepSeek-R1相當。在Meta首席科學家楊立昆領銜的「最難LLMs評測榜」LiveBench上、在谷歌(Google)等提出的指令遵循能力IFEval評測集中,以及在加州大學伯克利分校等提出的評估準確調用函數或工具BFCL測試中,其得分同樣超越DeepSeek-R1。

圖:法新社

責編 | 洛奇

編輯 | 日熙

編輯推薦

QS最佳留學城市排名榜出爐 香港升至全球17位重返20強

DSE放榜︱蔡若蓮喜見狀元數目創歷屆新高 勉勵應屆考生未來都是一片廣闊天地

關稅影響丨美上月通脹率升至2.7% 特朗普再促聯儲局立即減息

DSE放榜︱終極狀元王海博擬留港讀醫服務社會 學習貼士:設定「工作量限制」

金局管再接148億港元沽盤 銀行結餘明跛千億關口

關稅戰|特朗普:美國對印尼徵收19%關稅 印尼對美國免稅

DSE放榜|誕16位狀元歷屆最多 8科5**「終極狀元」來自香港中國婦女會中學