阿里推新AI模型「QwQ-32B」。
【橙訊】人工智能(AI)市場競爭激烈,一代勝過一代。阿里巴巴(09988)旗下通義千問Qwen團隊推出QwQ-32B大語言模型,其有320億參數量,性能卻媲美擁有6,710億參數的DeepSeek-R1(370億被激活),在一些測試中超越了對方。受消息影響,阿里股價升7.24%至139.3元。
內媒引述Qwen團隊指,QwQ-32B透過大規模強化學習(Reinforcement learning),在數學、代碼及通用能力上取得實現「質的飛躍」,整體性能表現比肩DeepSeek-R1,而且在維持強勁效能的同時,大幅降低部署使用成本,在消費級顯示卡上也能部署。
在測試數學能力的AIME24評測集上,以及在評估代碼能力的LiveCodeBench中,QwQ-32B表現與DeepSeek-R1相當。在Meta首席科學家楊立昆領銜的「最難LLMs評測榜」LiveBench上、在谷歌(Google)等提出的指令遵循能力IFEval評測集中,以及在加州大學伯克利分校等提出的評估準確調用函數或工具BFCL測試中,其得分同樣超越DeepSeek-R1。
圖:法新社
編輯推薦
證監會:去年港管理資產規模逾35萬億 淨資金流入增81%
機管局全年賺逾24億 10年來首次向政府派息13億
金發局:港能承受房地產借貸風險 不存在「大到不能倒」
黃仁勳唐裝出席鏈博會 為大熱天穿皮衣解畫:西裝沒來得及乾洗
貝森特籲勿憂中美關稅「休戰」期限 准復售H20晶片屬談判一部分
泡泡瑪特盈喜先「食餬」股價急回逾6% 大行仍唱好升目標價