阿里推新模型Qwen 3 聲稱性能與DeepSeek-R1極具競爭力

阿里推新模型Qwen 3 聲稱性能與DeepSeek-R1極具競爭力
產經
2025-04-29 09:48

關稅戰丨特朗普執政百日將降低汽車關稅減輕對業界衝擊

阿里發布開源大模型Qwen 3。資料圖

【橙訊】阿里巴巴(09988)今日(29日)發布開源大型語言模型「通義千問」Qwen 3，聲稱在代碼、數學、通用能力等基準測試中，與DeepSeek-R1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級模型相比極具競爭力，並支持119種語言和方言。阿里股價現報114.3元，跌0.78%。

通義千問指出，Qwen 3代表團隊在通往通用人工智能(AGI)和超級人工智能(ASI)旅程中的一個重要里程碑。通過擴大預訓練和強化學習的規模，實現更高層次的智能。團隊無縫集成思考模式與非思考模式，為用戶提供靈活控制思考預算的能力。此外，團隊還擴展了對多種語言的支持，幫助全球更多用戶。

展望未來，通義千問計劃從多個維度提升其模型，優化模型架構和訓練方法，以實現幾個關鍵目標，包括擴展數據規模、增加模型大小、延長上下文長度、拓寬模態範圍，並利用環境反饋推進強化學習以進行長周期推理。

通義千問認為，團隊正從專注於訓練模型的時代過渡到以訓練 Agent 為中心的時代，下一代迭代必將為工作和生活帶來有意義的進步。

責編 | 洛奇

編輯 | 草言