阿里發布開源大模型Qwen 3。資料圖
【橙訊】阿里巴巴(09988)今日(29日)發布開源大型語言模型「通義千問」Qwen 3,聲稱在代碼、數學、通用能力等基準測試中,與DeepSeek-R1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級模型相比極具競爭力,並支持119種語言和方言。阿里股價現報114.3元,跌0.78%。
通義千問指出,Qwen 3代表團隊在通往通用人工智能(AGI)和超級人工智能(ASI)旅程中的一個重要里程碑。通過擴大預訓練和強化學習的規模,實現更高層次的智能。團隊無縫集成思考模式與非思考模式,為用戶提供靈活控制思考預算的能力。此外,團隊還擴展了對多種語言的支持,幫助全球更多用戶。
展望未來,通義千問計劃從多個維度提升其模型,優化模型架構和訓練方法,以實現幾個關鍵目標,包括擴展數據規模、增加模型大小、延長上下文長度、拓寬模態範圍,並利用環境反饋推進強化學習以進行長周期推理。
通義千問認為,團隊正從專注於訓練模型的時代過渡到以訓練 Agent 為中心的時代,下一代迭代必將為工作和生活帶來有意義的進步。
編輯推薦
大行點睇丨大摩料未來6至12月個月 更多資金流入中資股
陳茂波:從三方面推進人幣國際化 加快人幣櫃台納入港股通
薩默斯批美稅改方案 將無力承擔巨額債務危及強國地位
關稅影響丨寶潔擬兩年裁7000人 擬剝離部分資產
宏利將11月遷冊來港 稱對國際金融中心地位信心堅定
人事變動丨杜嘉祺9月底退任滙控主席 回巢友邦