
OpenAI發布OpenAI o1 預覽版。
【橙訊】OpenAI當地時間周四晚(12日)發布了OpenAI o1 預覽版,o為「Orion(獵戶座)」,這是一系列新的AI模型,是該公司首款具備「推理」能力的模型。據介紹,這些模型可以推理複雜的任務,並解決比以前的科學、編碼和數學模型更難的問題。
OpenAI 當天在其官網及X平台宣布推出OpenAI o1-preview 模型,即日起ChatGPTPlus和Team用戶就能夠直接訪問模型,企業和教育用戶將在下周初獲得訪問權限。OpenAI表示,計劃讓ChatGPT的所有免費用戶都能訪問o1-mini,但尚未確定發布日期。

發布文檔中這樣寫道,與以前的GPT-4o相比,o1在編寫代碼和解決多步驟問題方面做得更好。在國際數學奧林匹克 (IMO) 資格考試中,GPT-4o僅正確解決了13%的問題,而推理模型得分為 83%。他們的編碼能力在比賽中得到了評估,並在Codeforces 比賽中達到了第89個百分位。同時它的價格也更貴,回答問題的速度也更慢。此外,今次同時發布的還有更小、更便宜的版本o1-mini 。
OpenAI首席執行官山姆·奧特曼(Sam Altman)更是直接在X上貼出了o1與GPT-4o在數學、編程和解決博士級別科學題目上的能力對比圖。

OpenAI同時強調,o1作為早期模型,它還不具備 ChatGPT 的許多實用功能,例如瀏覽網頁獲取信息以及上傳文件和圖片。但對於複雜的推理任務來說,這是一個重大進步,代表了人工智能能力的新水平。o1模型的發布,是其邁向類人AI宏偉目標的關鍵一步。
OpenAI 的研究負責人傑里・特沃雷克(Jerry Tworek)介紹,o1 的訓練使用一種全新優化算法,還有一套專門為其訂製的新訓練數據集,它設置了獎勵和懲罰機制,通過強化學習的技術訓練模型自行解決問題,並且利用類似人類通過逐步解決問題方式的「思維鏈」處理問題。這種新的訓練方法,使得模型更加準確。特沃雷克補充說,註意到這個模型的幻覺更少了,但這個問題仍然存在。
圖:OpenAI官網、X平台
編輯推薦
伊朗局勢|卡塔爾國防部:美軍駐卡烏代德空軍基地遭無人機襲擊
伊朗局勢|以軍稱行動進入「下一階段」 伊朗態度強硬拒絕談判
伊朗局勢|也門胡塞武裝稱「全面支持」伊朗 已準備好隨時參戰
伊朗局勢|外交部副部長苗得雨赴伊朗駐華使館 弔唁伊朗最高領袖哈梅內伊
特朗普要求以總統立即赦免以總理 盼內塔尼亞胡「專注於戰爭」
斷交數年後 美國與委內瑞拉宣布正式恢復外交和領事關係