OpenAI發布OpenAI o1 預覽版。

【橙訊】OpenAI當地時間周四晚(12日)發布了OpenAI o1 預覽版,o為「Orion(獵戶座)」,這是一系列新的AI模型,是該公司首款具備「推理」能力的模型。據介紹,這些模型可以推理複雜的任務,並解決比以前的科學、編碼和數學模型更難的問題。

OpenAI 當天在其官網及X平台宣布推出OpenAI o1-preview 模型,即日起ChatGPTPlus和Team用戶就能夠直接訪問模型,企業和教育用戶將在下周初獲得訪問權限。OpenAI表示,計劃讓ChatGPT的所有免費用戶都能訪問o1-mini,但尚未確定發布日期。

發布文檔中這樣寫道,與以前的GPT-4o相比,o1在編寫代碼和解決多步驟問題方面做得更好。在國際數學奧林匹克 (IMO) 資格考試中,GPT-4o僅正確解決了13%的問題,而推理模型得分為 83%。他們的編碼能力在比賽中得到了評估,並在Codeforces 比賽中達到了第89個百分位。同時它的價格也更貴,回答問題的速度也更慢。此外,今次同時發布的還有更小、更便宜的版本o1-mini 。

OpenAI首席執行官山姆·奧特曼(Sam Altman)更是直接在X上貼出了o1與GPT-4o在數學、編程和解決博士級別科學題目上的能力對比圖。

OpenAI同時強調,o1作為早期模型,它還不具備 ChatGPT 的許多實用功能,例如瀏覽網頁獲取信息以及上傳文件和圖片。但對於複雜的推理任務來說,這是一個重大進步,代表了人工智能能力的新水平。o1模型的發布,是其邁向類人AI宏偉目標的關鍵一步。

OpenAI 的研究負責人傑里・特沃雷克(Jerry Tworek)介紹,o1 的訓練使用一種全新優化算法,還有一套專門為其訂製的新訓練數據集,它設置了獎勵和懲罰機制,通過強化學習的技術訓練模型自行解決問題,並且利用類似人類通過逐步解決問題方式的「思維鏈」處理問題。這種新的訓練方法,使得模型更加準確。特沃雷克補充說,註意到這個模型的幻覺更少了,但這個問題仍然存在。

圖:OpenAI官網、X平台

責編 | 海源

編輯 | 覃旖

編輯推薦

伊朗局勢|機師:中東空域被封鎖嚴重影響航空業 部分航線如「隱形高速公路」

伊朗局勢|陳沛良:戰爭引起直接或間接損失保險均不受理 涉及戰爭行為已屬戰爭範圍

全國兩會|政府工作報告:堅持一個中國原則和 「九二共識」 推進祖國統一大業

全國兩會|政府工作報告:建設粵港澳大灣區國際科技創新中心 打造世界級科技創新策源地

全國兩會|政府工作報告極簡版來了!一文看完所有要點!

全國兩會|政府工作報告:安排2500億元國債支持消費品以舊換新 優化入境消費環境

有片 | 政府工作報告:堅定不移貫徹「一國兩制」「港人治港」方針 提升港澳依法治理效能