OpenAI發布新模型「o1」 具「推理」能力解決複雜難題

OpenAI發布新模型「o1」　具「推理」能力解決複雜難題
國際
2024-09-13 10:51

OpenAI發布OpenAI o1 預覽版。

【橙訊】OpenAI當地時間周四晚（12日）發布了OpenAI o1 預覽版，o為「Orion（獵戶座）」，這是一系列新的AI模型，是該公司首款具備「推理」能力的模型。據介紹，這些模型可以推理複雜的任務，並解決比以前的科學、編碼和數學模型更難的問題。

OpenAI 當天在其官網及X平台宣布推出OpenAI o1-preview 模型，即日起ChatGPTPlus和Team用戶就能夠直接訪問模型，企業和教育用戶將在下周初獲得訪問權限。OpenAI表示，計劃讓ChatGPT的所有免費用戶都能訪問o1-mini，但尚未確定發布日期。

發布文檔中這樣寫道，與以前的GPT-4o相比，o1在編寫代碼和解決多步驟問題方面做得更好。在國際數學奧林匹克 (IMO) 資格考試中，GPT-4o僅正確解決了13%的問題，而推理模型得分為 83%。他們的編碼能力在比賽中得到了評估，並在Codeforces 比賽中達到了第89個百分位。同時它的價格也更貴，回答問題的速度也更慢。此外，今次同時發布的還有更小、更便宜的版本o1-mini 。

OpenAI首席執行官山姆·奧特曼（Sam Altman）更是直接在X上貼出了o1與GPT-4o在數學、編程和解決博士級別科學題目上的能力對比圖。

OpenAI同時強調，o1作為早期模型，它還不具備 ChatGPT 的許多實用功能，例如瀏覽網頁獲取信息以及上傳文件和圖片。但對於複雜的推理任務來說，這是一個重大進步，代表了人工智能能力的新水平。o1模型的發布，是其邁向類人AI宏偉目標的關鍵一步。

OpenAI 的研究負責人傑里・特沃雷克（Jerry Tworek）介紹，o1 的訓練使用一種全新優化算法，還有一套專門為其訂製的新訓練數據集，它設置了獎勵和懲罰機制，通過強化學習的技術訓練模型自行解決問題，並且利用類似人類通過逐步解決問題方式的「思維鏈」處理問題。這種新的訓練方法，使得模型更加準確。特沃雷克補充說，註意到這個模型的幻覺更少了，但這個問題仍然存在。

圖：OpenAI官網、Ｘ平台

責編 | 海源

編輯 | 覃旖