【生活中心/綜合報導】人工智慧新創公司OpenAI今天推出能夠解決複雜推理的新版ChatGPT,定名OpenAI o1。這款模型能以人類思考方式回答問題,專門應對數學和科學這類需要邏輯推理的任務。
OpenAI指出,OpenAI o1能正確解答83%的國際數學奧林匹亞競賽題目,相較之下,今年5月上線的GPT-4o僅能正確解答13%的題目。不過,GPT-4o在資訊檢索方面表現更為出色;OpenAI o1則是專門應對需要邏輯推理的任務,且在回答問題前會花更多時間思考題目,「就像人類一樣」。
o1上線後,會在回答問題前,先仔細思考,而不是立即跑出答案。OpenAI員工以「系統1」和「系統2」思考,來區分o1系列與之前模型的區別,ChatGPT 已經從僅使用系統 1(快速、自動、直觀、易出錯),進化到可使用系統 2 思維(緩慢、深思熟慮、有意識、可靠)。
OpenAI首席科學家帕喬基(Jakub Pachocki)和技術研究人員席多(Szymon Sidor)示範用OpenAI o1技術解決一個「博士級」的化學問題並根據患者的症狀和病史詳細報告,診斷出疾病。
帕喬基表示:「使用ChatGPT早期模型時,你問它一個問題,它會立即開始回答。但推理模型(OpenAI o1)需要時間。它能夠用英文思考問題,嘗試將問題拆解並尋找解決角度,努力提供最佳解答」。
OpenAI執行長山姆·阿特曼 (Sam Altman)透露,OpenAI o1在2024國際資訊奧林匹亞競賽(IOI)中,在每題嘗試50次條件下取得了213分,屬於選手中前49%的成績。「如果允許它每道題嘗試1萬次,就能獲得362.14分,是高於金牌選手門檻,可獲得金牌。」
目前Google和Meta等公司也在開發類似的推理技術;微軟(Microsoft)和其子公司GitHub,正致力將OpenAI的新系統整合到產品中。
這次發佈的o1系列分為三個型號:o1,新的大模型天花板,過於強大,目前不方便對外公開;o1-preiview,o1的早期版本,可以立即提供給ChatGPT付費用戶和API用戶;o1-mini,速度更快、性價比更高,適用於需要推理和無需廣泛世界知識的任務。
ChatGPT Plus和ChatGPT Teams的用戶,即日起可以使用OpenAI o1preview和o1-mini。
We’re releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.
These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu
— OpenAI (@OpenAI) September 12, 2024